在旧金山举行的首届 Cursor Compile 大会上,Cursor 宣布推出一款拥有超过 1.5 万亿参数的新模型,引发了人工智能领域的广泛关注。这款模型在超过 10 万块 GPU 上进行了预训练,规模与 Opus 和 GPT 系列相当,甚至更大。
Cursor 年仅 25 岁的 CEO Michael Truell 在会上表示,新模型的规模与 Opus 4.5 到 4.8 以及 GPT-5 到 GPT-5.5 相当,但这些知名模型的参数规模实际上都低于 2 万亿。他指出,以当前 GPT-5.5 和 Opus 4.8 的性能水平,开源模型完全有可能达到类似的效果。
Michael 认为,在现阶段,规模化扩展是唯一能够形成竞争优势的关键因素。他特别提到,Anthropic 是目前唯一成功将模型规模扩展至约 10 万亿参数的 AI 实验室。相比之下,OpenAI 要在年底前追上 Anthropic 的步伐将面临巨大挑战。
对于其他头部 AI 实验室,Michael 也发表了自己的看法。他认为 Google 的模型规模尚未达到同等水平,且在稀疏化路线上过于激进,后训练和强化学习能力尚未充分转化为稳定、实用的产品体验。OpenAI 则仍在消化 GPT-4.5 之后的路线调整压力,而 xAI 和 meta 仍在为下一阶段的大模型竞争做准备。
抛开外界的争议,Cursor 此次宣布的新模型计划确实值得关注。与过去不同,Cursor 不再满足于调用现成模型,而是开始系统性地训练自己的底座模型。Michael 在演讲中首次详细披露了这一计划。
这款新模型有三个显著特点。首先,它的规模是 Cursor 迄今为止训练过的最大的模型,已接近前沿大模型公司的水准。其次,它是从零开始训练的,而非基于开源模型进行微调。Michael 强调,尽管他们依然支持开源,但从零训练可以让团队更完整地控制模型行为,使其更贴合开发者的实际需求。最后,此次训练使用的算力规模比以往提升了 10 到 20 倍,为模型能力的提升提供了有力支持。
更重要的是,Cursor 的目标不仅仅是让 AI 具备代码生成能力,而是希望模型具备更通用的智能。Michael 表示,Cursor 的愿景是让任何人都能通过 AI 构建自己想要的东西,而不仅仅是写好代码。为此,新模型需要具备使用工程师常用工具、进行规划、测试软件、检查界面交互等能力,甚至能够清晰地向用户展示修改内容。
据悉,这款新模型的训练已经启动,预计将在未来几周内发布。Michael 透露,模型的训练得到了外部算力或基础设施的支持,外界普遍猜测这背后的支持者可能是 SpaceX。不过,真正的答案还需等待模型发布后才能揭晓。













