在万众瞩目中,马斯克携其最新力作Grok 3震撼登场,这款产品的预告以“聪明得可怕”一词迅速在网络上发酵,引发了全球范围内的热烈讨论与期待。
发布会前夕,App Store悄然更新了Grok应用,而发布会进行中,Grok的网页版更是因访问量激增而一度陷入瘫痪,这无疑为即将揭晓的新品增添了几分神秘色彩。
Grok 3的问世,绝非一次简单的产品迭代。马斯克为此投入巨资,建设了数据中心,配备了顶级的显卡配置,并采用最优的预训练模型,结合强化学习进行训练,堪称是“富养”出来的新一代AI产品。
此次发布会亮点频出:美区账号已率先更新,英区及欧洲地区将于2月28日推出;同时,Grok推出了名为SuperGrok的高级订阅计划,月费30美元,年费300美元,提供额外的推理功能和DeepSearch查询服务,以及无限量的图像生成服务。据称,Grok 3的推理能力已超越DeepSeek R1,在LMSYS盲测中,Grok 3在代码、指令响应等多个方面均拔得头筹。
作为20万张显卡的结晶,Grok 3的卓越表现再次印证了Scaling Law的有效性。与DeepSeek的低成本高效益策略不同,Grok 3走的是“大力出奇迹”的路线。
Grok 3的推理能力有了质的飞跃,这得益于其更灵活的实时计算资源分配机制,能够在保证推理质量的同时,最大化地利用计算资源。Grok 2的推理能力曾达到当时的SOTA水平,而经过多次迭代后,Grok 3的泛化能力更是大幅提升,并在最新的AIME竞赛中刷新了记录。
在发布会上,工程团队展示了Grok 3的两大应用场景:一是生成一个从地球发射至火星并返回的3D动画代码,Grok 3仅用了19秒便详细描述了其思考过程;二是尝试将《俄罗斯方块》与《宝石迷阵》结合,创造新游戏,尽管在初次尝试中遇到了些许波折,但后续演示中,Grok 3还是展现出了其强大的实力。
而此次更新的重头戏,无疑是Grok 3加持的DeepSearch功能,它被誉为下一代搜索引擎。DeepSearch能够像agent一样自主运作,理解用户提问背后的意图,极大地节省了用户在传统搜索引擎上花费的时间。在发布会现场,工程师向Grok 3提出了一个极具挑战性的任务:预测NCAA“疯狂三月”的所有比赛结果。Grok 3不仅给出了详尽的答案,还通过设计子任务面板,让用户能够实时监测任务进度,确保答案的可靠性和可用性。
关于Grok 3的体验方式,官方表示,X的Premium+订阅用户将率先体验,而其他高级功能则被纳入xAI推出的新计划——SuperGrok中。马斯克还透露,Grok的语音模式将在未来一周内推出,这将是Grok最好的体验之一。在发布会尾声,语音模型展示了一段男声,虽然只是简短的路透,但已足以激起人们对语音模式的无限期待。
在发布会后的问答环节中,马斯克回答了观众关于Grok语音模式、API推出时间、Grok能否记住互动谈话内容、是否开源Grok模型等问题的提问。他透露,Grok将理解人类所说的话,语音模式的早期版本将在一周内发布,并会迅速进行迭代更新;Grok API将在接下来的几周内推出,包含推理模型和深度研究功能;关于是否开源Grok模型,马斯克表示,当Grok 3成熟稳定后,大概几个月将会开源Grok 2。