埃隆·马斯克旗下的AI公司xAI近日宣布,其最新研发的Grok 3模型已正式面世,这一成果被誉为“地球上最聪明的AI”。在2月17日的发布会上,马斯克亲自介绍了这一突破性的智能产品。
xAI在发布会上展示了Grok 3在多个领域的卓越表现。数据显示,Grok 3及其迷你版在数学、科学和编程基准测试中超越了GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等主流模型。具备推理功能的Grok-3 Reasoning Beta和Grok-3 mini Reasoning也超过了DeepSeek-R1和OpenAI的o3 mini等推理模型。
现场演示中,Grok 3展现了其强大的推理与编程能力。面对“生成3D动画代码,演示从地球发射、着陆火星并返回地球的过程”这一复杂任务,Grok 3在短暂思考后,便输出了可直接运行的Python代码,尽管动画的准确性尚待验证。
另一个引人注目的新功能是Grok 3的代理/智能体(Agent)能力,这一功能在DeepSearch搜索引擎中得到了体现。DeepSearch不仅能搜索网页和现有资料,还能推测用户意图,通过交叉对比不同信源,确保返回准确信息,甚至基于搜索资料给出推测性结论。
xAI表示,Grok 3将首先从X平台的Premium+订阅者开始推出,普通用户的开放时间尚未确定。马斯克补充说:“想要更完善的版本,可能需要等待一周,但每天都会有所改进。我们还在开发语音交互功能,这将是Grok 3的最佳体验之一。”
Grok 3的推出正值全球AI竞争白热化之际。马斯克曾预计Grok 3将在2024年底前上线,但最终推迟至今年。尽管面临技术团队规模较小等挑战,xAI仍凭借Colossus超级计算机,在短短八个月内完成了10万颗英伟达H100 GPU的部署,提供了超过2亿GPU小时的计算资源,是Grok 2的10倍。
在训练方法上,xAI采用了合成数据集、自我纠错机制和强化学习等策略,显著提升了Grok 3的能力。尽管在法律领域的理解能力有所提升,但在早期测试中,Grok 3在编写代码时仍暴露出细节上的不足。不过,这并未影响马斯克对Grok 3的信心。
随着Grok 3的发布,xAI也在加速资本布局,计划与红杉资本、Andreessen Horowitz和Valor Equity Partners等投资者进行100亿美元的融资谈判,使公司估值达到750亿美元。这笔资金将部分用于购买服务器,支持Grok模型的进一步开发。
Grok 3的推出标志着xAI在AI竞赛中的又一次重大尝试。面对来自OpenAI、Anthropic、meta和Google等公司的激烈竞争,马斯克寄希望于Grok 3能在AI市场上占据一席之地。然而,这并非易事,Grok 3仍需接受市场的进一步检验。