北京时间2月18日,科技界迎来了一场重量级发布,由马斯克领衔的xAI公司推出了其最新的旗舰人工智能模型——Grok-3系列,以及配套的聊天机器人Grok。尽管xAI在这场全球AI竞赛中属于后来者,但凭借其强大的团队背景和马斯克的个人影响力,此次发布依旧吸引了无数目光。
在发布会现场,xAI团队展示了Grok-3的卓越性能,从强大的数据集群到直接的评测数据对比,无一不彰显着这款“地表最强AI”的实力。马斯克甚至将之前的Grok-2形容为“玩具”,以此突出Grok-3的巨大进步。
马斯克和xAI发布最新旗舰模型
Grok-3的发布再次印证了马斯克的竞争哲学——以最快的速度推动创新。他利用巨大的算力资源(超过20万张GPU,是DeepSeek-V3的百倍以上)和精简的团队(xAI最初仅有12人),成功打造出了这款令人瞩目的AI产品。
在模型能力上,Grok-3在推理、数学、代码等多个领域都取得了新的突破。在AIME和GPQA等基准测试中,Grok-3的表现超越了多个竞争对手,包括o3 mini和DeepSeek-R1等。特别是在LMSYS大模型竞技场上,Grok-3的早期版本就取得了总分第一的好成绩,成为首个评分突破1400分的模型。
Grok-3位列LMSYS第一
在发布会上,xAI团队还现场演示了Grok-3的推理和创意编程能力。例如,它能够生成一段从地球发射、着陆火星再返回地球的3D动画代码,还能玩起升级版的俄罗斯方块小游戏,展现出强大的创造力和实用性。
Grok-3在AIME 2025最新的数学基准测试的表现
马斯克还透露了Grok未来的发展方向。他表示,Grok将集成语音交互、多模态交互等新功能,并成立一个AI游戏社区。同时,xAI还将推出会员服务“SuperGrok”,为用户提供更高级的功能和体验。不过,Grok-3并不会立即向所有用户开放,而是会首先向X的Premium+订阅用户解锁。
会员服务“SuperGrok”
作为后发者,xAI能够在短时间内推出如此强大的AI模型,无疑再次证明了马斯克“大力出奇迹”的策略的有效性。然而,评估一个AI模型的真正实力,还需要看其在实际应用中的表现。未来,xAI能否凭借Grok在AI领域站稳脚跟,我们拭目以待。