马斯克旗下的人工智能公司xAI近日震撼发布了其最新一代AI模型——Grok 4,这一发布在科技界掀起了轩然大波。
在发布直播活动中,马斯克亲自站台,宣称Grok 4已超越了“博士级通才”的范畴,它是目前唯一在所有学科同时达到博士后水平的存在。马斯克还表示,他对Grok 4在今年内实现科学新突破性发现充满信心。
据悉,Grok 4在“人类最后测试(HLE)”中表现卓越,霸榜第一。该测试涵盖了100个学科,包含2500道博士级试题,Grok 4的高分表现意味着它在复杂知识体系和深度思考能力上取得了显著突破。目前,Grok 4已向X Premium+订阅者开放。
关于费用方面,xAI提供了两个版本的Grok 4。普通版订阅费为每月30美元,而更强大的Grok 4 Heavy版本则高达每月300美元。换算成年费,最强版本的Grok 4超过2万元人民币。然而,从其在HLE测试中的表现来看,44.4%的高分远超此前排名第一的Gemini 2.5 Pro(26.9%),似乎证明了其高昂费用的合理性。
xAI强调,Grok 4的出现将彻底改变人们对大模型的刻板印象。它不再仅仅是知识的复读机,而是能够通过自主深度思考解决现实复杂问题,甚至重写人类知识库。在直播中,xAI团队展示了Grok 4在“黑洞碰撞模拟计算”和“世界赛预测胜率”等任务中的出色表现,充分展示了其强大的数据分析和推理能力。
从技术层面来看,Grok 4的计算训练量相较于Grok 2提升了100倍,这得益于数据筛选和算法优化的突破。同时,在全球最顶级的超算集群Colossus的加持下,以及强化学习(RL)投入的增加,Grok 4的推理能力相较于前代再提升了10倍。Grok 4在语音能力上也有所加强,速度提升了2倍,并支持唱歌和低语模式,为用户带来了更加丰富的交互体验。
在各大基准测试中,Grok 4同样表现出色。除了HLE测试外,它还在HMMT(哈佛-麻省理工数学竞赛)、USAMO(美国数学奥林匹克竞赛)、GPQA(博士级基准测试)等高质量测试中包揽第一位置。特别是在AIME25(美国数学邀请赛)中,Grok 4 Heavy取得了满分成绩。在被誉为“AGI试金石”的ARC-AGI基准测试中,Grok 4也达到了顶尖水准。
Grok 4的发布不仅引发了科技界的广泛关注,也让众多网友对通用人工智能(AGI)的到来充满了期待。xAI还透露了未来的产品计划,包括8月上线编程模型、9月上线多模型智能体以及10月发布视频生成模型等,这将进一步推动AI技术的发展和应用。