在科技界的瞩目下,埃隆·马斯克的人工智能公司xAI于近日震撼发布了其最新一代AI模型——Grok 4。这款被誉为“地表最强AI模型”的新作,在发布直播中引发了广泛关注。
马斯克在直播中激情洋溢地介绍,Grok 4已经超越了“博士级通才”的范畴,它是唯一一个在所有学科领域同时达到博士后水平的存在。他坚信,这款AI模型将在今年内实现科学领域的新突破。
事实上,Grok 4早已在“人类最后测试(HLE)”中崭露头角,以霸榜第一的姿态证明了其强大的实力。目前,这款逆天模型已经向X Premium+订阅者开放。然而,其高昂的年费——超过2万元人民币,也让不少人对它的价值产生了好奇。
据xAI介绍,Grok 4系列模型分为两个版本,其中基础版的订阅费为每月30美元,而更强大的Grok 4 Heavy版本则需每月300美元。为了证明其价值,xAI展示了Grok 4 Heavy在HLE考试中的惊人表现,它以44.4%的高分远超此前排名第一的Gemini 2.5 Pro。
HLE测试涵盖了100个学科,包含2500道博士级试题,涉及数学、理论物理、语言学等多个领域。Grok 4的高分意味着它在复杂知识体系和深度思考能力上已实现了显著突破,成为了AI大模型能力的新标杆。
xAI强调,Grok 4的出现将彻底改变“大模型只是知识复读机”的刻板印象。它的目标是实现能力的质变,超越人类专家水平,通过自主深度思考解决现实复杂问题,从而重写人类知识库。
在直播中,xAI团队通过“黑洞碰撞模拟计算”和“世界赛预测胜率”等例子,展示了Grok 4的强大能力。它几乎通过可视化完整呈现了两个黑洞的引力波模拟效果,这充分展示了Grok 4对多源数据的采集和分析能力,以及其在现实问题上的自我深度思考和推理能力。
从技术层面来看,Grok 4的计算训练量相较于Grok 2提升了100倍。在全球最顶尖的超算集群Colossus的加持下,再加上强化学习(RL)的投入增加,Grok 4的推理能力较前代再提升10倍。从Grok 2到Grok 4,采用的技术范式也有所不同,分别经历了token预测、预训练计算、预训练+RL,以及最终的RL计算阶段。
除了强大的推理能力,Grok 4在语音能力上也有所加强。相较于上一代,它的速度快了2倍,并支持唱歌和低语模式,这为重视交互性体验的用户带来了全新的感受。
在基准测试中,Grok 4同样表现出色。除了HLE测试外,它还在HMMT(哈佛-麻省理工数学竞赛)、USAMO(美国数学奥林匹克竞赛)、GPQA(博士级基准测试)等高质量测试中包揽第一位置。在AIME25(美国数学邀请赛)中,Grok 4更是取得了满分成绩。在被誉为“AGI试金石”的ARC-AGI基准测试中,Grok 4也达到了SOTA顶尖水准。
Grok 4的出色表现引发了网友们的热议,不少人直呼“AGI(通用人工智能)已来”。在发布会结尾,xAI还公开了Grok 4发布后的未来产品计划,包括8月上线的编程模型、9月上线的多模型智能体,以及10月晚些时候发布的视频生成模型,重点优化视觉能力。