在科技界的万众瞩目下,xAI公司今日正式揭晓了其酝酿已久的下一代大型模型——Grok 4。这款模型的能力之强,远远超出了业界的预期,引发了广泛的讨论与惊叹。
发布会于北京时间中午12点准时开始,吸引了全球科技爱好者的关注。令人惊喜的是,特斯拉和SpaceX的创始人埃隆·马斯克亲自现身直播间,为Grok 4站台。他一开场便宣称:“这是世界上最好的AI,让我们来展示一下它的实力。”
马斯克透露,Grok 4在SAT考试(美国高考)中能够轻松获得满分,且无需事先查看题目。它在GRE考试中也能取得任何学科的接近满分成绩,这一表现超越了全球所有研究生的水平。而Grok 4最令人瞩目的特点,是其卓越的推理能力,已经实现了对人类推理水平的超越。
据马斯克介绍,Grok 4有望在今年内实现科学新发现。这一消息无疑为科技界注入了一剂强心针,让人们对AI的未来充满了期待。
Grok 4之所以能够实现如此惊人的表现,得益于其计算能力的增强以及强化学习的训练。与前代相比,Grok 4的推理能力提升了10倍。从Grok 2到Grok 4,采用的技术范式不断演进,分别为下一个token预测、预训练计算、预训练+RL、RL计算。其中,Grok 3首次在推理阶段引入了RL微调,带来了深度推理能力。而Grok 4的强化学习再度提升了10倍的计算量,使得其推理能力得到了显著提升。
Grok 4在调用工具能力方面的提升,也进一步放大了其智慧。这使得它能够在各类高难度的基准测试中,取得远超当前最先进模型(SOTA)的成绩。在HLE(Humanities Last Exam,人类最后考试)这一基准测试中,Grok 4的表现尤为抢眼。在使用工具的情况下,它的成绩远超其他SOTA模型,甚至逼近了人类水平的上限。
在直播中,xAI研究人员还展示了Grok 4在其他基准测试中的表现,包括GPQA(研究生级别的Google验证问答基准测试)、AIME25(美国数学竞赛邀请赛)、LCB(编程竞赛/在线算法竞赛)、HMMT25(高中生团队数学竞赛)和USAMO25(美国顶级高中生数学竞赛)。在这些测试中,Grok 4 Heavy均取得了最新的SOTA成绩,展现了其全面的实力。
马斯克在直播中多次强调,Grok 4现在已经在所有学科都达到了博士后水平,没有例外。他表示:“如果Grok在今年内没有发现实用的新科学技术,我会感觉很意外。”这一言论无疑为Grok 4的未来应用前景增添了更多的想象空间。