滚动资讯

当前位置：财经 > 信息流 > 正文内容

Grok 4跑分曝光，马斯克新宠在“人类最后考试”中斩获45%高分！

时间：2025-07-05 15:38:51 来源：新智元编辑：快讯团队 IP：北京 发表评论无障碍通道

近日，AI领域迎来了一则震撼人心的消息：Grok 4的跑分数据在“人类最后考试”（Human Last Exam，简称HLE）中意外泄露，显示其得分高达45%，这一成绩远超当前顶尖的Gemini与Claude模型，预示着LLM（大型语言模型）格局或将迎来重大变革。

据多方消息透露，特斯拉CEO埃隆·马斯克对Grok 4寄予厚望，称该模型采用了“第一性原理”构建推理机制，有望引领AI技术的新一轮飞跃。马斯克在之前的采访和公开场合曾多次提及Grok项目的进展，并表示团队正紧锣密鼓地筹备Grok 4的发布。

此次泄露的跑分数据不仅涵盖了Grok 4在HLE上的惊人表现，还包括了其在GPQA（研究生级物理和天文学问题）、AIME 25（2025美国数学邀请赛）以及SWE-bench（真实软件工程问题）等多个关键基准评测上的卓越成绩。Grok 4在GPQA上的得分接近88%，在AIME 25上更是高达95%，而在SWE-bench评测中，专为编程设计的Grok 4 Code也展现出了强劲实力，得分位于72%至75%之间。

HLE作为专为挫败LLM而设计的残酷考试，包含了横跨100多个学科的2500道专家级试题，其中不乏多模态题型和多项选择题，且设有防记忆陷阱和隐藏测试集，以防止“作弊式训练”。然而，Grok 4却在这一考试中取得了默认35%、最高45%的惊人高分，这一成绩几乎是现任老大Gemini 2.5 Pro的两倍，相较于Claude 4 Opus更是翻了四倍有余。

面对如此强劲的表现，网友们纷纷在线催更，期待能够早日见证Grok 4的正式发布。不过，也有部分网友对此持怀疑态度，联想到此前Llama 4因提前进行“针对性训练”而翻车的事件，担心Grok 4的成绩是否也存在类似问题。对此，AI圈知名大佬Tibor Blaho已对泄露的数据进行了确认，为Grok 4的真实性提供了有力背书。

马斯克在之前的采访中曾透露，Grok 3.5（即如今的Grok 4）正尝试从第一性原理出发进行推理，将物理学的方法应用到思维过程中。这一理念在即将发布的Grok 4中得到了充分体现，使得该模型在自然语言、数学及推理领域展现出了无与伦比的性能。专为编程设计的Grok 4 Code也成为了此次发布的重头戏之一，备受开发者们的期待。

随着Grok 4发布日期的临近，AI领域或将迎来一场前所未有的技术革命。Grok 4的卓越表现不仅将推动LLM技术的发展迈向新高度，还将为开发者们提供更加智能、高效的编程助手和工具。让我们共同期待Grok 4的正式发布吧！

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

芯片股风云再起！寒武纪市值飙升，科创芯片50ETF连续吸金是何信号？

08-20

A股3700点之后，为何红利策略仍是稳健投资的首选？

08-20

红熊AI Pre-A轮融资成功，布局AI客服与记忆科学，企服市场迎新力量

08-20

QFII抢滩A股，中小市值成长股成新宠，科技消费等板块受青睐

08-20

激光通信新星崛起！聿凡领光完成数千万元Pre-A轮融资加速扩产

08-20

加州司机集体起诉特斯拉，马斯克被指八年夸大自动驾驶技术

08-20

东风集团抛售东本发动机股权，加速新能源转型何时见成效？

08-20

AI概念股早盘下挫，相关ETF跌幅超2%，科技产业投资主线仍看AI？

08-20

潘多拉中国业务受挫，年内关店数量增至百家并启动裁员

08-20

毛晓彤陈晓“领证”传闻破灭，网友热议：这次辟谣为何如此之快？

8月19日，毛晓彤工作室的一则声明，瞬间引爆了网络，将此前甚嚣尘上的“毛晓彤陈晓领证”传闻彻底击碎。毛晓彤工作室的回应堪称“内娱辟谣范本”，但同时也引发了新的讨论。调侃方：“还没看到谣言，就先刷到辟谣，也…

08-20

马云六年后重返蚂蚁森林，共植希望与树比高，畅谈生态未来

8月19日，阿里巴巴创始人马云时隔六年再次前往荒漠地区，探访“蚂蚁森林”。 8月19日，@蚂蚁森林发布视频，森林摄像头拍到马云现身内蒙古科右中旗蚂蚁森林464号林，与众人打卡合影、和树比高、还跟种树人唠嗑。…

08-20

资本操控下的明星爆火与塌房：都是计划中的一步？

当维护一个明星的成本超过其未来收益，或者其存在阻碍了公司更新换代（如培养更听话、抽成更高的新人）时，一场“意外”的塌房或许就此策划上线。我们不得不承认，王晶捅破的这层窗户纸，揭示了娱乐圈光鲜背后的残酷游戏规…

08-20

男子海上漂流6日奇迹生还，皮包骨状态终获援手

08-20

王晶爆料：明星爆火背后，资本才是那只“看不见的手”？

1、导演王晶谈明星爆火：都是资本在背后做局，追星是很愚蠢的行为王晶还表示说追星是很愚蠢的行为，欣赏一个演员不需要花很多钱，像内地那些饭圈，追星都是花父母…王晶还表示说追星是很愚蠢的行为，欣赏一个演员不需要花…

08-20

罗永浩自述：儿时观念影响深，曾求助精神病医生

8月19日，在@罗永浩的十字路口分享的视频博客《罗永浩的十字路口》第一期（下）中，罗永浩在与理想汽车CEO@李想交流小时候的经历时提到：“我还觉得我长大的时候挺幸运的，我觉得你小时候的环境比我还要幸运。我…

08-20

点击查看更多 +

全站最新

马云六年后重返蚂蚁森林，共植希望与树比高，畅谈生态未来

资本操控下的明星爆火与塌房：都是计划中的一步？

男子海上漂流6日奇迹生还，皮包骨状态终获援手

罗永浩自述：儿时观念影响深，曾求助精神病医生

毛晓彤陈晓“恋情”传闻秒变辟谣，娱乐圈真假消息你怎么看？

宇树科技新款人形机器人预告：180cm身高，31自由度，芭蕾舞姿惊艳亮相！

热门内容

本栏最新

资本操控下的明星爆火与塌房：都是计划中的一步？

男子海上漂流6日奇迹生还，皮包骨状态终获援手

罗永浩自述：儿时观念影响深，曾求助精神病医生

毛晓彤陈晓“恋情”传闻秒变辟谣，娱乐圈真假消息你怎么看？

宇树科技新款人形机器人预告：180cm身高，31自由度，芭蕾舞姿惊艳亮相！

高铁孩童吵闹引纷争，家长反怼乘客：公共礼仪何在？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.