滚动资讯

当前位置：财经 > 信息流 > 正文内容

马斯克Grok-4刷新AI基准，超越博士生水平，AIME25满分引关注

时间：2025-07-10 17:02:28 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

全球科技界翘首以盼的时刻终于到来，埃隆·马斯克携其“世界最强”AI模型Grok 4震撼发布。在一场引人注目的直播活动中，Grok 4以其卓越表现，在人类智慧终极考验——“人类最后考试”上，首次突破了50%的准确率大关。

Grok 4的成功，很大程度上归功于其在训练过程中原生融合了工具使用的能力。这一创新策略使得Grok 4 Heavy版本在该基准测试中取得了44.4%的高分，相比之前的顶尖模型Gemini-2.5-Pro，提升幅度接近18个百分点。

更令人惊叹的是，当在测试阶段同时采用训练与工具融合策略时，Grok 4的准确率更是飙升至50.7%。马斯克形象地对比道，普通人类在这一测试中的得分通常仅为5%，凸显了Grok 4的非凡智能。

直播中，马斯克毫不吝啬地赞誉Grok 4：“它比所有领域的博士生都要聪明！”他进一步透露，Grok 4即便在不提前查看题目的情况下参加SAT考试，也能获得近乎完美的分数，而在GER考试中则几乎满分。

Grok 4的辉煌战绩不仅限于“人类最后考试”。在其他多个基准测试中，它也展现出了压倒性的优势，包括在GPQA（研究生水平问答）上获得88.9%的得分，AIME25（美国数学邀请赛）上满分通过，以及在LCB、HMMT25和USAMO25等数学和逻辑竞赛中均取得了显著成绩。

为了直观展示Grok 4的智能水平，直播中还安排了一场与ChatGPT的语音对话对比。结果显示，Grok 4的表现明显优于ChatGPT，进一步印证了其强大的推理和理解能力。

发布活动上，马斯克与斯坦福大学博士后、多伦多大学博士毕业的吴宇怀（Tony）Wu，以及多伦多大学本硕博连读、现任Hinton助理教授并荣获2023年斯隆奖的Jimmy Ba一同亮相。他们详细介绍了Grok 4的卓越性能和背后的技术创新。

据透露，Grok 4的训练量是Grok 2的100倍、Grok 3的10倍，其中在强化学习方面投入了大量计算资源，主要依托xAI建设的20万卡计算集群。Grok 4在后训练过程中原生融入了工具使用，通过多项结果对比证明了其高效性和实用性。

直播中，Grok 4展示了其在数学、推理、多模态理解等方面的强大能力，以及编程、药物发现等领域的广泛应用。特别是在游戏领域，Grok 4能够设计和构建视频游戏，包括资源获取和代码编写等，仅需4个小时就能完成一款第一人称射击游戏。

马斯克表示，真正意义上的AI视频游戏将在明年问世，他之前已成立工作室致力于此。同时，他还透露了Grok系列的未来规划，包括即将发布的编程模型、多模态Agent和视频生成模型等。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

Grok 4震撼登场！马斯克：唯一博士后级全学科AI模型诞生

如今的得分意味着Grok 4在复杂知识体系和深度思考能力上已实现明显突破，成为了AI大模型能力的新标杆。在直播中，xAI团队用“黑洞碰撞模拟计算”和“世界赛预测胜率”的问题举例，Grok 4 几乎通过可视化…

07-10

稀土龙头北方稀土上半年业绩暴增近20倍，股价涨停市值近千亿

07-10

券商股再度崛起，虚拟货币成幕后推手？牛市前兆？

07-10

中小市值策略热浪滚滚，百亿量化私募狂赚，但高估值下回撤风险几何？

07-10

氢能板块崛起！8.5万亿赛道迎多重利好，股价狂飙背后有何玄机？

07-10

高腾机电IPO前换帅，一季度业绩下滑，经营现金流告急！

07-10

券商领涨，大金融板块午后持续走强，牛市信号来了？

07-10

精准对接品类达人，抖音生活服务助力商家高效转化

07-10

极智嘉港股IPO大热，仓储机器人龙头成功登陆资本市场！

07-10

威海蓝创债券非市场化发行，公司及相关责任人遭警示函处罚

07-10

中证2000增强ETF成“指增王”，小盘股猎场显神威！

07-10

银行股领跑A股，哪些成长股逆势下跌却藏补涨机遇？

07-10

春熙坊新主人诞生！千轮竞价后，2.5亿成交，成都地标将何去何从？

07-10

植物医生4300家门店力挺，能否圆梦“单品牌店第一股”？

07-10

A股收盘亮点：沪指新高引领三大指数上扬，地产、硅能源板块大放异彩

07-10

点击查看更多 +

全站最新

高腾机电IPO前换帅，一季度业绩下滑，经营现金流告急！

券商领涨，大金融板块午后持续走强，牛市信号来了？

精准对接品类达人，抖音生活服务助力商家高效转化

极智嘉港股IPO大热，仓储机器人龙头成功登陆资本市场！

威海蓝创债券非市场化发行，公司及相关责任人遭警示函处罚

中证2000增强ETF成“指增王”，小盘股猎场显神威！

热门内容

本栏最新

Grok 4震撼登场！马斯克：唯一博士后级全学科AI模型诞生

高腾机电IPO前换帅，一季度业绩下滑，经营现金流告急！

券商领涨，大金融板块午后持续走强，牛市信号来了？

精准对接品类达人，抖音生活服务助力商家高效转化

极智嘉港股IPO大热，仓储机器人龙头成功登陆资本市场！

威海蓝创债券非市场化发行，公司及相关责任人遭警示函处罚

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.