滚动资讯

当前位置：财经 > 财经人物 > 正文内容

实测Grok 3：速度超群，数学出众，逻辑思考却非最强？

时间：2025-02-23 15:48:09 来源：每日经济新闻编辑：快讯团队 IP：北京 发表评论无障碍通道

近日，科技界迎来了一次重大突破，人工智能初创企业xAI推出了其最新的Grok 3大模型，这一成果迅速引起了全球范围内的广泛关注。特斯拉CEO埃隆·马斯克更是亲自站台，称赞其为“地球上最聪明的人工智能”。

据官方公布的测试数据，Grok 3在多个基准测试中表现卓越，包括AIME（用于评估模型解决数学问题的能力）和GPQA（评估模型在博士级别物理学、生物学和化学问题上的表现）等，均超越了GPT-4o、Gemini-2 Pro、DeepSeek V3、Claude 3.5以及Sonnet等其他顶尖大模型。

在大型模型竞技场Chatbot Arena（LMSYS）的测试中，xAI的工程师透露，Grok 3的早期版本以140分的成绩夺得榜首，力压Gemini 2.0 Flash Thinking实验版、ChatGPT-4o最新版本以及近期备受瞩目的DeepSeek R1等竞争对手。

然而，尽管Grok 3收获了诸多赞誉，但部分用户在亲身体验后对其能力表示了质疑。他们认为，Grok 3的表现并未达到马斯克所宣称的高度。对此，OpenAI的应用研究主管Boris Power也表达了失望之情，他指出Grok团队在模型评估中存在作弊和欺骗的嫌疑，并强调o3-mini在各项评估中的表现均优于Grok 3。

为了验证Grok 3的真实水平，《每日经济新闻》记者进行了一系列测试。测试结果显示，Grok 3确实展现出了世界顶级模型的水准，但并未与其他模型拉开显著的差距。Grok 3的响应速度极快，这是其与其他模型相比的一大优势。

在基础问题的测试中，如“9.9和9.11谁大？”这样的问题，Grok 3轻松应对，毫无压力。然而，在逻辑思考和文字理解能力的测试中，Grok 3的表现则略显不足。例如，在面对包含逻辑陷阱和双关语的问题时，虽然Grok 3成功答对了部分问题，但在某些复杂情况下，其推理能力仍不及DeepSeek R1。

在数学能力的测试中，Grok 3展现出了其强大的实力。在一道复杂的台球局数计算问题中，Grok 3不仅得出了正确答案，而且其解题速度也远超其他模型。然而，在面对更高难度的群论问题时，虽然Grok 3答对了具体的数量，但在具体群的判断上仍出现了一个错误，这显示其在数学领域的优势并非绝对。

在编程能力的测试中，Grok 3同样展现出了不俗的实力。Kcores联合创始人karminski-牙医的测试结果显示，Grok 3在火星发射计划的代码模拟中表现优异，虽然在动画呈现上略有瑕疵，但其在轨道需求计算方面的表现却令人印象深刻。最终，Grok 3在编程能力测试中险胜OpenAI的o1模型。

综合所有测试结果来看，Grok 3无疑是一款世界顶尖的AI模型，其强大的计算能力和极快的响应速度令人印象深刻。然而，尽管马斯克对其赞誉有加，但实测结果显示，Grok 3并未像基准测试得分那样远远甩开其他对手。因此，关于Grok 3是否是世界上最“聪明”的模型，或许还需要更多的时间和实践来验证。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

光伏展火爆开启：技术路线激战正酣，“AI+能源”成新亮点

06-12

印尼加入！中国240小时过境免签国增至55国，出行更便捷啦！

06-12

华懋科技重大资产重组，收购富创优越进军算力制造，周四复牌在即！

06-12

保加利亚正式迈入欧元区，成为第21个成员！

06-12

鸿合科技筹划控制权变更，明日停牌引关注

06-12

亚太航司载客多赚钱少，国际航线恢复成盈利关键？

06-12

泰尔股份实控人邰正彪留置解除，变更为责令候查，公司运营正常

06-12

均瑶健康午后“地天板”涨停，A股新消费、创新药、稀土永磁概念齐发力？

06-12

*ST东晶控股股东变更，今日复牌！停牌前涨停，业绩如何逆转？

06-12

雷军宣布：小米YU7定价非23.59万，小米明确表态不参与价格战！

06-12

上市公司收入确认大调整，总额法转净额法致营收“缩水”现象频发

06-12

多只热门连板股突发风险提示，投资者需谨慎对待！

06-12

俄官员透露：俄乌第三轮谈判或于6月底在伊斯坦布尔进行

06-12

欧盟拟限中企医疗器械采购，商务部：坚决反对保护主义做法

06-12

多家企业6月3日晚间公告亮点：赛力斯新能源销量增，四维图新携手阿里云

06-12

点击查看更多 +

全站最新

欧盟夹击下寻出路，为何避中国而求他国？分裂风险隐现

人民币加速“走进”非洲，美元霸权面临挑战？鲍威尔承压

Stellantis上半年预计净亏损23亿欧元，美国关税成“拦路虎”？

中美贸易战下，巴西大豆成香饽饽，美国农场主愁云满面

Stellantis上半年预计净亏损26.8亿美元，关税成主要拖累因素

高盛报告：对冲基金上周猛烈抛售日本股票，市场何去何从？

热门内容

本栏最新

光伏展火爆开启：技术路线激战正酣，“AI+能源”成新亮点

印尼加入！中国240小时过境免签国增至55国，出行更便捷啦！

鸿合科技筹划控制权变更，明日停牌引关注

亚太航司载客多赚钱少，国际航线恢复成盈利关键？

均瑶健康午后“地天板”涨停，A股新消费、创新药、稀土永磁概念齐发力？

雷军宣布：小米YU7定价非23.59万，小米明确表态不参与价格战！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.