ITBear旗下自媒体矩阵:

马斯克Grok 3遭质疑:号称最聪明,却答错9.11与9.9大小

   时间:2025-02-19 15:59:18 来源:砍柴网作者:砍柴网编辑:快讯团队 发表评论无障碍通道

近期,科技界迎来了一场备受瞩目的盛事——马斯克携其xAI团队通过一场直播活动,正式揭晓了备受期待的Grok 3人工智能模型。在此之前,马斯克通过一系列预热宣传,已经将Grok 3的神秘面纱撩拨得令人心痒难耐,公众对其的期待值达到了前所未有的高度。

然而,在这场万众瞩目的发布会上,马斯克宣称Grok 3在数学、科学与编程领域的基准测试中超越了所有主流模型,甚至雄心勃勃地计划将其应用于SpaceX的火星任务计算,并预测未来三年内将带来诺贝尔奖级别的科学突破。这一系列豪言壮语,无疑将Grok 3推向了神坛。

遗憾的是,Grok 3的实际表现却与马斯克的豪言壮语大相径庭。发布后不久,一些媒体便对Grok 3的Beta版进行了测试,结果却令人大跌眼镜。面对一个经典的大模型刁难问题——“9.11与9.9哪个大?”,号称目前最聪明的Grok 3竟然无法给出正确答案,这一尴尬表现迅速在网络上引发了热议,网友戏称其为“天才不愿意回答简单问题”。

不仅如此,在xAI发布会直播中,当Grok 3被用于分析游戏《流放之路 2》的职业与升华效果时,其表现同样令人失望。Grok 3给出了大量错误答案,而这些错误在直播中甚至没有被马斯克本人察觉。这一系列失误,无疑让Grok 3的声誉受到了严重质疑。

尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中的表现看似遥遥领先,但仔细分析后却发现,其与DeepSeek R1和GPT4.0的差距其实并不大,仅为1%到2%。这一数据无疑揭示了Grok 3在性能提升上的边际效应已经显现。

为了打造Grok 3,马斯克不惜投入巨资,使用了超过20万张H100芯片,总训练小时数更是达到了惊人的两亿小时。然而,与之相比,DeepSeek V3却仅使用了2000张H800芯片,训练时间也仅有两个月,但其性能却与Grok 3相差无几。这一对比,无疑让Grok 3的高昂投入显得有些得不偿失。

面对Grok 3的种种失误和质疑,马斯克并未选择逃避。他在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月内推出,并诚邀用户反馈使用问题。这一表态,虽然无法立即挽回Grok 3的声誉,但至少展现了马斯克面对失败的勇气和担当。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version