ITBear旗下自媒体矩阵:

马斯克Grok 3模型亮相,能否超越DeepSeek成AI新标杆?

   时间:2025-02-19 00:46:49 来源:差评XPIN作者:差评XPIN编辑:快讯团队 发表评论无障碍通道

在科技界的聚光灯下,AI领域的竞争再次被推向了新的高潮。就在近日,由科技巨头马斯克预告的“地球上最聪明的人工智能”——Grok 3,终于揭开神秘面纱,震撼登场。

发布会依旧延续了马斯克一贯的风格,虽然预告了十二点准时开始,但观众们还是耐心等待了近二十分钟。在这场长达一个小时的直播中,马斯克携手xAI天团(其中不乏华人面孔),全方位展示了Grok 3的强大实力。从纸面数据来看,它无疑超越了包括谷歌、OpenAI和DeepSeek在内的众多明星公司的招牌模型。

不仅如此,网络上还流传着一段由AI生成的奥特曼看到Grok 3发布后的视频,趣味横生,从侧面反映了公众对这款新AI模型的期待与好奇。

国内外关于Grok 3的报道铺天盖地,诸如“首个突破1400分(模型在Imarena.ai竞技场的得分)的模型”、“首个十万卡集群训练出来的模型”等头衔,让人不禁对其刮目相看。世超也观看了这场发布会,虽然不能说震撼到炸裂,但Grok 3确实再次延续了AI领域“大力出奇迹”的神话。

目前,Grok 3仅对部分X的Premium+会员开放。从发布会的内容来看,Grok 3的实力不容小觑。一开始,xAI就将Grok与GPT的模型迭代速度进行了对比,针对性十足。

在模型性能方面,Grok 3更是展现出了与其他模型一争高下的决心。此次发布的Grok 3实际上是一个模型家族,包括非推理模型和推理模型两种。非推理模型中的Grok 3和Grok 3 mini,在AIME ’24数学竞赛、GPQA(研究生水平科学知识问答能力的基准测试)和代码三项测试中,成绩遥遥领先其他模型。

而在Chatbot Arena的盲测中,Grok 3的早期版本“巧克力”更是以史无前例的1400分高居榜首,在整体风格控制、编码、数学和创意写作等多个方面均表现出色。

再来看Grok 3的推理模型。在当前的AI市场中,推理模型已成为各家竞争的焦点。Grok 3 Reasoning Beta和Grok 3 mini Reasoning也不负众望,展现出了强大的实力。虽然在某些测试中,如果不考虑加时赛(即给模型更多思考时间),Grok 3的推理模型与其他模型的差距并不明显,但一旦加上加时赛,其优势便立刻显现出来。

现场演示中,马斯克团队展示了Grok 3推理模型在2025年AIME数学竞赛上的测试结果,并生成了3D动画代码和游戏设计案例。这些演示不仅证明了Grok 3的强大实力,还让人联想到马斯克昨天宣布的xAI将成立AI游戏工作室的消息。如果Grok 3的游戏制作能力真的如此强大,那么它将对整个游戏圈产生深远影响。

马斯克还透露,Grok 3在未来的两到三年内可能参与到特斯拉的生产和火箭发射过程中。基于Grok 3构建的智能搜索引擎Deepsearch也备受瞩目,它能够浏览网页、验证信源并给出准确答案。

然而,尽管Grok 3看上去如此强大,但也有一些用户分享的实际测试案例与宣传不符。一些测试显示,在某些情况下,o3 mini的表现甚至优于Grok 3。同时,也有网友指出了发布会演示案例中的明显错误。

尽管存在这些争议,但不可否认的是,Grok 3的发布再次证明了算力在AI领域的重要性。马斯克团队在短短不到一年的时间里,通过搭建10万卡乃至20万卡的集群,成功训练出了这款强大的AI模型。Grok 3的出现无疑为AI领域带来了新的挑战和机遇。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version