马斯克的人工智能新创公司xAI近日震撼发布Grok 3大模型升级版,他亲自赞誉其为“地球智商巅峰的人工智能”。
据悉,Grok 3是在20万块英伟达高性能芯片的强大算力下训练而成,运算效能较上一代跃升十倍。在xAI的直播活动中,马斯克携手三位工程师现场演示,Grok 3在数学、科学及编程基准测试中,力压群雄,包括谷歌的Gemini、DeepSeek的V3模型、Anthropic的Claude及OpenAI的GPT-4。
马斯克透露,Grok 3的训练基于海量合成数据,通过不断校验数据以确保逻辑一致性,并能自主识别并剔除错误数据。从目前的测试结果来看,Grok 3在AIME'24数学能力、GPQA科学知识评估及LCB Oct-Feb编程能力测试中,均超越DeepSeek,具备“思维链”推理机制,能逐步拆解复杂任务,参数量高达万亿级别。
尽管Grok 3在复杂逻辑和推理任务中表现卓越,但其在数学和编程领域的高分并未与竞争对手拉开显著差距。DeepSeek则在中文理解和多模态交互方面展现稳定优势,已在多个实际应用场景中获验证。更令人瞩目的是,Grok 3的成本极其高昂,计算量是前代Grok 2的十倍,训练成本据传高达30亿美元,xAI旗下的超算中心算力已实现翻倍。
回顾去年4月,马斯克为打造顶尖AI,决定自建数据中心。在紧迫的时间线下,团队仅用122天便启动首批10万个GPU,而要实现理想中的AI则需将集群规模翻倍。发布会上透露,团队仅用92天便实现超算集群算力翻倍,GPU数量已达20万块。以英伟达H100为例,仅硬件采购成本便高达60亿美元,加上配套设备,总成本或达百亿美元量级。
相比之下,DeepSeek的训练成本仅为600万美元,远低于GPT-4的7800万美元。若DeepSeek在资金、人才和资源上持续增强,其综合能力有望与Grok 3比肩。Grok 3的发布,实际上凸显了DeepSeek的强大实力。马斯克通过巨额投资堆砌算力,但成果与OpenAI相差无几,而DeepSeek以低成本路线与之抗衡,展现出不凡实力。
这不仅是两种不同路线的较量,更是算力资源分配主导权的争夺。美国通过控制GPU芯片出口,精准调控全球AI生产力,将全球划分为三个算力等级圈。特朗普投资的“星际之门”计划,更是旨在将AI领先锁定在美国本土,吸引全球资金,绑定其他国家于美国的AI战车。而DeepSeek打破了这一主导,为其他国家提供了自主发展AI的希望,其以低成本实现OpenAI模型同等性能,降低了对美国高算力GPU芯片的依赖。