在北京时间的某个晴朗午后,科技界迎来了一则震撼人心的消息:马斯克麾下的AI创新企业xAI,正式揭晓了其倾力打造的最新一代人工智能大语言模型——Grok-3。这一发布,标志着人工智能领域又迈出了历史性的一步。
作为xAI的第三代力作,Grok-3在发布前便已被马斯克冠以“地球上最聪慧的人工智能”之美誉。在最新的基准测试中,Grok-3与DeepSeek-V3、GPT-4o、Gemini-2 Pro及Claude 3.5 Sonnet等业界翘楚同台竞技,展现出了压倒性的优势。xAI还同步推出了基于Grok-3的智能搜索引擎Deepsearch,进一步拓宽了其应用场景。
在基准测试中,Grok-3的表现尤为抢眼。无论是在数学能力、科学知识评估,还是在编程能力测试中,Grok-3均取得了令人瞩目的高分。具体而言,其数学能力测试得分52分,科学知识评估得分75分,编程能力测试得分57分,均远超竞争对手。这一连串的亮眼成绩,无疑为Grok-3赢得了业界的广泛认可。
尤为在最新公布的AIME 2025性能测试中,Grok-3 Reasoning Beta版本在推理和计算时间复合评分上更是斩获了93分的高分,遥遥领先于DeepSeek-R1的75分,以及OpenAI最新推出的推理模型o3 mini的87分。这一成绩,充分展示了Grok-3在复杂数学推理和计算效率方面的卓越能力。
尽管Grok-3的推理模型目前仍处于Beta测试阶段,且仍在持续训练中,但xAI团队对其未来充满信心。在发布会上,马斯克携手三位团队成员,详细介绍了Grok-3的特性和优势,并现场进行了演示。演示中,当被问及如何设计火星移民基地的能源系统时,Grok-3并未直接给出答案,而是采用了“思维链”技术,逐步分析问题、拆解任务,最终整合得出全面而详细的解决方案。这一过程,与人类思考和推理的方式极为相似,令人叹为观止。
Grok-3之所以能够取得如此显著的进步,离不开马斯克为训练AI集群而打造的超级计算集群Colossus。这个由10万块英伟达GPU组成的庞然大物,单日耗电量堪比一座小型核电站,为Grok-3的训练提供了强大的算力支持。据悉,Grok-3使用了10万个英伟达H100 GPU,提供了长达2亿个GPU小时的训练时间,比其前代Grok-2快了整整十倍。
然而,在Grok-3大放异彩的同时,马斯克与OpenAI之间的恩怨纠葛也再次浮出水面。近日,马斯克正式向加州联邦法院提交了974亿美元全现金收购OpenAI的意向书,但遭到了OpenAI首席执行官山姆·奥特曼的坚决拒绝。奥特曼在社交媒体上嘲讽道:“如果你愿意的话,我们可以用97.4亿美元收购推特(现在的X)。”这一事件,再次引发了业界对马斯克与OpenAI之间关系的广泛讨论。
尽管如此,OpenAI在商业化方面的探索并未因此受阻。2024年底,OpenAI发表声明称董事会正在评估其公司结构,未来将继续保持非营利性组织和营利性组织并存的状态。这也意味着,OpenAI的营利化转型即将完成,非营利组织将逐渐剥离。对此,马斯克律师致信加州和特拉华州总检察长,要求对OpenAI进行公开竞标,以确保非营利组织在剥离资产时获得公允补偿。