特斯拉创始人埃隆·马斯克的人工智能公司xAI,在万众瞩目中推出了其最新力作——Grok 4大模型。这款模型的问世,标志着马斯克在人工智能领域的又一重大突破。
7月10日,xAI通过一场近一个小时的线上发布会,向全球观众展示了Grok 4系列的两款力作:Grok 4(单智能体版)与Grok 4 Heavy(多智能体版)。其中,Grok 4 Heavy以其支持4个智能体并行思考的特性,能够在推理过程中实现横向比对与纵向协同,调用更强大的计算资源,以应对更为复杂精细的任务。
作为xAI自2023年推出首代大模型以来的第四次重要迭代,Grok 4在“人类的最后考试”(Humanity's Last Exam)这一极具挑战性的测试中,取得了25.4%的准确率,力压谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%,一举夺得“世界最强AI模型”的称号。这项测试涵盖了数学、自然科学、工程及所有人文学科,共计2500个问题,难度直逼博士乃至高级研究水平。
据xAI研究人员透露,Grok 4在这些问题上均表现出色。马斯克在直播中自豪地表示:“Grok 4在所有学科上的表现都超越了博士水平——无一例外。”他还透露,尽管目前Grok 4尚未实现新科学或物理定律的发现,但这只是时间问题,他坚信Grok 4将在年内迎来科学新发现。
在发布会中,xAI还披露了Grok 4在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项测评中的卓越表现,均超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。这一连串的佳绩,无疑为Grok 4的“世界最强”称号增添了更多分量。
业内人士指出,从Grok 2到Grok 3,再到如今的Grok 4,xAI的训练计算量实现了惊人的百倍增长。Grok 4的训练是在一个拥有超过20万张H100 GPU的超级计算机集群上完成的,这一规模较Grok 3时期翻了一番。更重要的是,xAI调整了训练策略,将更多算力投入到“推理能力”的专项训练中,使得Grok 4的训练量较Grok 2提升了整整100倍。
为了支撑这一庞大的算力需求,马斯克不惜重金打造超级计算机集群。2024年6月,xAI宣布在美国田纳西州孟菲斯建造这一超级计算机,初期即配备20万个英伟达GPU,并计划最终将规模扩大至100万个。据悉,该项目已投入数亿美元,未来仍需持续投入大量资金。
就在Grok 4发布前一周,xAI刚刚完成了100亿美元的融资,包括50亿美元债务融资和50亿美元股权融资。摩根士丹利在此次融资中担任了50亿美元债务融资的顾问,并表示该融资获得了超额认购,吸引了众多全球债务投资者的参与。然而,高昂的算力支出也让xAI承受着巨大的成本压力,据外媒报道,xAI目前每月的支出高达10亿美元,远超过其收入增长。
尽管如此,马斯克对于人工智能领域的投入并未减少。他认为,这类巨额亏损在整个人工智能行业并不罕见,主要源于高昂的服务器建设和芯片采购成本。在AI大模型的竞赛中,融资与技术研发如同鸟之双翼,缺一不可。只有充足的资金储备才能支撑高成本的技术研发,而只有技术的持续突破才能为进一步的融资奠定基础。
在Grok 4发布之际,OpenAI也透露了可能在今年夏天发布GPT-5的消息。这无疑为人工智能领域的竞争增添了更多看点。尽管Grok 4已取得了显著成就,但追逐通用人工智能(AGI)的道路依然漫长。在马斯克庆祝Grok 4取得的卓越成绩时,下一个“最强AI模型”或许已经在路上。