近日,科技界传来重磅消息,埃隆·马斯克的人工智能初创企业xAI正紧锣密鼓地筹备其强大AI模型的发布,并加速基础设施建设。xAI的雄心壮志在一次直播活动中得到了展现。
周一,马斯克携xAI团队通过直播向全球展示了他们的最新成果——Grok 3,这一模型被誉为“地球上最聪明的AI”。Grok 3是在xAI位于田纳西州孟菲斯的超级计算机Colossus上训练的,该超级计算机配备了约20万台图形处理单元(GPU)。据悉,xAI用了122天时间让Colossus的前10万台GPU投入运行,随后又在短短92天内将Colossus的规模扩大了一倍,达到20万台GPU。
Grok 3无疑从Colossus的惊人规模扩张中受益匪浅。xAI在今年1月初就完成了Grok 3的预训练,该模型的计算能力比其前身Grok 2提高了约10倍。马斯克表示,Grok 3的能力比Grok 2高出一个数量级,并强调该模型正在不断进化,每天都有新的改进推出。“你可以在24小时内就看到更新。”他说。
此前,Grok 2模型使用了2400亿个参数,性能与GPT-4相当。而现在,有了Grok 3,马斯克信心满满地表示:“我们拥有一支极其出色的工程团队,并且能够获取所有最好的AI资源。我们现在所需要的就是一个来自大型集群的智能系统。我们已经能够重启xAI的整个进程,确定训练一个能够压缩整个互联网的大型语言模型需要多少GPU。”
随着Colossus的壮大,xAI似乎也在加速该项目的扩张。据报道,这家AI初创企业正在与戴尔科技洽谈一项超过5亿美元的AI服务器采购协议。据彭博社援引知情人士透露,双方已进入深入谈判阶段。如果交易达成,戴尔将在今年内交付配备英伟达GB200 GPU的服务器。不过,报道也指出,部分细节仍在商讨中。
这笔高达5亿美元的潜在交易凸显了训练和运行AI模型需求的激增。该交易规模几乎相当于戴尔AI服务器季度销售额的两倍。在截至2024年11月1日的第三财季,戴尔服务器和网络业务的销售额激增58%,达到74亿美元,其中服务器销售额为29亿美元。
马斯克的AI征程始于2023年7月创立的xAI,他从OpenAI、DeepMind等AI研究领军企业中吸引了大量人才。马斯克的目标是打造一家能够直接挑战OpenAI在该领域主导地位的公司。去年6月,xAI宣布孟菲斯的超级计算机已经建成并投入运行,使用了来自戴尔和Super Micro的服务器。