马斯克旗下xAI公司正式宣布,全球首个吉瓦级AI训练集群Colossus 2投入运行。这座位于孟菲斯的超级计算中心配备55万块GPU,初期算力突破1吉瓦(GW),相当于一座大型核电站的输出功率。项目团队仅用122天便完成从零到全面部署的壮举,刷新了全球超算建设速度纪录。
该集群采用全液冷设计方案,部署了119台风冷冷水机组,冷却能力达200兆瓦(MW)。现场照片显示,部分机架早在7月份就已安装完毕。英伟达CEO黄仁勋曾公开称赞这一建设速度,指出xAI用6个月完成了甲骨文和OpenAI需要15个月才能实现的目标。项目造价高达数百亿美元,目前主要依赖母公司X提供资金支持,但马斯克与中东主权基金的密切关系为后续融资留下想象空间。
Colossus 2的算力规模达到140万块H100 GPU的等效水平,预计今年4月将升级至1.5GW,年底前冲击2GW总容量。这座超级计算中心已启动下一代大模型Grok 5的训练工作,该模型参数规模达6万亿,具备原生视频理解能力。马斯克在社交平台透露,Grok 5有望在2025年上半年发布,xAI将借此冲击通用人工智能(AGI)领域。
全球科技巨头正展开前所未有的算力竞赛。OpenAI联合软银、甲骨文启动的"星际之门"计划,将在四年内投入5000亿美元建设10GW级超算集群。meta的普罗米修斯项目计划2026年上线1GW+集群,后续扩展至5GW规模,其Hyperion项目占地面积堪比曼哈顿部分区域。Anthropic则与谷歌云达成百亿美元协议,将TPU集群扩展至100万颗。
这场军备竞赛引发对能源供给的深层担忧。Colossus 2的用电量已超过旧金山全市峰值负荷,而meta计划在本十年内建设数十吉瓦级超算。据Dell’Oro集团分析,未来三年全球将新增数十GW的AI算力产能,相当于同时为数百万家庭供电。美国能源信息署数据显示,自2022年以来全美电价涨幅持续超过通胀率,新泽西州等地区电费账单上涨达20%。
数据中心建设热潮遭遇民间阻力。2025年第二季度,全美有980亿美元的AI算力项目因社区反对或电力供应问题受阻。密歇根州塞林市居民集会抗议70亿美元的"星际之门"数据中心,指出这类设施虽能创造税收,但24小时运转带来的噪音、水资源消耗和电力负荷已严重影响生活质量。电力专家警告,美国电网老化问题与数据中心激增形成双重压力,电力供应可能成为制约AI发展的关键瓶颈。








