在近日举办的Google Cloud Next大会上,谷歌正式揭晓了其第七代TPU芯片——Ironwood,这款芯片的亮相不仅彰显了谷歌在人工智能算力领域的雄心,更对当前高端AI芯片市场的格局带来了新的变数。英伟达长期占据的霸主地位,如今正面临来自谷歌的严峻挑战。那么,Ironwood究竟有何过人之处,它又将如何重塑AI芯片市场的未来?
Ironwood芯片在性能上展现出了惊人的实力。据官方公布的数据,其单芯片峰值算力高达4614 TFLOPs,并配备了192GB的高带宽内存,这一表现与英伟达的Blackwell B200不相上下。然而,谷歌的真正优势在于其强大的规模化能力。与英伟达NVL72机架系统连接72个Blackwell加速器相比,谷歌的Ironwood Pod能够连接多达9216个芯片,规模是前者的128倍。这一超大规模的连接能力,使得谷歌能够构建出总算力高达42.5 Exaflops的计算域,这一数字远超当前全球最强的超算El Capitan。
谷歌之所以能够实现如此超大规模的算力,关键在于其独特的架构设计。Ironwood采用了3D环面拓扑结构和光路交换技术(OCS),与英伟达的扁平拓扑结构形成鲜明对比。在3D环面拓扑中,每个芯片以三维网格的形式紧密连接,无需依赖昂贵且耗电的交换机。尽管这种结构可能导致芯片间通信需要更多跳数,但OCS技术的引入几乎消除了延迟,并在个别组件故障时,能够在几毫秒内自动将数据流量绕过中断点,确保系统的稳定运行。谷歌报告显示,其液冷系统的整体正常运行时间一直保持在约99.999%的可用性水平。
Ironwood的发布,正值AI算力需求井喷之际。今年10月底,Anthropic宣布将采用超过100万个谷歌TPU来训练和运行其下一代Claude模型。这笔订单的规模之大,前所未有,其总算力超过1 gigawatt,相当于一座大型核电站的输出功率。Anthropic同时还在亚马逊Project Rainier项目下部署工作负载到数十万台Trainium2加速器上,这种双平台策略的选择,也从侧面印证了环面拓扑架构在大规模AI训练任务上的优势。随着AI技术的不断进步,对算力的需求呈现出指数级增长,Ironwood的发布无疑为AI行业提供了更为强大的计算支持。
除了TPU芯片外,谷歌还在发布会上推出了其首款自研Arm架构CPU——Axion。尽管谷歌尚未公布完整的芯片规格,但已知其基于Arm Neoverse v2平台构建,性能比现代x86 CPU提升高达50%,能效提升高达60%。谷歌在硬件和软件层面的双重发力,进一步完善了其AI基础设施生态。这场AI芯片之争,已经超越了单芯片性能的范畴,演变为整个AI基础设施生态的竞争。谷歌凭借TPU的规模化优势和持续的技术投入,正对英伟达的霸主地位发起强有力的挑战。
随着Ironwood的全面上市,以及Anthropic等客户的大规模应用,未来AI芯片市场的竞争格局无疑将变得更加复杂和激烈。谷歌Ironwood的发布,是否意味着英伟达万亿市值的神话即将走到尽头?在AI算力需求持续增长的背景下,英伟达又将如何应对来自谷歌等竞争对手的挑战?这些问题,无疑将成为业界关注的焦点。






