ITBear旗下自媒体矩阵:

谷歌Ironwood来袭:AI芯片市场格局生变,规模化成竞争新焦点?

   时间:2025-11-28 01:10:10 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

在近期举办的Google Cloud Next大会上,谷歌正式揭晓其第七代TPU芯片——Ironwood,此举无疑为AI芯片领域的竞争格局注入新变量。这款新芯片不仅在性能上与英伟达的Blackwell B200形成对垒之势,更凭借其超大规模部署能力,引发业界对AI算力市场未来走向的深度思考。

从核心参数看,Ironwood单芯片峰值算力达4614 TFLOPs,配备192GB高带宽内存,与Blackwell B200处于同一量级。具体到细分指标,其FP8性能为4.6 petaFLOPS,略高于B200的4.5 petaFLOPS,但低于GB200/GB300的5 petaFLOPS;内存带宽方面,192GB HBM3e内存提供7.4TB/s传输速率,与B200的8TB/s接近。真正拉开差距的是规模化能力:谷歌通过创新架构设计,将单个计算域的芯片数量从NVL72系统的72颗直接提升至9216颗,总算力达42.5 Exaflops,相当于全球顶级超算ElCapitan的24倍。这种量级差异,使得谷歌在训练超大规模AI模型时具备显著优势。

支撑这种超大规模部署的,是谷歌自主研发的3D环面拓扑结构与光路交换技术(OCS)。与传统扁平拓扑依赖高性能交换机不同,3D环面让芯片以三维网格形式直接互联,配合OCS技术实现毫秒级故障绕行,既降低了硬件成本,又提升了系统可靠性。谷歌披露的数据显示,其液冷系统自2020年以来保持99.999%的可用性,年停机时间不足6分钟。这种技术路径的选择,反映出谷歌在算力扩展与能效平衡上的独特思路。

市场端对谷歌技术路线的认可已转化为实际订单。2025年10月,AI企业Anthropic宣布将采购100万个TPU芯片,计算能力超过1 gigawatt,用于训练下一代Claude模型。该公司首席执行官强调,此次扩张是为应对指数级增长的需求,同时保持技术领先性。值得注意的是,Anthropic同时也在亚马逊Project Rainier项目中部署数十万台Trainium2加速器,这些加速器同样采用环面拓扑架构。这种“双平台”选择,侧面印证了环面架构在大规模训练任务中的通用价值。

谷歌的野心不止于硬件突破。在软件层面,其Kubernetes Engine新增对TPU集群的高级维护功能,推理网关通过前缀缓存感知路由技术,将首次令牌延迟降低96%,服务成本削减30%。更值得关注的是,谷歌同步推出了首款自研Arm架构CPU Axion。基于Arm Neoverse v2平台构建的Axion,性能较现代x86 CPU提升50%,能效提升60%,进一步完善了其AI基础设施生态。

从技术演进轨迹看,谷歌在TPU规模化上的积累已进入收获期。Ironwood单芯片性能较TPUv5p提升10倍,较TPUv6e Trillium提升4倍,而其Jupiter数据中心网络技术理论上可支持43个TPUv7 Pod组成的集群,相当于约40万个加速器。尽管英伟达CEO黄仁勋曾淡化AI专用芯片对GPU市场的冲击,但谷歌、亚马逊等科技巨头在硬件性能与网络扩展性上的快速追赶,正迫使行业重新审视竞争规则。Anthropic的百万级订单证明,市场对超大规模算力的需求已从概念验证转向实际落地,AI芯片的较量正从单点性能比拼转向系统级生态竞争。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version