ITBear旗下自媒体矩阵:

华为云昇腾AI云服务:超节点性能飞跃,挑战英伟达H20三倍效率

   时间:2025-08-30 12:40:11 来源:观察者网编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在中国国际大数据产业博览会上,华为云计算CEO张平安发表了一场引人深思的演讲,聚焦在算力与AI服务的未来趋势上。他强调,尽管芯片技术至关重要,但更为核心的是如何为客户提供所需的计算结果。

这是自华为云近期传出大规模组织架构调整以来,张平安首次在公开场合发声。他指出,华为云正致力于打造一个坚实的算力基础,通过昇腾AI云服务和Tokens服务,确保客户能够获得理想的计算结果。

面对AI基础设施需求的急剧增加,张平安指出,未来十年算力需求可能增长数万倍。然而,国产芯片的发展却面临着来自美国的重重阻碍。在此背景下,他提出,华为可以利用其在光通信、网络、供电等多领域的技术积累,通过系统整合,利用空间、带宽和能源来换取算力,从而在云上算力集群中实现规模优势和性能提升。

今年4月,华为云推出了CloudMatrix384超节点,该超节点集成了384颗昇腾NPU和192颗鲲鹏CPU,通过全新高速网络MatrixLink实现全对等互联,形成一台超级“AI服务器”,算力规模高达300 PFlops。对于超大规模的大模型训练任务,该超节点可以通过横向扩展,连接多个节点,组成一个庞大的AI集群。

在博览会上,华为云宣布其Tokens服务已接入CloudMatrix384超节点,借助xDeepServe架构的创新,单芯片实现了2400TPS、50msTPOT的高吞吐、低时延,性能远超业界平均水平。xDeepServe采用Transformerless的极致分离架构,将MoE大模型拆分成可独立伸缩的微模块,通过高效的通信库和自研推理引擎,实现超高吞吐的LLM服务平台。

张平安在演讲中表示,昇腾AI云服务不关注芯片的具体纳米级别,而是注重为客户提供算力服务和Token服务,以满足其最终的计算需求。他透露,华为云超节点的Token服务在50ms时延下,每卡可以生成2400个Token,效率是H20的三倍,并支持包括盘古在内的多个主流开源大模型。

华为云正围绕贵安、乌兰察布、和林格尔、芜湖四大核心枢纽,构建“全国算力一张网”。在贵州,已部署超过40套CloudMatrix384超节点。与去年同期相比,华为云的整体算力规模增长了近250%,昇腾AI云服务客户数量从321家增长到1714家,且连续756天保持重大事故为零的记录。

在智能驾驶领域,华为云也发布了CloudVeo智能驾驶云服务等一系列解决方案和成果。华为云贵安汽车专区正式上线,长安天枢智驾搭载华为云CloudMatrix 384超节点同步亮相。据悉,中国最大的智能驾驶(辅助)企业引望已采用昇腾平台,多个项目的实际测试结果显示,CloudMatrix 384超节点在典型感知模型、E2E、VLA模型上的性能达到或超过H100的2.5-3倍。

在此次大会前夕,华为云的组织架构调整引起了广泛关注。市场传言称,华为云多个部门被裁撤整合。调整后,华为云将聚焦于通算、智算、存储、AI PaaS、数据库和安全六大核心业务。据Canalys数据显示,今年一季度,华为云在中国大陆云服务市场中排名第二,占据18%的份额,但与排名第一的阿里云仍有较大差距。

分析人士认为,当前市场主流需求已从“上云”转向“上AI”,客户对AI的旺盛需求正在重塑云计算的应用方式。华为云此次组织架构调整是一次战略抉择,旨在通过砍掉协同效应弱、资源消耗大的外围研发,将所有力量集中在能最大化“昇腾AI+盘古”组合优势的核心场景上。

华为副总裁、中国云业务部部长陈林也在大会上谈到了组织架构调整的原因。他表示,这是为了聚焦AI饱和投入,抓住人工智能应用行业落地的加速期,推动中国在各行业构筑起全球领先的优势。

张平安强调,在AI时代,要积极拥抱AI原生思维,围绕AI重新构建应用、数据、流程和人员。他认为,未来AI可能会成为执行任务的主体,而人的任务将是管理AI、控制AI的开关。对于希望用AI构筑领先优势的企业来说,只有通过AI原生思维来拥抱AI,才能充分发挥其潜力,提高效率,创新业务模式,抓住智能时代的机遇。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version