ITBear旗下自媒体矩阵:

华为云昇腾AI云服务升级:CloudMatrix384 Token服务上线,驱动千行万业智能化

   时间:2025-09-19 12:30:35 来源:小AI编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在华为全联接大会2025上,华为云计算CEO张平安向外界披露了昇腾AI云服务的重大技术突破。基于最新发布的AI服务器架构,华为云将CloudMatrix超节点规模从384卡扩展至8192卡,构建起50万至100万卡规模的超大规模计算集群。这一跨越式升级使单卡推理性能达到行业领先水平,经实测在在线推理场景中较同类产品提升3-4倍,为人工智能发展提供了前所未有的算力支撑。

针对AI算力与显存强绑定的行业痛点,华为云创新推出弹性内存存储服务(EMS)。该技术通过内存资源池化,突破传统显存容量限制,使内存能够动态替代显存完成计算任务。这种"以存补算"的模式显著降低了大模型训练和推理成本,特别在多轮对话等复杂场景中,系统响应速度和计算效率得到质的提升。

为满足不同行业的差异化需求,华为云正式上线CloudMatrix384 AI Token服务。该服务通过资源池化技术,将算力、内存、显存等资源解耦重组,形成分布式并行计算架构。这种设计使计算任务、存储任务和AI专家系统能够独立优化,在保证计算质量的前提下,大幅简化底层技术实现。目前该服务已支持Pangu、DeepSeek、Qwen等主流大模型,日均处理请求量突破千万级。

在应用实践层面,360纳米AI平台借助CloudMatrix384的Token推理服务,成功实现每日千万级内容生成请求的稳定处理。中国科学院"磐石·科学基础大模型"项目则通过超节点高速互联架构和算子优化技术,将模型训练精度提升4%,支持超过100个专业领域的科研场景应用,为前沿科学研究开辟了新路径。

面对AI算力需求激增带来的能耗挑战,华为云在贵州、内蒙古、安徽等地建成全液冷AI数据中心。通过液冷技术将年均PUE值降至1.1,较传统风冷方案节能30%以上。企业用户无需自建数据中心,仅需通过光纤接入即可获得高效算力资源,配合全栈专属AI云服务,实现模型训练、数据调优的全流程物理隔离和端到端加密。

技术升级带来市场爆发式增长。数据显示,昇腾AI云服务客户数量从去年的321家激增至1805家,AI总算力规模同比增长268%。这种增长不仅体现在用户规模上,更体现在服务质量的持续提升——通过技术创新和灵活部署方案,华为云正推动AI技术从实验室走向千行百业,为产业智能化转型注入核心动能。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version