滚动资讯

当前位置：财经 > 信息流 > 正文内容

英伟达推出Rubin CPX芯片：专攻长上下文推理，算力效率远超当前旗舰

时间：2025-09-10 10:35:26 来源：财联社编辑：快讯 IP：北京 发表评论无障碍通道

全球AI算力芯片领域的领军者英伟达近日发布了一款专为长上下文场景设计的GPU——Rubin CPX。这款芯片旨在显著提升AI推理效率，尤其适用于编程、视频生成等需要处理超长上下文窗口的应用领域。

英伟达首席执行官黄仁勋指出，Rubin CPX是全球首款专为处理数百万级别tokens的AI推理模型打造的芯片。该产品基于英伟达计划于明年发布的下一代顶级算力芯片Rubin架构，预计将于2026年底正式出货。届时，英伟达将推出集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU的旗舰AI服务器NVIDIA Vera Rubin NVL144 CPX。

据技术披露，搭载Rubin CPX的机架在处理大上下文窗口任务时，性能较当前旗舰产品GB300 NVL72提升最高达6.5倍。新一代旗舰机架将提供8 exaFLOPs的NVFP4算力，较前代提升7.5倍，同时配备100 TB高速内存和1.7 PB/s的内存带宽。

英伟达强调，部署Rubin CPX的客户将获得显著经济效益。以1亿美元的新芯片投资为例，预计可为客户带来50亿美元的收入增长。这种设计理念源于对AI推理过程硬件需求的深度解析——推理过程分为上下文阶段与生成阶段，两者对计算资源的要求存在本质差异。

上下文阶段属于计算密集型任务，需要强大的数据处理能力来分析海量输入数据并生成首个输出token；而生成阶段则受内存带宽限制，依赖高速内存传输维持逐token输出性能。当前顶级GPU主要针对内存和网络受限的生成阶段优化，配备了昂贵的HBM内存，但在解码阶段这类资源存在浪费。通过分离两个阶段并针对性优化资源配置，Rubin CPX实现了算力利用率的显著提升。

具体参数方面，Rubin CPX针对长上下文场景优化，配备30 petaFLOPs的NVFP4算力和128GB GDDR7内存。英伟达调研显示，约20%的AI应用存在首token生成延迟问题。例如解码10万行代码可能耗时5-10分钟，而视频生成模型因预处理和逐帧嵌入的延迟，目前主要应用于短片制作。

在产品供应方面，英伟达将提供两种配置方案：一是与Vera Rubin芯片集成在同一托盘中的组合方案；二是针对已预订NVL144的客户，提供与Rubin机架完全匹配的独立CPX芯片机架。

更多>同类资讯

小剧场激活城市夜经济：“商圈+剧场”模式成年轻人新宠，原创剧目海外绽放

10-02

“一人食”风潮兴起：商家精心服务满足独自用餐仪式感需求

10-02

国庆首日西贝放大招，部分菜品降幅超20%引关注

10-02

洛南2025年促消费增收活动开启，农特产品展销、美食品鉴等精彩不断

10-02

西贝国庆前夕突调价，代金券助力顾客低价享美食，账单实付金额引热议

10-02

莒县“举国大地”跳蚤市场：品控售后双保障，撬动二手文化消费新活力

10-02

美容院库存积压难题何解？智能化管理系统助力高效经营与成本优化

10-02

京东调研：超半数人十一锁定小城游，寻清净慢节奏，拒绝“流水线”式旅行

10-02

国庆中秋文旅市场热力全开：深度游、跨界融合与跨境游成新亮点

10-02

卡游小马宝莉“星愿派对”启幕，100余款新品亮相激活假日消费新活力

10-02

京东调研：十一假期超半数人“游小城”，寻清净、慢节奏与高性价比之旅

10-02

国庆中秋双节将至：出行客流涌动，消费活力迸发，市场供给无忧

10-02

国庆首日湖南消费“火力全开”：面包节咖啡节齐聚，免税店奥莱人气旺

10-02

西贝北京门店降价首日探访：未到午时满座，招牌菜降价现做引客来

10-02

西贝调价又发券，网友薅羊毛实录：有人0元吃大餐，也有人吐槽活动规则

10-02

点击查看更多 +

全站最新

尚界H5携华为智驾入局15万级市场，鸿蒙智行开启主流消费智能新篇

大宋咨询聚焦社区早餐：精准洞察需求，让“家门口早餐”更贴心

大宋咨询聚焦社区早餐：精准洞察需求，助力早餐店贴心升级

人大代表建议：法定假日高速免费或变按年享免费时长，车主出行更自由？

9500车位低碳智能汽车运输船“安吉茂盛”首航载3459台国产车驶向欧洲

马斯克xAI推出Grok 4 Fast：性能媲美Grok 4，成本降低98%

热门内容

本栏最新

尚界H5携华为智驾入局15万级市场，鸿蒙智行开启主流消费智能新篇

大宋咨询聚焦社区早餐：精准洞察需求，让“家门口早餐”更贴心

大宋咨询聚焦社区早餐：精准洞察需求，助力早餐店贴心升级

人大代表建议：法定假日高速免费或变按年享免费时长，车主出行更自由？

马斯克xAI推出Grok 4 Fast：性能媲美Grok 4，成本降低98%

伟迈特CNC加工：以专业与效率破解铝壳交期困局，助力产品抢占市场

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.