专注于推理GPU研发的曦望(Sunrise)近日正式发布新一代推理GPU芯片启望S3,这是该公司在完成近30亿元战略融资后的首次重大亮相。此次发布标志着曦望在AI芯片领域迈出关键一步,也引发业界对国产推理芯片未来发展的广泛关注。
曦望董事长徐冰在发布会上透露,公司前身是商汤科技的大芯片部门,自2020年独立运营以来,已聚集了来自英伟达、AMD、昆仑芯等企业的三百余名芯片研发精英。团队核心成员平均拥有15年行业经验,这为曦望在AI芯片领域的技术突破奠定了坚实基础。徐冰强调,曦望的研发理念源于真实业务场景的打磨,而非纸上谈兵,这种实践导向使公司更懂AI应用的实际需求。
公司两位联席CEO的组合被内部称为"越湛越勇",形成了能力互补的黄金搭档。负责研发的王勇曾是AMD昆仑芯核心架构师,在百度昆仑芯工作期间积累了20年芯片研发经验,他主导了曦望两代芯片的研发并实现一次性点亮成功。另一位联席CEO王湛作为百度创始团队成员和首任产品经理,成功打造了百度凤巢系统,拥有丰富的产品化和商业化经验。2025年初加入曦望后,他全面负责产品化和商业化工作,并推动组织文化建设。
在融资方面,曦望获得了产业资本和财务投资者的双重认可。投资方包括三一集团旗下华胥基金、杭州数据集团、IDG资本、高榕创投等机构,以及诚通混改基金等国资背景资本。商汤科技作为单一最大股东,继续在技术和业务层面与曦望保持深度合作。发布会上,商汤董事长兼CEO徐立亲自到场,宣布与曦望启动百万token推流合作。
徐冰指出,AI产业正从训练主导转向推理主导。根据德勤报告,到2026年推理算力占比将达66%,超越训练需求。智能体物理AI的爆发将使推理从配角变为主力,多模态推理需求正在快速增长。当前推理成本已占AI应用总成本的70%,成为制约行业发展的关键因素。曦望选择专注推理赛道,正是看准了这一结构性变革带来的机遇。
与传统训推一体GPU不同,曦望从底层架构开始就为推理场景重新设计。公司摒弃了追求峰值TFLOPS的通用计算思路,转而专注于提升真实业务场景中的token成本效益、能耗表现和服务稳定性。徐冰表示,英伟达等企业的产品在推理场景中算力利用率常低于10%,而曦望通过专用架构设计,可将这一指标提升至更高水平。
发布会上,曦望展示了S3芯片的性能数据,并公布了S4、S5的研发路线图。徐冰透露,公司已累计投入20亿元研发资金,成功量产S1和S2两代产品。S3的推出标志着曦望进入规模化应用阶段,其目标是将推理成本降低90%,推动行业向"百万token一分钱"的新标准迈进。此前国内已有企业将推理价格降至百万token一元水平,曦望计划在此基础上再压低一个数量级。
除了芯片本身,曦望还推出了完整的解决方案。公司提供标准化的一体化服务器、整机和集群方案,帮助客户快速部署推理基础设施。在生态合作方面,曦望与商汤、范式等AI企业建立战略合作,共同优化推理成本;与杭钢数字科技、浙江算力科技等本地平台合作,将推理基础设施覆盖至浙江并辐射全国;还与三一、协兴等企业签约,将推理技术嵌入制造、能源等具体场景。
徐冰强调,曦望的定位不仅是芯片供应商,更是推理基础设施的构建者。公司通过芯片+系统+生态的布局,致力于解决AI企业的算力瓶颈问题。他比喻道,就像过去十年光纤和基站支撑了中国互联网发展,未来十年高性价比的推理基础设施将成为AI时代的根基。曦望的目标是持续降低推理成本,让企业不再为算力"卡脖子"、电费发愁或受芯片限制,从而专注于构建未来的AI爆款应用。










