高性能GPU及多模态推理芯片领域迎来新势力——曦望Sunrise。这家脱胎于商汤科技大芯片部门的创新企业,自2024年底独立运营以来,正以差异化技术路线和豪华阵容引发行业关注。其核心团队由200余名专业人士组成,其中80%为技术研发人员,汇聚了来自AMD、华为海思、百度等科技巨头的精英,硕士及以上学历占比超八成,平均行业经验达15年。
公司管理层阵容堪称"全明星":董事长徐冰作为商汤科技联合创始人,曾主导完成超66亿美元融资并推动港交所上市,创下全球AI领域融资纪录;联席CEO王勇拥有20年芯片研发经验,曾担任AMD dGPU首席架构师,主导多款7nm芯片从设计到量产的全流程;另一位联席CEO王湛则是百度创始团队成员,在百度任职16年间担任资深副总裁,深度参与人工智能战略布局。这个兼具技术深度与商业视野的团队,正带领曦望在GPU赛道开辟新战场。
与传统GPU厂商"训推一体"的路径不同,曦望选择聚焦推理场景的"纯推理"路线。通过在调度机制、缓存架构、片上SRAM等核心环节进行原生优化,结合LPDDR内存技术,实现了单位Token推理成本的大幅降低。公司宣称,其技术方案可使推理成本下降90%,同时提供更稳定的服务质量。"我们要重写中国AI产业的成本结构,"王湛在接受采访时表示,"当推理算力变得像水电一样普惠,AGI的潜力才能真正释放。"
这种技术自信源于持续的研发投入和产品迭代。据披露,曦望已累计投入20亿元研发资金,构建起三代芯片产品矩阵:2020年量产的S1芯片作为国内首款视觉推理芯片,已适配超千种计算机视觉模型,获得索尼、小米等头部企业IP授权;2024年推出的S2芯片实现对主流GPU生态的兼容,支持DeepSeek、Qwen等主流大模型运行;计划2026年发布的S3芯片更将目标设定为"推理性价比之王",通过FP8/FP4低精度推理技术,力争实现"百万Token一分钱"的行业新基准,在能耗和成本上形成数量级优势。
在生态建设方面,曦望展现出开放姿态。S2芯片通过兼容CUDA生态,降低了开发者迁移成本,同时针对国产大模型进行深度优化。这种"双轨并行"的策略,既保证了技术兼容性,又为本土AI应用提供了定制化解决方案。随着所筹资金逐步投入下一代GPU研发和规模化量产,这家成立仅数年的企业,正在重塑高性能计算领域的竞争格局。







