在AI领域,英伟达一直被视为行业的领头羊,但2025年,这一地位似乎正面临前所未有的挑战。随着AI算力市场风向的转变,行业重心逐渐从模型训练向模型推理倾斜,一系列专注于推理芯片的初创公司如雨后春笋般涌现,它们纷纷向英伟达这位霸主发起冲击。
推理与训练,如同AI领域的两个重要阶段,前者是后者的商业化延伸。训练阶段,模型如同初学者,在教练的指导下不断学习和调整;而推理阶段,模型则如同老司机,需灵活应对各种实际路况。这一转变意味着,AI工作负载的格局将发生深刻变化,推理计算需求将迅速提升,甚至有望超过训练计算需求。
在这场挑战者联盟中,Groq、SambaNova和Positron AI无疑是最为引人注目的三位成员。Groq由前谷歌TPU核心团队的核心成员创办,其AI推理引擎LPU以其超快的推理速度和远低于GPU的token成本而闻名。Groq的LPU设计独特,旨在解决传统架构中外部内存的瓶颈,通过优化数据流动,实现高效计算。然而,尽管Groq声称其LPU在速度和能效上远超英伟达GPU,但一些专家对其实际成本和能耗提出了质疑。
SambaNova则以50亿美元的估值位居AI芯片初创公司榜首。其RDU架构结合了GPU的数倍片上SRAM和适用于大规模计算任务的HBM,实现了极致的算子融合和高性能。SambaNova不仅出售芯片,还提供从芯片到服务器系统,甚至包括部署大模型的定制技术堆栈。其联创Rodrigo Liang认为,大模型与生成式AI商业化的下一个战场将是企业的私有数据,SambaNova的技术将帮助企业高效、可持续地扩展规模。
相比之下,Positron AI虽然成立时间较短,但其推出的推理芯片同样引人注目。Positron声称其芯片可以执行与英伟达H100相同的计算,但成本仅为五分之一。Positron的CEO Thomas Sohmers表示,AI计算开支的重心已经转向推理,他们有信心通过提供更多专用于推理的计算资源,推动AI技术的广泛采用。
面对这些来势汹汹的挑战者,英伟达似乎并未感到过多的压力。相反,它正忙着推出新的推理芯片B300系列,以更高的算力和更大的显存满足市场对大模型推理性能的需求。B300系列将有效降低推理成本,提高模型能力,为AI推理市场注入新的活力。
然而,无论如何,这场由推理芯片引发的挑战已经让AI市场变得更加多元化和竞争激烈。对于初创公司而言,它们需要不断优化技术,降低成本,以在市场中站稳脚跟;而对于英伟达这样的行业巨头而言,它也需要时刻保持警惕,不断创新,以应对来自四面八方的挑战。