在1月27日,一场由DeepSeek所引发的风暴席卷了科技股市场,纳斯达克指数受此影响下跌近3%。在这场风暴中,芯片巨头英伟达遭受重创,其股价大幅下跌16.86%,市值瞬间蒸发了惊人的5890亿美元,这一数字超过了3个AMD的市值,创造了美股历史上个股单日市值蒸发的新纪录。同时,其他芯片股也未能幸免,AMD下跌6.37%,博通更是暴跌17.4%。科技巨头微软和谷歌也分别下跌了2.14%和4.03%。
这场风暴的源头,正是近期发布了两款重磅模型的DeepSeek。1月20日,DeepSeek推出了其推理模型DeepSeek-R1,据官方评测结果显示,该模型在数学、代码、自然语言推理等任务上的性能可与OpenAI的GPT-4o正式版相媲美。尽管DeepSeek未透露R1的训练成本,但其API服务的定价却比GPT-4o正式版低了27至55倍。而在12月底,DeepSeek还发布并开源了新一代基座模型DeepSeek-V3,该模型在多项评测集上逼近了GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型,并与其他开源模型拉开了显著差距。
尤为引人注目的是,DeepSeek在其官方技术论文中透露,V3模型是在配备了2048个英伟达H800 GPU的集群上进行训练的。而H800是英伟达特供中国市场的AI芯片,在性能上并不及先进的H200、H100等。据DeepSeek计算,V3的训练成本仅为557.6万美元。相比之下,OpenAI的最大竞争对手Anthropic的首席执行官Dario Amodei曾表示,像GPT-4o这类模型的训练成本约在1亿美元,且到2027年这一成本可能会飙升至100至1000亿美元。这一对比使得DeepSeek的训练成本显得尤为低廉。
投资银行Saxo的首席投资策略师Charu Chanana表示,DeepSeek通过使用不那么先进但更具成本效益的硬件来开发尖端的AI模型,挑战了美国科技公司在高成本AI基础设施上的大量投资。这一观点引发了市场对英伟达等传统“卖铲人”地位的重新评估。投资者们开始关注,是否能够通过一种成本效益更高的方式来取得AI方面的突破,而这可能会削弱英伟达等传统芯片制造商的市场优势。
面对市场的冲击,科技巨头们开始尝试用另一套叙事逻辑来平息质疑。英伟达在回应中称,DeepSeek是一项卓越的AI进步,并强调了推理阶段仍然需要大量的英伟达GPU和高性能网络。微软董事长兼CEO Satya Nadella则引用杰文斯悖论来阐述AI的普及与效率提升将带动使用量的激增,尽管使用成本降低,但总消耗最终可能会上升。而OpenAI首席执行官Sam Altman则对DeepSeek的R1模型表示了赞赏,并强调OpenAI将继续执行其研究路线图,并认为现在比以往任何时候都更需要更多的计算能力来实现使命。
然而,硅谷的巨头们并非只是口头上的应对。据彭博社引述知情人士说法称,OpenAI内部普遍认为需要认真对待中国公司的发展,并正在试图弄清楚DeepSeek是如何能够发布这样的模型的。同样发力开源模型的meta也对DeepSeek的进展感到恐慌,并成立了多个专门的研究小组来剖析DeepSeek并利用这些见解改善其模型。这些科技巨头们一直以来都信奉大力出奇迹的原理,投入巨资打造提供算力、存储能力、高性能网络支持的数据中心,以追求AI模型的突破。
不久前,meta创始人兼CEO马克·扎克伯格还表示,公司计划2025年的资本支出将达到600亿至650亿美元,继续用于建设AI基础设施。而OpenAI则联手软银、甲骨文成立了一家合资企业“Stargate”,计划在未来四年内投资5000亿美元用于在美国建设新的AI基础设施。这一项目引发了广泛的关注和讨论,包括埃隆·马斯克的抨击。马斯克旗下的初创企业xAI更是斥巨资追赶对手,正在美国建立一台号称“世界上最强大的AI训练系统”的超级计算机,目前该计算机已连接了10万块英伟达GPU,并计划扩大至至少一百万块。
本周,美股七巨头中的meta、微软等将陆续发布最新财报。在过去几个季度中,由于对AI的持续投入未能取得可观的回报,这些公司已经频频受到华尔街投资者的质疑。而围绕DeepSeek的争论无疑将成为市场关注的重点之一,等待这些科技巨头的高管们给出解答和平息。