近日,国产AI模型DeepSeek在数学、编程及推理领域的卓越表现引起了广泛关注。据悉,该模型在性能上能与OpenAI的顶尖推理模型o1相媲美,但其API调用成本却大幅降低了90%-95%。这一消息迅速在网络上发酵,并于1月27日推动DeepSeek应用在苹果中国及美国地区的应用商店免费下载排行榜上登顶,甚至在美国市场超越了ChatGPT。
DeepSeek的成本效益尤为引人注目。据报道,其V3版本仅使用了2048块H800 GPU便完成了6710亿参数模型的训练,总成本仅为557.6万美元,远低于同类顶级模型如GPT-4的10亿美元训练成本。这一成就不仅彰显了DeepSeek在模型优化上的卓越能力,也对AI行业的成本结构提出了全新思考。
此前,OpenAI等科技巨头一直依赖强大的算力来推动AI模型的发展,而DeepSeek的崛起则打破了这一传统模式。其以远低于o1的成本实现了类似的效果,且推理成本也更为低廉。这一变化引发了市场对AI泡沫的担忧,特别是以英伟达为首的算力相关企业。自ChatGPT4推出以来,纳斯达克指数大幅上涨,英伟达市值更是飙升了五倍以上,AI成为美股上涨的主要驱动力。然而,DeepSeek的出现使得市场对英伟达等企业的估值产生了质疑。
尽管市场反应强烈,但有人认为DeepSeek对算力的利空可能被夸大了。英伟达等企业的跌幅虽受短期影响,但更多是由于前期涨幅过大。从历史角度看,随着技术的发展,设备成本下降是必然趋势。从世界上第一台计算机ENIAC到如今的笔记本电脑,算力的大幅提升伴随着成本的急剧降低。因此,将DeepSeek的出现视为对算力行业的长期利空可能过于悲观。
AI技术的发展远未止步。当前的大模型主要集中在文字处理领域,而视觉模型、文生视频等多模态大模型才是打开C端应用市场的关键。因此,只要当前的大模型能够持续向通用人工智能(AGI)迈进,那么对算力的担忧或许只是杞人忧天。随着技术的迭代升级,新的需求将不断涌现,从而进一步推动技术进步和成本下降。
在算力封锁可能无效的背景下,美国面临艰难抉择。一方面,封锁无用且可能失去市场份额;另一方面,若AI真的成为工业革命级别的技术,美国又不愿被超越。因此,如何在保护自身利益的同时促进AI技术的健康发展成为亟待解决的问题。AI新冷战的威胁不容忽视,但只有通过合作与竞争并存的方式才能推动技术的持续进步。
与此同时,国内经济数据也引起市场关注。统计局公布的1月份官方制造业PMI为49.1,首次跌破荣枯线并大幅低于市场预期。这一数据对制造业情绪产生了负面影响,与算力大跌共同导致A股走弱。截至收盘,上证指数微跌0.06%,创业板指跌幅达2.73%,而港股恒生指数及恒生科技指数则分别微涨0.54%和0.46%。两市成交额缩量至1.1万亿,超过3400只股票下跌。
股市有风险,投资需谨慎。本文内容仅供参考,不构成任何投资建议。读者需根据自身情况独立思考并做出决策。