近日,人工智能领域迎来了一项重大突破,DeepSeek公司发布的R1开源推理模型引发了广泛关注。据悉,R1的表现超越了包括OpenAI在内的多家美国公司的顶尖模型,而其自我报告的培训成本仅为600万美元左右,远低于硅谷巨头们为建立人工智能模型所投入的数十亿美元。
尽管DeepSeek的崛起给英伟达带来了一定的市场压力,导致其股价在周一暴跌17%,但英伟达方面仍对DeepSeek的成就表示了肯定。英伟达发言人指出,DeepSeek的R1模型是一项出色的人工智能进步,同时也是测试时间缩放定律的完美体现。他进一步表示,DeepSeek的工作展示了如何利用这一技术创造新模型,并充分利用广泛可用的模型和符合出口管制的计算资源。
测试时间缩放定律是近年来人工智能领域的一个新热点,由OpenAI的研究人员在2020年提出。该定律认为,通过增加模型在推理阶段使用的计算量和时间,可以获得更好的预测结果。英伟达首席执行官黄仁勋和OpenAI首席执行官萨姆·奥特曼等业界领袖近几个月来一直在关注这一新趋势,并认为它将对人工智能的发展产生深远影响。
DeepSeek的R1模型正是基于测试时间缩放定律的突破性应用之一。该模型利用额外的计算能力,在推理阶段花费更多时间以获得更准确的预测结果。这一创新不仅提高了模型的性能,还降低了培训成本,为人工智能领域带来了新的发展机遇。
然而,随着DeepSeek等新型人工智能模型的崛起,一些分析师开始质疑微软、谷歌和meta等公司在英伟达人工智能基础设施上的巨额投资是否明智。这些公司近年来一直在加大对人工智能领域的投入,希望借此提升竞争力。然而,如果模型培训成本能够显著降低,那么这些投资可能会变得不再划算。
美国银行证券分析师贾斯汀•波斯特在周一的一份报告中指出,如果模型培训成本确实被证明显著降低,那么使用云人工智能服务的广告、旅游和其他消费应用公司将在短期内获得成本效益。同时,与超大规模人工智能相关的长期收入和成本也可能会降低。这意味着,未来人工智能领域的竞争将更加激烈,而成本效益将成为企业关注的焦点。
尽管如此,英伟达仍然对人工智能领域的发展前景持乐观态度。英伟达发言人表示,推理需要大量的英伟达GPU和高性能网络,而DeepSeek等新型模型的崛起将为英伟达创造更多的市场机会。他强调,英伟达将继续致力于推动人工智能技术的发展和创新,并期待与更多合作伙伴共同探索新的应用场景和商业模式。