近期,AI领域迎来了一次重大变革,这一切的源头都要归功于DeepSeek及其发布的DeepSeek-R1模型。在1月20日,DeepSeek正式推出了这一模型并选择了开源,此举迅速在业界引起了轩然大波,甚至导致了英伟达股价的剧烈波动。在除夕前夕,英伟达的股价从148美元的高点急剧下滑至116美元,不少投资者因此遭受了重大损失。
据多方分析,英伟达股价的暴跌与DeepSeek-R1模型的发布有着直接关系。DeepSeek-R1通过创新的“蒸馏模型”大幅降低了对算力的需求,而且并未硬性绑定英伟达的显卡。尽管DeepSeek-R1的训练服务器依然使用了英伟达的计算卡,但它成功摆脱了英伟达硬件的束缚,在推理性能等方面展现出了与ChatGPT-o1相近甚至超越的能力。
与此同时,OpenAI也面临着前所未有的挑战。尽管ChatGPT依然是AI大模型的顶流,但DeepSeek的出现迫使OpenAI重新审视自己的模型开放策略。ChatGPT一直以其封闭性著称,对用户使用限制严格,这也成为了其发展的一个潜在瓶颈。DeepSeek所引发的行业震动,让OpenAI不得不重新评估开源模型的可能性。
CUDA+ChatGPT所构成的封闭式AI生态,一直以来都是英伟达CUDA生态的基石。然而,DeepSeek的出现打破了这一格局。DeepSeek选择了一种更为开放的MIT+类OpenRAIL授权方式,允许第三方自由使用、修改、复制和分发代码,这无疑是开源生态中最开放的协议之一。
DeepSeek不仅在开源协议上做出了创新,还在技术层面进行了诸多突破。例如,为了解决H800显卡性能不足以及跨芯片通信的瓶颈问题,DeepSeek选择从更底层的PTX开始编码,这一举措使得AI模型能够更高效地运行在不同的硬件设备上。DeepSeek还引入了即时编译技术,让AI模型可根据显卡类型动态生成最优计算图,从而实现了算力效率的暴涨和算力成本的暴跌。
DeepSeek的创新不仅体现在技术上,还体现在其对整个AI产业的深远影响上。DeepSeek的出现让AI大模型的部署门槛和成本大幅降低,使得AI有了工业化大生产的基础。同时,DeepSeek也突破了英伟达在AI算力领域的封锁,打破了“OpenAI+英伟达”的制霸联盟,让更多软件AI开发者与芯片开发者能够抓住和推动AI浪潮。
更重要的是,DeepSeek的成功展示了开源力量的胜利。DeepSeek为AI行业提供了一个全新的开源范式,并直观地展现了开源所带来的收益和效果。这一变化或将推动AI产业进入百家争鸣的创新阶段,让真正的创新来自于成千上万的开发者,而不是少数巨头。
DeepSeek的崛起无疑给整个AI产业带来了深刻的变革。它不仅让AI变得更加便宜和易用,还打破了原有的封闭格局,推动了开源生态的发展。DeepSeek的成功经验也将激励更多的企业和开发者投身于AI领域的创新和发展,共同推动AI产业的繁荣和进步。