近日,科技界迎来了一场由中国AI企业DeepSeek掀起的风暴,其发布的R1模型不仅在美国AI领域引发了巨大震动,还对整个科技行业产生了深远影响。
R1模型以极具竞争力的价格,实现了对美国多个头部AI模型的超越,且完全开源的特性更是让不少美国科技公司感到压力。据传闻,meta公司内部甚至出现了恐慌情绪,足见R1模型的威力。
这场风暴在本周一继续发酵,美股市场尤其是半导体板块遭受重创。其中,英伟达股价单日暴跌16.79%,市值蒸发近6000亿美元,创下了美国金融史上的新纪录。台积电、ARM、阿斯麦以及美光科技等半导体行业巨头也纷纷下跌,跌幅均超过5%。
除了半导体板块,美股三大指数也呈现分化走势。道琼斯工业平均指数微涨0.65%,但标普500指数和纳斯达克指数分别下跌1.46%和3.07%。
面对DeepSeek带来的冲击,英伟达发言人表示:“DeepSeek是一项出色的人工智能进步,它展示了如何利用广泛可用的模型和符合出口管制的计算来创建新模型。”这一表态无疑承认了DeepSeek在AI领域的领先地位。
然而,DeepSeek并未止步于此。在发布R1模型后不久,该公司又推出了名为Janus-Pro和JanusFlow的开源多模态AI模型。这一系列模型是DeepSeek此前发布的JanusFlow大模型的高级版本,在多模态理解和文本到图像的指令功能方面取得了重大进步。
据DeepSeek介绍,Janus-Pro通过解耦视觉编码的方式,提升了模型在不同任务中的适配性和性能。该模型可适配视觉问答、图像标注等多模态场景,展现了强大的应用能力。而JanusFlow则通过生成流与自回归语言模型的融合,实现了统一框架下的理解和生成任务处理。
DeepSeek的这一系列动作,标志着其正式进军文生图领域。此举不仅进一步巩固了其在AI领域的领先地位,也为其他科技公司提供了新的技术选择和发展方向。
DeepSeek创始人梁文锋在接受采访时表示,中国AI不可能永远处于跟随地位。他认为,中国AI与美国之间的差距主要在于原创和模仿之差。为了改变这一现状,中国需要有人站到技术的前沿进行探索和创新。DeepSeek的成立和发展,正是为了这一目标而努力。
梁文锋还指出,当前受美国制裁影响,中国公司无法使用高端芯片,在算力资源上处于劣势。然而,DeepSeek仍然能够开发出领先模型,这说明当前AI大模型所需的算力资源被高估了。通过技术优化而非大量购买芯片进行AI研发,是可行的路径之一。