ITBear旗下自媒体矩阵:

DeepSeek技术突破:如何撼动英伟达市场地位?

   时间:2025-02-08 14:04:16 来源:钛媒体APP作者:ITBEAR编辑:快讯团队 发表评论无障碍通道

近期,AI领域迎来了一场革命性的突破,DeepSeek的V3模型以仅557.6万的训练成本,展现出了与OpenAI O1推理模型相媲美的性能。这一成就不仅在全球科技界引起了轩然大波,还对英伟达等芯片巨头产生了深远的影响。1月27日,英伟达股价暴跌17%,市值瞬间蒸发6000亿美元,市场担忧DeepSeek的崛起会减少对先进芯片的需求。

然而,科技界对此的看法却存在分歧。一部分人认为,DeepSeek的高性能和低成本将推动整个应用生态的繁荣,对英伟达等芯片制造商的长期发展构成利好。加州大学戴维斯分校电子计算机工程系助理教授、AIZip联合创始人陈羽北指出,DeepSeek的核心创新在于其基础模型V3的能力,通过GRPO(分组相对策略优化)方法,实现了显著的性能提升。

在访谈中,陈羽北详细解释了DeepSeek的技术优势。他认为,V3模型在混合专家网络(MoE)和注意力层(Attention Layer)上的优化,使得模型在600多B的参数规模下依然能够表现出色。而DeepSeek R1 Zero则通过设计基于规则的奖励函数,利用V3模型生成的大量回答进行筛选,从而提高了正确回答的比重。DeepSeek还通过大模型训练小模型的方式,进一步提升了小模型在相关问题上的表现。

DeepSeek技术示意图

对于英伟达而言,DeepSeek的出现无疑是一把双刃剑。Inference.ai创始人兼CEO John Yue认为,一方面,DeepSeek的成功激发了更多初创企业探索AI应用层面的可能性,这将带动整个AI行业的发展,从而增加对英伟达GPU的需求。另一方面,DeepSeek在MOE优化和CUDA调用方面的创新,确实冲击了英伟达的溢价,但并未完全冲垮其NVLink和CUDA两大壁垒。

John Yue进一步解释称,MOE的优化使得不同专家可以分布在不同的计算卡上,降低了卡与卡之间互联的重要性。而在CUDA调用方面,DeepSeek团队已经证明可以直接调用更底层的PTX指令集进行优化,虽然这并不意味着所有团队都具备这样的能力,但至少提供了一种可行的方案。然而,长期来看,英伟达在CUDA生态和GPU调用系统方面的优势依然难以撼动。

DeepSeek选择开源的策略也对整个AI行业产生了深远影响。John Yue表示,开源降低了AI应用的准入门槛,使得更多开发者能够基于DeepSeek模型构建自己的应用。这不仅有助于推动AI技术的普及和应用创新,还为DeepSeek模型本身提供了更多的反馈和优化机会。

在谈到API接口价格时,John Yue指出,DeepSeek通过从上到下的全面优化,包括PTX调用、MOE架构和负载均衡等方面,成功降低了API成本。这使得更多企业和开发者能够承担得起AI应用的成本,进一步推动了AI技术的普及。

对于未来AI技术的发展趋势,陈羽北认为小模型将扮演越来越重要的角色。他指出,随着小模型在性能上的不断提升和应用场景的不断拓展,未来AI基础设施将呈现出分层化的趋势。从终端设备到边缘端再到云端,不同层级的AI模型将共同构成一个完整的智能系统。这将极大地降低AI应用的成本和提高AI的普及程度。

然而,陈羽北也提到,尽管小模型在很多领域已经展现出了强大的应用潜力,但在数据构成和架构创新方面仍然存在诸多挑战。他呼吁DeepSeek等前沿研究实验室能够更多地分享数据整理和架构创新的细节,以便其他开发者能够更容易地复现和优化这些工作。

AI发展趋势图

总体来看,DeepSeek的崛起不仅推动了AI技术的进步和应用创新,还对英伟达等芯片巨头产生了深远的影响。未来,随着AI技术的不断发展和应用场景的不断拓展,我们有理由相信AI将深刻改变我们的生活和工作方式。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version