近期,一款来自中国的AI大模型DeepSeek-V3在海外社交平台引发了广泛关注与热议,其卓越表现赢得了众多专业人士的高度评价。这款由“深度求索”公司推出的模型,被业界誉为AI界的一匹黑马,以其出色的性能和低成本训练模式,震撼了整个AI行业。
Scale AI的首席执行官在谈及DeepSeek-V3时表示,其性能已可与OpenAI的GPT-4o及刚获得巨额投资的Claude 3.5 Sonnet相媲美,但令人惊讶的是,其训练所需的算力仅为这两者的十分之一。他直言,这反映了中国在AI领域的迅猛发展,当美国处于休息状态时,中国正以前所未有的速度和实力奋力追赶。
据AI教育专家Nate Jones分析,DeepSeek-V3的出现极大地降低了大模型训练的成本。以往,这类模型的训练费用往往以亿为单位计算,而DeepSeek-V3却将这一成本平均降低了十几倍。与meta公司投入超过5亿美金训练的大模型相比,DeepSeek-V3的训练费用仅为约500多万美金,这一差距令人咋舌。
DeepSeek-V3在海外的专业测评中同样表现出色。在权威的“Aider多语言编程测试排行榜”上,它仅次于OpenAI的最强版本ChatGPT-o1,位列第二。而在测试编程和编码能力的LiveCodeBench测试中,它更是超越了所有已知的开源模型,展现了惊人的实力。有程序员感慨道:“仿佛机器中藏着一个能洞察人心的幽灵。”
那么,DeepSeek-V3究竟为何能如此出色呢?深入探究后,答案聚焦于其独特的“投入模式”。在AI发展的三大关键要素——算法、算力和数据中,由于贸易战的影响,中国公司在算力和数据上一直面临挑战。然而,DeepSeek-V3通过优化算法,成功降低了对算力的依赖,实现了以更低的成本、更快的速度提升性能的目标。
DeepSeek-V3的母公司公开的技术报告显示,其核心创新在于自研的MoE模型。这一模型类似于一个拥有多个部门的机构,每个部门都有擅长特定领域的专家。在MoE模型的支配下,DeepSeek-V3能够智能地调动最合适的专家来处理特定任务,从而实现了高效、精准且经济的运算。
DeepSeek-V3的正式服务价格更是让人惊喜。每百万输入tokens仅需0.5元至2元,每百万输出tokens也仅为8元,这一价格仅为GPT-4o的十分之一。如此高性价比的产品,不仅让DeepSeek收获了“AI界拼多多”和“大模型价格屠夫”的称号,更有望引发一轮AI产品的“降价潮”,让广大用户受益。
DeepSeek-V3的成功,无疑给我们带来了深刻的启示。它告诉我们,在AI领域,算法的创新始终是推动发展的关键。同时,高性价比AI产品的诞生,有助于实现技术的普惠,让更多人享受到AI带来的便利。而DeepSeek公司在不利条件下仍坚持创新的精神,更是值得我们每个人学习。
随着DeepSeek-V3在全球范围内的走红,中国AI行业的实力再次得到了彰显。未来,我们期待看到更多像DeepSeek这样的企业涌现,共同推动AI技术的不断进步与发展。