在人工智能领域的浩瀚星空中,一颗名为Deepseek的新星正以惊人的速度闪耀,它不仅在国内市场独占鳌头,更是在全球舞台上超越了谷歌的Gemini,荣登全球第二大受欢迎AI聊天机器人的宝座。这一非凡成就迅速吸引了全球科技界的目光,特斯拉掌舵人埃隆·马斯克亦不例外。
近期,在WELT经济峰会上,马斯克的一段采访视频引发了广泛讨论。他高度赞扬了中国工程师的智慧与勤奋,认为Deepseek正是中国人才辈出的缩影。然而,马斯克同时也表达了对Deepseek革命性的保留态度,他坚信自己旗下的xAI及其他AI企业很快将推出更为先进的模型。
无独有偶,谷歌DeepMind的首席执行官、诺贝尔化学奖得主德米斯·哈萨比斯也对Deepseek发表了看法。他称赞Deepseek的AI模型为中国最佳,但也指出其并未带来科学上的重大突破,而是基于现有技术的优化,外界的过度炒作或许有些言过其实。哈萨比斯还透露,谷歌新发布的Gemini 2.0 Flash模型在效率上更胜一筹。
回望历史,每一次技术革新在推动行业发展的同时,也往往伴随着质疑与挑战。ChatGPT的诞生曾引发全球瞩目,但其创新性也曾遭到meta首席人工智能科学家杨立昆的质疑。然而,时间证明,ChatGPT无疑为人工智能领域带来了革命性的变化,引领了整个行业向生成式AI的转变。
Deepseek,这个以极低成本迅速崛起的AI新星,同样面临着类似的质疑与挑战。然而,其背后的故事却令人瞩目。Deepseek由国内对冲基金巨头幻方量化于2023年5月创立,至今不足两年。2024年5月,Deepseek发布了开源的第二代MoE大模型DeepSeek-V2,该模型在性能上与GPT-4 Turbo不相上下,但价格却仅为GPT-4的百分之一,因此被誉为“价格屠夫”和“AI界的拼多多”。
2025年1月,Deepseek推出的R1模型在数学、代码、自然语言推理等多个任务上展现出了与OpenAI-o1-1217相当的实力,特别是在AIME 2024、MATH-500和SWE-Bench Verified三项测试中,更是以微弱优势胜出。令人惊叹的是,这一切都是在不到600万美元的投入下实现的。Deepseek的“四两拨千斤”模式颠覆了人们对大模型行业“大力出奇迹”的传统认知,为整个行业的落地提供了新的可能。