滚动资讯

当前位置：财经 > 宏观经济 > 正文内容

DeepSeek国产AI崛起，凭何实力挑战美国科技巨头？

时间：2025-02-05 20:41:18 来源：德波作者：德波编辑：快讯团队 发表评论无障碍通道

在辞旧迎新的时刻，科技界也迎来了一场震撼人心的变革。一个名为DeepSeek的中国AI初创公司，以其最新发布的大模型DeepSeek-R1，在全球范围内掀起了轩然大波，成为了新年里科技领域最耀眼的新星。

DeepSeek此前就曾因其V3模型在硅谷引起轰动，但此次R1的发布，无疑是将这场风暴推向了新的高潮。meta的联合创始人对DeepSeek-R1赞不绝口，甚至不惜与批评者展开唇枪舌剑，足见其对这一技术的震撼程度。风投大佬马克·安德森也对DeepSeek-R1给予了高度评价，称其为对世界的一份深刻馈赠。

DeepSeek-R1的出色表现，迅速赢得了广大网友的青睐。许多原本使用ChatGPT的用户，纷纷转而投向DeepSeek的怀抱。DeepSeek的应用商店排名也因此飙升，一举登上了APPSTORE的榜首。

在国内，DeepSeek同样引发了巨大的反响。微博上与之相关的热搜话题不断，甚至一些非AI行业的圈外人也对其表现出了浓厚的兴趣。游戏开发者冯骥就在微博上感慨，DeepSeek的成就堪称“国运级别的科技成果”。

DeepSeek的成功并非偶然。据暗涌对DeepSeek创始人梁文锋的采访透露，DeepSeek是一个极其注重创新的公司。其V2、V3模型中的多头注意力机制，最初只是团队内一位年轻开发者的创意，经过团队的共同努力才得以实现。而这种创新驱动的技术突破，在DeepSeek团队内并不罕见。

然而，DeepSeek-R1的真正牛气之处，在于其路径创新。传统大模型训练注重标注数据微调（SFT）和强化学习（RL），但DeepSeek却摒弃了SFT，完全依靠强化学习来训练其推理模型。这种高强度的淬炼方式，使得DeepSeek-R1在仅花费600万美元、两个月时间的情况下，就达到了其他大厂花费数亿资金、数年时间才能达到的水平。

DeepSeek团队的研究人员还利用这种思路，在V3的基础上完全靠强化学习搞出了一个R1-Zero版本。Zero版本在训练中进化速度极快，很快就能与OpenAI-o1相抗衡，甚至在部分测试项目中还超越了o1。Zero不仅在推理能力上取得了显著进步，还表现出了主动复盘反思纠错的行为，这无疑是AI推理上的里程碑事件。

虽然Zero的推理能力已经得到了证明，但其输出的可读性较差，不符合人类预期。于是DeepSeek团队在Zero的基础上增加了一部分SFT训练，使得模型学会了说人话，从而诞生了DeepSeek-R1。经过这番“文理双修”后，R1的推理能力甚至进一步提高，在数学、代码和综合知识测试中均取得了优异成绩。

更为惊人的是，DeepSeek团队还将R1的SFT数据蒸馏后喂给其他小模型进行SFT，结果这些小模型的性能也得到了显著提升。这一发现不仅验证了“小模型，好老师”的技术路线，更让个人开发者也能调教出匹敌GPT-4的AI。这一成果无疑为全球开源社区带来了巨大的鼓舞和启示。

DeepSeek的成功，不仅证明了开源模型的实力，更向世界展示了中国年轻人的潜力和开创精神。正如梁文锋所说：“中国AI不可能永远处在跟随的位置。”DeepSeek的崛起，无疑为中国AI行业的发展注入了新的活力和信心。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

白银多头蓄势待发，能否一举突破31.70-31.75美元关键阻力？

02-05

AI新星DeepSeek崛起，哈佛教授叹美国错失“钱学森级”人才

02-05

红利指数今日下跌，高股息低波动策略投资价值几何？

02-05

春节消费火热！日均销售收入涨超10%，消费ETF如何布局核心资产？

02-05

全球半挂车制造巨头2024年产量揭晓，TOP10企业上半场谁领风骚？

02-05

中通快递盘前上涨，中金看好其作为快递龙头的长期投资潜力

02-05

科技巨头争相布局DeepSeek，云计算与AI ETF产品成产业发展新引擎？

02-05

春晚营销大战落幕，哪家酒企夺得了流量桂冠？

02-05

DeepSeek概念股领航市场，机器人概念再掀热潮，股市涨跌何解？

02-05

DeepSeek开源大模型助推，AI+数据产业迎来新飞跃？

02-05

安井食品海外寻新增量，火锅丸子预制菜国内遇冷怎么办？

02-05

美邮暂停接收中港国际包裹，电商货运受阻何解？

02-05

中国对美LNG征15%关税生效，中石油受影响几何？

02-05

汉马科技等联手成立新能源公司，醇氢动力注册资本达3000万

02-05

张雪峰教育科技公司新晋苏州永鑫开拓二号股权投资合伙人

02-05

点击查看更多 +

全站最新

春节消费火热！日均销售收入涨超10%，消费ETF如何布局核心资产？

雷军官宣：小米双Ultra月底来袭，SU7 Ultra提前发布有何新惊喜？

刘元章正式获任中再产险董事长

雷军官宣：小米15 Ultra与SU7 Ultra月底齐发，有何玄机？

乐聚机器人冷晓琨：人形机器人商业化分三步走，助力产业升级

安井食品海外寻新增量，预制菜降温后能否“卷”出新天地？

热门内容

本栏最新

春节消费火热！日均销售收入涨超10%，消费ETF如何布局核心资产？

全球半挂车制造巨头2024年产量揭晓，TOP10企业上半场谁领风骚？

中通快递盘前上涨，中金看好其作为快递龙头的长期投资潜力

科技巨头争相布局DeepSeek，云计算与AI ETF产品成产业发展新引擎？

DeepSeek概念股领航市场，机器人概念再掀热潮，股市涨跌何解？

DeepSeek开源大模型助推，AI+数据产业迎来新飞跃？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.