滚动资讯

当前位置：财经 > 财经人物 > 正文内容

95后AI天才少女加盟小米！DeepSeek-V3爆火背后的性价比传奇

时间：2024-12-29 20:05:17 来源：创业资本汇作者：创业资本汇编辑：快讯团队 发表评论无障碍通道

在AI领域，一个名为DeepSeek的创新企业正迅速崛起，其最新发布的DeepSeek-V3大语言模型引发了国内外广泛关注。与此同时，DeepSeek背后的“天才少女”罗福莉也成为了众人瞩目的焦点。

DeepSeek-V3的发布，标志着DeepSeek在AI大模型研发方面取得了重大突破。据技术报告显示，该模型的参数量高达671B，激活参数为37B，使用的预训练token量更是达到了14.8万亿。在多项评测中，DeepSeek-V3的表现超越了阿里的Qwen2.5-72B和meta的Llama-3.1-405B等其他开源模型，甚至在性能上与顶尖的闭源模型如GPT-4和Claude-3.5-Sonnet不相上下。

尤为引人注目的是，DeepSeek-V3在训练效率和成本方面展现出了极高的性价比。据DeepSeek官方透露，整个训练过程仅用了不到280万GPU小时，相比之下，meta旗下的Llama-3405B模型则耗费了3080万GPU小时。如果以H800的租金为每GPU小时2美元来计算，DeepSeek-V3的总训练成本仅为600万美元左右，仅为Llama-3405B训练成本的十分之一。

而DeepSeek之所以能够在性价比方面取得如此优异的成绩，与其背后的技术创新密不可分。DeepSeek专注于开发先进的大语言模型和相关技术，通过创新的架构和算法，实现了更高效的训练和推理。例如，在DeepSeek-V2中，他们就采用了MLA（多头潜在注意力）和前馈网络方面的DeepSeekMoE架构等创新技术，从而在保证性能的同时降低了成本。

DeepSeek的创始人梁文锋，是一位毕业于浙江大学电子工程系的80后技术专家。他始终保持着低调的作风，和所有研究员一样，每天沉浸在“看论文、写代码、参与小组讨论”的工作中。正是这样的专注和投入，让DeepSeek在短时间内取得了如此显著的成果。

除了技术创新和性价比优势外，DeepSeek还以其开源和免费商用的特点赢得了市场的青睐。早在半年前发布的DeepSeek-V2，就因性能达到GPT-4级别但价格仅为GPT-4-Turbo的百分之一而引发了业内关注。这一举措不仅降低了用户的使用成本，也推动了AI技术的普及和应用。

而在DeepSeek-V3爆火之后，背后的“天才少女”罗福莉也进入了人们的视野。据媒体报道，小米创始人雷军以千万年薪招揽了这位DeepSeek开源大模型的关键开发者之一，让她领导小米AI大模型团队。罗福莉本科就读于北京师范大学计算机专业，硕士毕业于北京大学计算语言学专业。她在学术方面有着深厚的造诣和丰富的经验，曾在人工智能领域顶级国际会议ACL上发表多篇论文。

罗福莉的加入，无疑为小米在AI大模型领域的发展注入了新的活力。小米近年来在AI领域持续发力，不仅组建了AI实验室大模型团队，还成立了专门的AI平台部，由元老级技术大牛张铎负责。他们正在不断提升算力储备和技术优势，以开放的态度与合作伙伴开拓更多机会。

对于小米而言，如何在烧钱的大模型业务中平衡成本，无疑是雷军考虑的核心问题。而罗福莉拥有DeepSeek-V2的研发背景，无疑为小米在成本控制和性能优化方面提供了宝贵的经验和支持。她的加入，将助力小米在AI大模型领域取得更加显著的成果。

举报 0 收藏 0 打赏 0评论 0

02-28

雷军“新首富”风波：媒体热炒下的冷静与现实

02-28

特斯拉经理因批评马斯克涉及纳粹玩笑遭解雇

02-28

蜜雪冰城港交所上市在即，创始人兄弟身价直逼星巴克前掌门

02-28

雷军辟谣无效？小米汽车热销，中国首富宝座向他招手

02-28

雷军失眠真相？小米SU7 Ultra开售火爆，2小时订单破万辆完成全年目标

02-28

雷军造车高端化：小米SU7 Ultra引爆市场，能否重塑品牌高端形象？

02-28

OpenAI奥特曼调侃：若Meta挑战，我们反做社交APP会怎样？

02-28

雷军健身打卡上瘾！两月30次，发布会后失眠仍坚持早起锻炼

02-28

GPT-4.5来了！奥特曼透露：惊喜与挑战并存

02-28

雷军激动分享：小米新品发布会后失眠，网友调侃“欠车”能否安睡？

02-28

马斯克紧急动用“星链”救急，美国空中交通管制通信陷危机？

02-28

半导体风云人物：张学政如何以民营企业家精神攀登芯片高峰？

02-28

小米SU7 Ultra车标引热议，雷军：只是24K镀金，别抠了！

02-28

小米SU7 Ultra火爆，雷军发布会后失眠健身，小米集团股价应声上涨

02-28

点击查看更多 +

全站最新

财务造假超5亿，*ST普利遭强制退市！

全球金融市场深夜动荡，美股中概股齐跌，关税磋商能否成转机？

蔚来财报亮眼股价却跌！李斌：降本持续，Q4盈利有信心

03月21日零售资讯

赛晶科技2024年营收增长52.7%至16.1亿元

腾讯北极光A2工作室总经理杨峰离职 MMO赛道竞争激烈引发行业深思

热门内容

本栏最新

雷军“新首富”风波：媒体热炒下的冷静与现实

特斯拉经理因批评马斯克涉及纳粹玩笑遭解雇

蜜雪冰城港交所上市在即，创始人兄弟身价直逼星巴克前掌门

雷军辟谣无效？小米汽车热销，中国首富宝座向他招手

雷军失眠真相？小米SU7 Ultra开售火爆，2小时订单破万辆完成全年目标

雷军造车高端化：小米SU7 Ultra引爆市场，能否重塑品牌高端形象？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.