滚动资讯

当前位置：财经 > 信息流 > 正文内容

95后AI天才少女助阵，DeepSeek大模型火爆全网，雷军千万年薪抢人才！

时间：2024-12-29 20:13:53 来源：证券时报e公司作者：ITBEAR编辑：快讯团队 发表评论无障碍通道

在AI界，一个名为DeepSeek的公司悄然崛起，其最新发布的大语言模型DeepSeek-V3迅速吸引了全球的目光。与此同时，一位95后的AI“天才少女”罗福莉也随之走入了公众的视野，她因在DeepSeek的关键角色而备受瞩目。

DeepSeek-V3凭借其卓越的性能，成功超越了多个知名开源模型，包括阿里的Qwen2.5-72B和meta的Llama-3.1-405B，甚至与世界顶尖的闭源模型如GPT-4和Claude-3.5-Sonnet不相上下。据技术报告显示，DeepSeek-V3的参数量高达671B，激活参数为37B，使用的预训练token量更是达到了14.8万亿。

令人惊讶的是，DeepSeek-V3在如此卓越的性能背后，却拥有极低的训练成本。据DeepSeek官方透露，整个训练过程仅用了不到280万GPU小时，相比之下，meta的Llama-3405B的训练时长则高达3080万GPU小时。若以H800的租金为每GPU小时2美元计算，DeepSeek-V3的总训练成本仅为不到600万美元，不及Llama-3405B训练成本的十分之一。

DeepSeek由国内量化资管巨头幻方量化于2023年创立，专注于开发先进的大语言模型和相关技术。其早在半年前发布的DeepSeek-V2就因性能达GPT-4级别，且开源、可免费商用、API价格极低而引发了业内关注。DeepSeek之所以能实现如此高的性价比，得益于其创新的架构，如MLA（多头潜在注意力）和前馈网络方面的DeepSeekMoE架构等。

DeepSeek不仅以高性价比的大模型赢得了市场的认可，还成为了国内大模型价格战的源头和推动者。在其发布DeepSeek-V2之后，字节、阿里、百度等厂商纷纷跟进降价。同时，DeepSeek也是中国互联网大厂以外，唯一一家储备了万张A100芯片的公司，为其技术研发提供了坚实的算力基础。

随着DeepSeek-V3的爆火，背后的AI“天才少女”罗福莉也备受关注。据报道，小米创始人雷军以千万年薪招揽了这位DeepSeek开源大模型DeepSeek-V2的关键开发者之一，让她领导小米AI大模型团队。罗福莉本科就读于北京师范大学计算机专业，硕士毕业于北京大学计算语言学专业，曾在阿里达摩院从事预训练语言模型相关工作，并在幻方量化和DeepSeek担任深度学习研究员。

罗福莉的加入，是小米全面发力AI大模型的一个重要举措。小米自2023年4月正式组建了AI实验室大模型团队以来，一直在不断挖掘AI相关的用户场景，并发挥自身技术优势，以开放的态度与合作伙伴开拓更多机会。为了支持大模型的研发，小米还正着手搭建自己的GPU万卡集群，并持续提升算力储备。

对于小米这样在手机和造车领域都讲究“性价比”的公司而言，如何在烧钱的大模型业务中平衡成本，无疑是雷军考虑的核心问题。而罗福莉因其在DeepSeek-V2研发中的出色表现，以及她对性价比的深刻理解，或许正是雷军看中她的原因。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

多家公司动态：中色股份增持，一拖股份拖拉机销量增长

12-29

A股药企维康药业及其实控人遭证监会立案，背后有何隐情？

12-29

六足机器人：冰壶高手还要探月，六条腿如何稳中求胜？

12-29

加航飞机硬着陆跑道起火，哈利法克斯机场紧急关闭

12-29

广州地铁11号线通车，能否改写“东强西弱”的城市格局？

12-29

深海逐梦！中国载人深潜1433次，探索三号入列开启新篇章

12-29

2024中国航天辉煌篇章：星辰大海，我们这样逐梦！

12-29

六足机器人：冰壶高手还要探月，六条腿有何过人之处？

12-29

中国载人深潜突破！1433次下潜书写深海探索新篇章

12-29

荷兰皇家航空波音737客机液压故障，紧急降落时偏离跑道！

12-29

六足机器人：从冰壶赛场到月球探测，六条腿的科技力量有多强？

12-29

2024中国航天辉煌篇章：星辰征途，哪些瞬间让你难忘？

12-29

2024中国航天辉煌篇章：星辰大海，我们一直在路上！

12-29

中国载人深潜：挺进深海千余次，书写新历史！

12-29

太空行走：航天员如何跨越重重难关，实现“感觉良好”？

12-29

点击查看更多 +

全站最新

A股药企维康药业及其实控人遭证监会立案，背后有何隐情？

六足机器人：冰壶高手还要探月，六条腿如何稳中求胜？

加航飞机硬着陆跑道起火，哈利法克斯机场紧急关闭

抖音电商搜索流量爆发，商家如何把握新机遇？

B2-W机器狗量产带动机器人板块，铜缆高速连接概念股未来增长可期？

跨年盛宴：众多大咖齐上阵，跨年演讲还火吗？

热门内容

本栏最新

广州地铁11号线通车，能否改写“东强西弱”的城市格局？

深海逐梦！中国载人深潜1433次，探索三号入列开启新篇章

2024中国航天辉煌篇章：星辰大海，我们这样逐梦！

六足机器人：冰壶高手还要探月，六条腿有何过人之处？

中国载人深潜突破！1433次下潜书写深海探索新篇章

荷兰皇家航空波音737客机液压故障，紧急降落时偏离跑道！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.