ITBear旗下自媒体矩阵:

95后AI“天才少女”罗福莉:雷军千万年薪招募的幕后英雄?

   时间:2024-12-31 08:03:07 来源:成都商报cdsb作者:成都商报cdsb编辑:快讯团队 发表评论无障碍通道

近日,一款名为DeepSeek的国产AI大模型在国际舞台上大放异彩,其背后的故事同样引人瞩目,特别是关于一位95后的AI“天才少女”罗福莉。

DeepSeek由中国知名量化私募公司幻方量化旗下的AI大模型研究开发部门——深度求索公司推出。最近,深度求索宣布其最新版本的DeepSeek-V3模型已正式上线并同步开源。这款由深度求索自研的MoE(混合专家大模型)不仅性能卓越,能够媲美甚至超越全球顶级的开源及闭源模型,而且训练成本极低,被誉为“AI界的拼多多”,引发了国内外AI领域的高度关注。

与此同时,罗福莉这个名字也随DeepSeek一起走进了公众视野。作为DeepSeek-V2的关键开发者之一,罗福莉在AI领域的才华得到了广泛认可。据报道,小米创始人雷军已向她抛出橄榄枝,以千万年薪邀请她加入小米AI实验室,领导大模型团队。

罗福莉的学术背景同样令人瞩目。她本科就读于北京师范大学计算机专业,硕士则毕业于北京大学计算语言学专业。早在2019年,还在北大读硕士的她就在人工智能领域顶级国际会议ACL上发表了8篇论文,其中2篇为第一作者,这一成就迅速登上了知乎热搜。罗福莉在回应这一热搜时表示,这是她近一年的努力成果,同时也承认有运气的成分。

毕业后,罗福莉加入了阿里达摩院,从事预训练语言模型相关研究,并主导开发了多语言预训练模型VECO。2022年,她加入幻方量化,从事深度学习相关策略建模和算法研究。随后,她跳槽到DeepSeek,参与了MoE大模型DeepSeek-V2的研发。

在DeepSeek-V2发布后,罗福莉在知乎上发表了对该模型的看法,她认为DeepSeek-V2的中文水平处于国内外闭源模型的第一梯队,而且性价比极高,价格仅为GPT4的百分之一。这一观点得到了业内人士的广泛认同。

罗福莉被小米重金招入,也是小米全面发力AI大模型的一个缩影。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,与合作伙伴共同开拓更多机会。今年11月,小米还成立了专门的AI平台部,由小米的元老级技术大牛张铎负责。张铎本硕毕业于清华计算机系,是雷军公开称赞的“小米的大神”。

为了在大模型研发上取得突破,小米不仅在招募人才方面下足了功夫,还在算力储备上持续投入。据报道,小米正着手搭建自己的GPU万卡集群,并在过去几个月里不断提升算力供给。雷军在公开演讲中表示,小米做大模型的思路与其他公司不同,更注重轻量化和本地部署。对于小米这样注重“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,是雷军考虑的核心问题。而罗福莉的加入,或许正是小米在这一领域取得突破的关键。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version