在科技界的最新动态中,一位95后的AI“天才少女”罗福莉成为了焦点人物,她的加入让小米公司在AI大模型领域的布局备受瞩目。据悉,小米创始人雷军亲自出手,以千万年薪的待遇成功招募了这位关键人才,让她领导小米的AI大模型团队。
罗福莉的学术背景令人瞩目,她本科就读于北京师范大学计算机专业,后在北京大学攻读计算语言学硕士学位。早在2019年,还在北大读硕士的她便在人工智能领域的顶级国际会议ACL上发表了8篇论文,其中包括两篇第一作者的作品,这一成就迅速让她在学术界崭露头角。罗福莉在知乎上的回应中谦逊地表示,这是近一年的努力成果,同时也有运气的成分。
毕业后,罗福莉的职业生涯同样精彩纷呈。她首先在阿里达摩院从事人工智能研究,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。之后,她加入幻方量化,从事深度学习相关策略建模和算法研究。最终,她跳槽到DeepSeek,担任深度学习研究员,参与研发了MoE大模型DeepSeek-V2。
DeepSeek-V2的发布让罗福莉再次受到关注。她在知乎上发表了对该模型的看法,认为其中文水平处于国内外闭源模型的第一梯队,且价格仅为GPT4的百分之一,堪称性价比之王。这一评价无疑为DeepSeek-V2增添了更多光彩。
小米在AI大模型领域的布局远不止于此。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势。今年11月,小米成立了专门的AI平台部,由元老级技术大牛张铎负责。张铎在清华计算机系本硕毕业,被雷军誉为“小米的大神”,并赠予“铎神”的称号。
小米在招聘市场上也展现出对AI大模型人才的强烈需求。在北京地区,小米招聘的大模型相关岗位多达59个。小米正在搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划由雷军亲自领导,显示出小米在AI大模型领域的决心和投入。
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年将攀升至300亿元。他预计,自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。小米自2016年组建AI团队以来,相关领域人员规模已达3000多人。
在二级市场上,加码AI算力是小米近期股价上涨的主要驱动因素之一。小米汽车宣布其SU7全年交付量已超过13万辆,提前完成全年目标。这一消息也进一步提振了小米的股价。2024年12月27日,小米股价创下2022年以来新高,盘中触及34.95港元/股。
雷军在公开演讲中曾表示,小米做大模型的思路与众不同,选择主力突破的是轻量化和本地部署。对于小米这样注重“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而罗福莉拥有DeepSeek-V2的研发背景,或许正是雷军看重她的原因之一。
小米集团的财报显示,今年第三季度,小米集团实现总收入925亿元,同比增长30.5%;实现经调整净利润63亿元,同比增长4.4%。其中,智能电动汽车等创新业务收入97亿元,毛利率环比提升1.7个百分点至17.1%,净亏损持续收窄至15亿元。这些成绩无疑为小米在AI大模型领域的进一步投入提供了坚实的支撑。