在科技界的最新动态中,国产大型AI模型DeepSeek在全球范围内引发了热烈讨论,特别是其背后的95后AI“天才少女”罗福莉更是备受瞩目。罗福莉作为DeepSeek-V2研发的关键人物,其才华与贡献在AI领域掀起了不小的波澜。
小米公司的创始人雷军显然也注意到了这股AI热潮,特别是在DeepSeek即将发布其最新版本V3之际。据知情人士透露,雷军不惜重金,开出了千万元年薪的优厚条件,意在吸引罗福莉加入小米,领导其AI大模型团队。这一举动不仅体现了小米对AI技术的重视,也预示着公司在该领域将加大投入与布局。
事实上,小米在AI领域的动作频频。早在今年11月,小米就成立了专门的AI平台部,由公司元老级技术专家张铎亲自挂帅。张铎在计算机领域有着深厚的学术背景和实践经验,他的加入无疑为小米的AI发展注入了新的活力。小米还在积极搭建GPU万卡集群,这一举措将大幅提升公司的AI计算能力,为未来的技术创新提供有力支持。
与此同时,DeepSeek的崛起也引起了业界的广泛关注。近日,DeepSeek发布了新一代大语言模型DeepSeek-V3,并宣布开源。这款模型在多项基准测试中表现出色,不仅超越了众多主流开源模型,还与世界顶尖的闭源模型相媲美。尤为DeepSeek-V3的训练成本极低,被称为“AI界的拼多多”,其高性价比引发了国内外科技界的惊叹。
据DeepSeek发布的技术报告显示,DeepSeek-V3的参数量高达671B,激活参数为37B,使用的预训练token量达到了14.8万亿。在评测中,它超越了阿里的Qwen2.5-72B和metadeLlama-3.1-405B等其他开源模型。同时,其训练成本仅为GPT-4o的二十分之一,售价也相对较低,输入+输出价格约为GPT-4o的十分之一。这一系列数据充分展示了DeepSeek-V3在性价比方面的优势。
而DeepSeek的爆红,也让其背后的关键人物罗福莉走到了台前。这位95后的AI“天才少女”,本科就读于北京师范大学计算机专业,硕士则毕业于北京大学计算语言学专业。在校期间,她就在人工智能领域取得了不俗的成绩,曾在顶级国际会议ACL上发表过多篇论文。毕业后,她先后就职于阿里达摩院和幻方量化,从事人工智能研究和深度学习相关策略建模工作。如今,她已成为DeepSeek的深度学习研究员,参与了DeepSeek-V2的研发工作。
罗福莉的才华与经历,无疑让她成为了AI领域的佼佼者。而小米的雷军显然也看到了她的潜力与价值,不惜重金招揽她加入小米。这一举动不仅体现了小米对人才的重视与渴求,也预示着公司在AI领域将迎来新的发展机遇与挑战。