ITBear旗下自媒体矩阵:

小米“天才少女”罗福莉首秀,AI新棋局下人车家生态加速进化

   时间:2025-12-18 22:22:55 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

在近期举办的小米“人车家全生态大会”上,备受瞩目的“天才少女”罗福莉以新身份亮相,正式推出了小米最新研发的模型MiMo-V2-Flash。这一动作标志着小米在人工智能领域迈出了重要一步,也引发了外界对这家硬件巨头AI战略的广泛关注。

MiMo-V2-Flash并非传统意义上的“大模型”,其参数规模为309B,激活参数仅15B。罗福莉在发布会上坦言,这一尺寸甚至让她不愿称之为大模型。然而,正是这个“小而精”的模型,在特定方向上展现了卓越性能。小米团队将其定位为Agent基座模型,重点优化了高性价比和快速响应能力。据介绍,该模型每秒可生成150个tokens,成本极低,同时在性能上保持了高水平表现。

在公开评估榜单上,MiMo-V2-Flash的代码能力和Agent能力已跻身全球开源模型前列。罗福莉透露,该模型在多数基准测试中已超越或持平DeepSeek-V3、Kimi K2-Thinking、Qwen等知名模型,而参数规模仅为后者的1/2至1/3。这一成绩引发了业界热议,部分观点认为其代码能力领先,也有人质疑这是“刷分”行为。

无论争议如何,小米对AI的投入已显而易见。选择在生态大会上发布新模型,凸显了AI在小米战略中的核心地位。面对智能终端和智能驾驶两大场景,小米提出了明确目标:在终端侧,通过轻量化模型和端侧部署升级“超级小爱”和澎湃OS;在智驾领域,则需大模型作为基座提升能力上限。

罗福莉在演讲中指出,当前模型学习方向与生物智能进化存在背离,单纯依靠规模扩张已难以实现更高阶智能。小米因此选择了差异化路径——开发参数小、性能优、成本低的模型。她解释称,Scaling Law的边际效益正在递减,行业范式正从预训练转向后训练。为此,MiMo-V2-Flash的优化聚焦于三个关键点:强化代码和工具调用能力以实现高效沟通;通过极高推理效率突破智能体间信息传递瓶颈;以及通过稳定范式激发强化学习潜能。

从技术架构看,小米采用了混合注意力机制,具体为5:1比例的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。实验数据显示,SWA在长文本处理和推理能力上优于主流线性注意力机制,且固定大小的KV Cache更易适配现有基础设施。这一选择并非小米独创,月之暗面、MiniMax等企业也曾探索类似方向。

尽管MiMo-V2-Flash在推理速度和价格上表现亮眼——其API定价仅为Claude Sonnet 4.5的2.5%,生成速度却是后者两倍——但309B的规模仍使其距离端侧落地存在差距。罗福莉在演讲结尾抛出的观点更具前瞻性:“AI进化的下一阶段需要能与真实环境交互的物理模型,我们要打造的不是程序,而是具备物理一致性和时空连贯性的虚拟宇宙。”

小米的AI布局已呈现清晰脉络。2025年以来,该公司动作频繁:4月开源MiMo-7B系列,5月发布多模态视觉理解模型MiMo-VL-7B,11月推出整合自动驾驶与机器人技术的具身智能大模型MiMo-Embodied,最终以MiMo-V2-Flash收官。这一系列举措背后是巨额投入——小米集团总裁卢伟冰透露,2025年研发投入将超300亿元,其中四分之一投向AI领域,未来五年计划投入超2000亿元。

组织架构调整同样印证了小米的决心。自2024年起,小米开始搭建AI Infra平台,并着手建设GPU万卡集群,成立时即拥有6500张GPU资源。人才方面,除罗福莉负责基础大模型外,小米还引入陈龙加盟智驾团队。这种“双核”配置已初见成效:陈龙团队提出的跨具身基座模型MiMo-Embodied,成为全球首个打通自驾与具身操作的开源模型,试图解决自动驾驶与机器人间的知识迁移难题。

雷军曾将小米的AI战略概括为“轻量化+本地部署”。凭借全球超10亿台设备的连接优势,小米正试图通过AI重构业务逻辑。MiMo-V2-Flash的发布不仅是技术展示,更是小米向资本市场和用户传递的新信号:这家硬件企业正通过掌握高效AI模型和庞大硬件生态,在智能时代寻求彻底转型。能否将技术落地为用户可感知的体验,将成为这一战略成败的关键。

 
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version