ITBear旗下自媒体矩阵:

小米MiMo惊艳亮相!7B参数大模型在数学推理中超越OpenAI与阿里

   时间:2025-04-30 16:47:04 来源:华尔街见闻编辑:快讯团队 发表评论无障碍通道

在人工智能领域的激烈竞争中,小米公司近期宣布加入战局,推出了其自主研发的开源大模型——MiMo。这一消息于4月30日正式公布,瞬间引起了业界的广泛关注。

MiMo模型的最大亮点在于其强大的推理能力,尽管仅拥有7B的参数规模,但在数学推理和代码竞赛方面的表现却令人瞩目。在AIME 24-25数学推理和LiveCodeBench v5代码竞赛的公开测评中,MiMo成功超越了OpenAI的闭源模型o1-mini以及阿里巴巴32B规模的QwQ模型,这一成就无疑是对小米技术实力的一次有力证明。

小米方面表示,MiMo模型自诞生之初就致力于挖掘和提升模型的推理潜能。为了实现这一目标,小米团队在预训练和后训练两个阶段都进行了大量的创新工作。在预训练阶段,他们精心挑选了富含推理模式的语料,并合成了约200B tokens的推理数据,通过三阶段策略逐步提升训练难度,累计训练了25T tokens。

后训练阶段的创新更是关键所在。小米团队提出了“Test Difficulty Driven Reward”机制,有效解决了困难算法问题中奖励稀疏的难题,并引入了“Easy Data Re-Sampling”策略,显著提升了强化学习训练的稳定性。他们还设计了“Seamless Rollout”系统,使得强化学习训练速度和验证速度分别提升了2.29倍和1.96倍。

小米在AI领域的全面投入不仅体现在MiMo模型的研发上,还表现在其硬件和人才布局上。据知情人士透露,小米正在搭建自己的GPU万卡级集群,这一计划已经实施数月之久,并由小米创始人雷军亲自参与领导。在人才方面,小米也吸引了众多顶尖AI人才的加入,如DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,她或将领导小米的大模型团队。

MiMo模型的推出不仅让小米在AI领域站稳了脚跟,更让广大网友看到了小米在AI技术上的潜力和前景。在社交平台上,网友们纷纷表达了对MiMo的期待和赞赏,认为它将成为小米AI生态的重要一环,为米家产品带来更加智能和便捷的体验。有网友甚至表示,小米的小爱同学将因MiMo的加入而得到史诗级的加强。

MiMo-7B的全系列模型均已实现开源,这一举措为全球开发者提供了极大的便利。网友们纷纷称赞小米的开源精神,认为这将有助于推动AI技术的进一步发展和普及。随着小米在AI领域的不断投入和创新,我们有理由相信,未来小米将为我们带来更多惊喜和突破。

 
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version