小米首个推理大模型Xiaomi MiMo开源

作者：AI在线 2025-04-30 10:00

2025年4月30日，小米公司宣布开源其首个为推理（Reasoning）而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步，特别是在推理能力的提升上取得了显著进展。「Xiaomi MiMo」的诞生旨在探索如何激发模型的推理潜能，特别是在预训练增长见瓶颈的情况下。

2025年4月30日，小米公司宣布开源其首个为推理（Reasoning）而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步，特别是在推理能力的提升上取得了显著进展。

「Xiaomi MiMo」的诞生旨在探索如何激发模型的推理潜能，特别是在预训练增长见瓶颈的情况下。该模型在数学推理（AIME24-25）和代码竞赛(LiveCodeBench v5)公开测评集上表现出色，仅用7B的参数规模就超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

微信截图_20250430095124.png

在强化学习方面，MiMo-7B的潜力显著领先于其他广泛使用的强化学习起步模型，如DeepSeek-R1-Distill-7B和Qwen2.5-32B。这一成就得益于MiMo在预训练和后训练阶段的多层面创新。在预训练阶段，MiMo着重挖掘富推理语料，并合成了约200B tokens的推理数据。训练过程中，MiMo进行了三阶段训练，逐步提升训练难度，总训练量达到25T tokens。

在后训练阶段，MiMo的核心是高效稳定的强化学习算法和框架。为此，MiMo提出了Test Difficulty Driven Reward策略，以缓解困难算法问题中的奖励稀疏问题，并引入Easy Data Re-Sampling策略，以稳定RL训练。此外，MiMo还设计了Seamless Rollout系统，使得RL训练加速2.29倍，验证加速1.96倍。

MiMo-7B全系列已开源，用户可在HuggingFace上找到相关模型:[XiaomiMiMo]（https://huggingface.co/XiaomiMiMo）。

70亿参数干翻320亿？小米扔出“核弹级”AI MiMo 你的“破电脑”也能跑赢奥数题和复杂代码！

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现了在数学、代码和通用推理任务上的卓越性能，超越了多个32亿参数以上的基线模型。社交平台上的热烈讨论凸显了其对AI社区的深远影响，相关细节已通过Hugging Face(huggingface.co/xiaomi/MiMo-7B)与小米官网(xiaomi.com)公开。

4/30/2025 2:00:40 PM

AI在线

小米多模态大模型Xiaomi MiMo-VL开源

近日，小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒，在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B，在GUI Grounding任务上的表现更是可与专用模型相媲美，为Agent时代的到来做好了准备。 MiMo-VL-7B在多模态推理任务上成绩斐然，尽管参数规模仅为7B，却在奥林匹克竞赛（OlympiadBench）和多个数学竞赛(MathVision、MathVerse)中大幅领先参数规模10倍大的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview，同时也超越了闭源模型GPT-4o。

5/30/2025 10:01:14 AM

AI在线

小米首个推理大模型开源Xiaomi MiMo，70 亿参数

全球知名科技公司小米正式发布其首个针对推理（Reasoning）而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈，探索如何更有效地激发模型的推理潜能。 MiMo 的推出标志着小米在人工智能领域的一次重要尝试，尤其是在数学推理和代码竞赛方面，表现出色。

4/30/2025 2:00:40 PM

AI在线

小米首个推理大模型Xiaomi MiMo开源

相关资讯

70亿参数干翻320亿？小米扔出“核弹级”AI MiMo 你的“破电脑”也能跑赢奥数题和复杂代码！

小米多模态大模型Xiaomi MiMo-VL开源

小米首个推理大模型开源Xiaomi MiMo，70 亿参数