小米再出AI黑马！开源多模态大模型 MiMo-VL-7B-2508 性能大幅跃升，支持思考模式切换

作者：AI在线 2025-08-12 09:41

小米宣布开源全新版本的多模态大模型——Xiaomi MiMo-VL-7B-2508，并同步推出 SFT 和 RL 两个模型版本。此次升级不仅优化了输出模式，还提升了 RL 训练的稳定性，在多项能力评测中取得了显著进步。同时，用户还可以在“思考模式”和“非思考模式”之间灵活切换，以适应不同场景需求。

与今年5月发布的 MiMo-VL-7B-RL 相比，新版本在多项权威 benchmark 上实现了突破:

学科推理测试 MMMU:从66.7提升至70.6，首次突破70分

文档理解测试 ChartQA:从91.7提升至94.4

GUI 定位测试 ScreenSpot-v2:从90.5提升至92.5

视频理解测试 VideoMME:从67.4提升至70.8

在交互体验上，新版本引入了自主控制的思考模式切换功能。默认的“思考模式”会展示完整推理过程，性能更全面且控制成功率达100%;而“非思考模式”则跳过推理环节，响应速度更快，控制成功率为99.84%，适合对实时性要求高的任务。

小米再出AI黑马！开源多模态大模型 MiMo-VL-7B-2508 性能大幅跃升，支持思考模式切换

根据小米内部 VLM Arena 评分，新版 MiMo-VL-7B-RL-2508获得了1131.2分，明显高于上一代的1093.9分。评测结果显示，该模型在多数基准测试中全面超越前代版本，即便在非思考模式下，也能在感知类任务中保持出色表现。与同类支持思考功能的多模态开源模型相比，MiMo-VL-7B-RL-2508依旧处于领先地位。

小米多模态大模型Xiaomi MiMo-VL开源

近日，小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒，在多个领域展现出了强大的实力。该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B，在GUI Grounding任务上的表现更是可与专用模型相媲美，为Agent时代的到来做好了准备。 MiMo-VL-7B在多模态推理任务上成绩斐然，尽管参数规模仅为7B，却在奥林匹克竞赛（OlympiadBench）和多个数学竞赛(MathVision、MathVerse)中大幅领先参数规模10倍大的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview，同时也超越了闭源模型GPT-4o。

5/30/2025 10:01:14 AM AI在线

70亿参数干翻320亿？小米扔出“核弹级”AI MiMo 你的“破电脑”也能跑赢奥数题和复杂代码！

小米正式在Hugging Face平台发布其首个专为推理（Reasoning）设计的开源大模型——MiMo-7B。据AIbase了解，MiMo-7B通过从预训练到后训练的强化学习(RL)优化，展现了在数学、代码和通用推理任务上的卓越性能，超越了多个32亿参数以上的基线模型。社交平台上的热烈讨论凸显了其对AI社区的深远影响，相关细节已通过Hugging Face(huggingface.co/xiaomi/MiMo-7B)与小米官网(xiaomi.com)公开。

4/30/2025 2:00:40 PM AI在线

小米首个推理大模型Xiaomi MiMo开源

2025年4月30日，小米公司宣布开源其首个为推理（Reasoning）而生的大模型「Xiaomi MiMo」。这一模型的发布标志着小米在人工智能领域迈出了重要的一步，特别是在推理能力的提升上取得了显著进展。「Xiaomi MiMo」的诞生旨在探索如何激发模型的推理潜能，特别是在预训练增长见瓶颈的情况下。

4/30/2025 10:00:55 AM AI在线

小米再出AI黑马！开源多模态大模型 MiMo-VL-7B-2508 性能大幅跃升，支持思考模式切换

相关资讯

小米多模态大模型Xiaomi MiMo-VL开源

70亿参数干翻320亿？小米扔出“核弹级”AI MiMo 你的“破电脑”也能跑赢奥数题和复杂代码！

小米首个推理大模型Xiaomi MiMo开源