AI在线 AI在线

小巧却强大的推理引擎!Ring-mini-2.0 震撼发布,性能超越10B模型

今天,我们正式推出了 Ring-mini-2.0,这是一款基于 Ling-mini-2.0架构深度优化的高性能推理型 MoE 模型。 Ring-mini-2.0的总参数量达到16B,但在实际运行中仅需激活1.4B 参数,便能实现相当于10B 级别以下的密集模型的推理能力。 这款模型在逻辑推理、编程和数学任务中表现尤为出色,支持128K 的长上下文,使得其在各种应用场景中都能展现出强大的能力。

今天,我们正式推出了 Ring-mini-2.0,这是一款基于 Ling-mini-2.0架构深度优化的高性能推理型 MoE 模型。Ring-mini-2.0的总参数量达到16B,但在实际运行中仅需激活1.4B 参数,便能实现相当于10B 级别以下的密集模型的推理能力。

这款模型在逻辑推理、编程和数学任务中表现尤为出色,支持128K 的长上下文,使得其在各种应用场景中都能展现出强大的能力。此外,Ring-mini-2.0的生成速度也相当惊人,能够实现300+ token/s 的快速生成,经过优化后更是可以突破500+ token/s。

大模型 元宇宙 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

在推理能力的提升方面,Ring-mini-2.0在 Ling-mini-2.0-base 的基础上进行了更深层次的训练,通过 Long-COT SFT、大规模 RLVR 和 RLHF 的联合优化,显著增强了模型在复杂推理任务中的稳定性和泛化能力。我们在多个高难度基准测试中,发现其性能显著超越了10B 以下的密集模型,甚至可以与一些更大型的 MoE 模型相媲美,特别是在逻辑推理方面表现优异。

此外,Ring-mini-2.0在设计上注重高效性,通过1/32的专家激活比和 MTP 层架构优化,实现了约7-8B 密集模型的等效性能。这种高稀疏度和小激活设计,使得其在 H20环境下可以实现300+ token/s 的推理速度,同时结合 Expert Dual Streaming 的优化,进一步降低了推理成本。

为了促进学术与工业界的研究和应用,Ring-mini-2.0的模型权重、训练策略和数据配方将全面开源。我们期待这款 “小而优” 的模型能够成为小型推理模型的首选,并欢迎大家访问我们的开源仓库进行下载和使用。未来,在 Ling2.0架构的支持下,我们将继续推出更大、更快、更强的语言模型和全模态模型,敬请期待!

相关资讯

蚂蚁开源轻量级MoE推理模型Ring-lite

近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。 该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。 Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。
6/21/2025 5:01:05 PM
AI在线

Ring 门铃与摄像头迎来 AI 升级:提供详细运动事件描述,隐私引关注

亚马逊旗下的智能家居安全公司 Ring 于本周三宣布,将在其门铃和摄像头产品中引入一项创新的人工智能功能。 这项新功能将为用户提供其设备检测到的运动活动的具体文本描述,从而显著提升实时通知的清晰度。 现在,当用户收到关于房屋周围事件的实时通知时,更新后的信息将更加详细和直观。
6/26/2025 10:01:28 AM
AI在线

蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

Ring-1T 已成长为可与闭源巨头正面对话的选手,也是开源体系下闭源级性能的又一次实证。 蚂蚁,又双叒叕开源万亿大模型了! 10 月 9 日凌晨,蚂蚁官宣并开源通用语言大模型 Ling-1T ——迄今为止他们参数规模最大的语言模型。
10/14/2025 2:50:00 PM
机器之心
  • 1