AI在线 AI在线

蚂蚁开源轻量级MoE推理模型Ring-lite

近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。 该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。 Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。

近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。

Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。凭借独创的C3PO强化学习训练方法,Ring-lite在AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等多项推理榜单上表现优异,比肩3倍激活参数大小的10B以下Dense模型。

在技术实现上,Ring-lite团队进行了多项创新。首创的C3PO强化学习训练方法有效解决了RL训练中回复长度波动导致的优化难题,显著改善了训练不稳定和吞吐波动问题。同时,团队还探讨了Long-CoT SFT与RL的黄金训练比重,从token efficiency角度提出了基于entropy loss来平衡训练效果和样本效率的方案,进一步提升了模型性能。

微信截图_20250621162245.png

此外,Ring-lite还直面了多领域数据联合训练的难题,系统验证了混合训练与分阶段训练的优劣边界,在数学、代码、科学三重领域实现了协同增益。在多项复杂推理任务中,Ring-lite均展现出了出色的性能,尤其在数学推理和编程竞赛方面,得分领先于对比模型。

为了验证Ring-lite的实际应用效果,团队还进行了高考数学和物理题的测试。结果显示,Ring-lite在数学全国一卷上可以获得130分左右的成绩,表现优异。

蚂蚁技术团队表示,Ring-lite的开源不仅包含了模型权重和训练代码,还将逐步公开所有训练数据集、超参配置乃至实验记录。这可能是轻量级MoE推理模型首次实现全链路透明化,为相关领域的研究人员提供了宝贵的参考资源。

GitHub:

https://github.com/inclusionAI/Ring

Hugging Face:

https://huggingface.co/inclusionAI/Ring-lite

ModelScope:

https://modelscope.cn/models/inclusionAI/Ring-lite

相关资讯

Ring 门铃与摄像头迎来 AI 升级:提供详细运动事件描述,隐私引关注

亚马逊旗下的智能家居安全公司 Ring 于本周三宣布,将在其门铃和摄像头产品中引入一项创新的人工智能功能。 这项新功能将为用户提供其设备检测到的运动活动的具体文本描述,从而显著提升实时通知的清晰度。 现在,当用户收到关于房屋周围事件的实时通知时,更新后的信息将更加详细和直观。
6/26/2025 10:01:28 AM
AI在线

好潮!日本又造了个「美丽小废物」,卖926元

AI好好用报道编辑:杨文长得很有科技感,就是AI含量有点低。 上个月,韩国女团成员 Jennie 在单曲《Mantra》MV 中,佩戴了一款黄色戒指表,圈粉无数。 它是美国品牌 Steve Madden 打造的一款时尚单品,巧妙地将手表元素融入戒指之中,充满创意和现代感。
11/21/2024 5:55:00 PM
AI好好用

Freepik 发布“F Lite”:一个为版权安全而构建的开放 AI 图像模型

西班牙数字图形巨头 Freepik 近日推出了其最新的文本到图像生成模型“F Lite”,旨在成为 Midjourney 等因版权问题而备受争议的生成器的合法且安全的替代品。 F Lite 拥有约100亿个参数,其独特之处在于完全基于 Freepik 自身商业授权的图像库进行训练。 Freepik 声称,这使其成为首个完全依赖“工作安全”内容进行训练的如此规模的公开模型。
5/6/2025 10:01:20 AM
AI在线
  • 1