AI在线 AI在线

ROLL

从繁杂技巧到极简方案:ROLL团队带来RL4LLM新实践

本研究由淘天集团算法技术—未来生活实验室与爱橙科技智能引擎事业部联合完成,核心作者刘子贺,刘嘉顺, 贺彦程和王维埙等。 未来生活实验室汇聚淘天集团的算力、数据与顶尖技术人才,专注于大模型、多模态等前沿 AI 方向,致力于打造基础算法、模型能力及各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。 爱橙科技则在大模型训练与优化方面具有丰富的实践经验。
8/22/2025 1:50:00 PM
机器之心
  • 1