AI在线 AI在线

SAPO算法

"顿悟"会传染,94%性能跃升:SAPO如何用“共享经验”重构小模型RL训练

大家好,我是肆〇柒。 我看到了一个很有趣的研究,它涉及经验共享,群体RL进化。 今天我们要探讨的,不是来自谷歌或OpenAI的最新成果,而是一家名为Gensyn AI的前沿研究团队提出的革命性想法。
9/15/2025 9:12:53 AM
肆零柒
  • 1