AI在线 AI在线

ChatGLM 3

奖励模型:为什么要用评估专家及其设计方案

大模型最根本的价值就是替代人的工作,而在训练大模型的过程中,还有很多操作是需要人工的。 比如数据工程里的数据质量检查、模型评估阶段的人工测评等。 关于这个问题,我的答案是使用评估专家模型技术,让这些过程实现完全无人化。
9/26/2025 2:11:00 AM
greencoatman
  • 1