AI反馈

重大突破！研究团队揭示大语言模型内部潜藏的 “奖励机制”

重大突破！研究团队揭示大语言模型内部潜藏的 “奖励机制”

近日，南京大学的周志华教授团队发布了一项重要研究，首次理论证明了在大语言模型中可以发现内源性奖励模型，并有效应用强化学习（RL）来提升模型表现。当前，许多对齐方法依赖于人类反馈强化学习（RLHF），这种方法需要大量高质量的人类偏好数据来训练奖励模型。然而，构建这样一个数据集不仅耗时费力，还面临成本高昂的挑战。

7/2/2025 6:00:45 PM

AI在线

1

资讯热榜

6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享早鸟票倒计时3天｜第四届全国大模型智能生成大会（LMG 2025） OpenAI 为 ChatGPT 推出智能记忆清理功能，Plus 用户率先体验 Claude 与 Microsoft 365 深度整合，企业效率再提升！ AI音乐创作成程序员新副业：单曲播放破200万，版权收入数万元报告揭示互联网新趋势：超半数新内容由 AI 生成 Karpathy的nanochat：百元就能造ChatGPT？AI圈炸锅了！美国女子使用ChatGPT生成号码购彩中奖10万美元：概率事件而非AI预测能力

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练论文 LLM 代码算法芯片 Stable Diffusion AI for Science 苹果腾讯 Claude Agent 蛋白质开发者生成式神经网络 xAI 机器学习 3D 人形机器人研究生成 AI视频百度大语言模型 Sora GPU 具身智能工具 RAG 华为计算字节跳动 AI设计搜索 AGI 大型语言模型视频生成场景深度学习架构 DeepMind 视觉预测 Transformer 伟达编程 AI模型生成式AI 特斯拉亚马逊