AI在线 AI在线

Andrej Karpathy 最新访谈:强化学习是糟糕的,只是其他一切都更糟

最近,前特斯拉AI负责人、OpenAI早期成员 Andrej Karpathy 在接受播客节目 Dwarkesh Patel Show 采访时,系统反思了当下AI研究的方向。 原文地址:,“强化学习是糟糕的,只是其他一切都更糟。 ”Karpathy解释,强化学习的问题不在算法的复杂性,而在信息的稀缺性。

最近,前特斯拉AI负责人、OpenAI早期成员 Andrej Karpathy 在接受播客节目 Dwarkesh Patel Show 采访时,系统反思了当下AI研究的方向。

图片

原文地址:https://www.dwarkesh.com/p/andrej-karpathy

这位曾在OpenAI早期推动强化学习与agent模型实验的工程师认为,“强化学习是糟糕的,只是其他一切都更糟。”

Karpathy解释,强化学习的问题不在算法的复杂性,而在信息的稀缺性。

它让模型“吸收监督信号像吸管一样细”,只能根据最终奖励修正一切行为。

他形容这是一种“后知后觉的智能”——模型只能在失败之后学习,却无法在过程中理解。

“人类不会这样学习,”他说。人类在解决问题的同时也在观察自己解决问题的方式。人类会在每次失败后,反思推理路径、调整假设,并形成稳定的内在模型。

而当前的AI模型,只会“赢了就上调所有参数,输了就下调所有参数”。Karpathy称,这种方式浪费了智能最稀缺的资源:过程信息。

他说,真正的智能不是“多次试错”,而是“能在一次错误后推理出规律”。他呼吁研究界转向“过程监督”(process-based learning),而非结果奖励。这种思想已在Google DeepMind与Anthropic内部被反复讨论。

Karpathy指出,“AI研究仍停留在模仿阶段。”他说,当前所有大型语言模型的训练,本质上仍是“人类知识的蒸馏,而非智能的诞生。”

Karpathy在采访中回顾了他在OpenAI早期参与的强化学习项目。

那是2016年前后,业界流行用强化学习训练AI玩Atari游戏、操控虚拟机械臂。

“那时我们都误以为游戏就是智能。”但他后来意识到,这是方向性的误判。

强化学习模型能在封闭环境中获胜,却无法迁移到开放世界。“你可以让它学会打乒乓球,却无法让它学会生活。”

Karpathy总结说:“AI研究在过去十年过于专注‘赢’,而非‘懂’。”

在他看来,这正是“agent模型幻觉”的根源,我们创造了表现出聪明迹象的系统,却没有理解机制本身。

当主持人问他为何预言“这是智能体(agent)的十年,而不是智能体的一年”时,Karpathy的回答显得务实。

“因为我们还远没有造出一个能持续工作的agent。”他认为,AI Agent 真正的瓶颈,不在算法创新,而在“认知的连续性”。

“现在的模型,每次对话后都会重启。没有记忆,没有睡眠,也没有梦。”这不是智能,这是演出。

他指出,若AI无法积累经验并在内部整合,它就永远停留在“临时聪明”的阶段。

他认为未来的模型应当拥有“昼夜循环”:白天执行任务,夜晚消化经验。

这种机制,或许才是人工智能从模仿到理解的真正起点。

一、从模仿人类到理解智能

Karpathy用一句话总结当前AI研究的误区:“我们不是在造动物,我们在造幽灵。”他说,人类智能是进化的产物,而AI智能是模仿的产物。

进化经过数十亿年压缩出行为算法;AI只需几个月,模仿互联网上的语言痕迹。

“我们在模仿知识,而非生成知识。”他将预训练称为“低保真版的进化”。

那是通过网络文本模拟人类思维的“速成课程”,结果是生成出一种“能说会道却没有灵魂的智能”。

Karpathy警告,这样的系统存在一个根本缺陷:模型坍缩(model collapse)

当模型被迫反复训练自己的生成结果,它的分布会越来越窄,输出越来越单调。

“你以为它在思考,其实它只是记得三种答案。”他将模型坍缩比作人类的心理老化。“孩子是高熵的,充满探索;成年人是低熵的,反复自证。”

AI正在快速老去。

Karpathy提出一个反直觉的观点:“梦可能是防止坍缩的算法。”

在他看来,人类之所以不会陷入模式僵化,是因为大脑在睡眠中会生成虚构场景、重组记忆、制造随机扰动。

梦境为认知提供了熵的注入。AI没有梦,这让它在“确定性重复”中失去创造力。

他认为,未来的AI训练应当引入一种“人工梦境”机制。即,让模型在虚构环境中自我生成问题,再尝试解决。

这种“自我对抗”的过程,类似于进化版的自博弈(self-play)。他强调,这不是GAN那种生成对抗,而是智能对自身认知局限的进攻

“只有当AI开始与自己的认知盲点交战,它才会真正成长。”

在谈到进化与学习的关系时,Karpathy拒绝了强化学习学派的类比。他指出,动物不是在通过奖励信号学习,它们是通过结构学习。

“进化把算法写进基因,而不是在体内做梯度下降。”他称,这种误解导致AI研究陷入“错误的自然主义”。

研究者们一边模仿自然,一边忽略自然的本质——随机性、遗忘与结构压缩。在他看来,真正的AI必须引入“遗忘”的能力。

“记忆是模型坍缩的根源。智能的进化,始于遗忘。”

谈到大模型的记忆问题时,他给出了一句近乎哲学的判断:“当前的模型有太多记忆,太少智慧。”

他进一步指出,语言模型在推理中依赖记忆,而不是逻辑。

它们擅长复述,而非推断。“LLM的知识,是对互联网的模糊回忆;而它的推理,只是补全文本的习惯动作。”

他提出一个方向:AI需要从“信息复用”转向“算法提炼”。

只有当模型能区分“知道内容”和“知道如何知道”,它才算跨过了智能的门槛。

二、智能的未来,不在规模而在结构

当谈到模型规模与智能的关系时,Karpathy持明确的反扩张态度。

“智能的未来不是规模,而是结构。”

他回忆,曾经整个行业都相信“Scaling Law”:算力、数据和参数量的指数扩展会自然带来智能涌现。

“现在我们发现,放大镜能让你看清图案,但看不清原理。”

Karpathy预测,未来的“认知核心”(cognitive core)可能仅需十亿参数。

这样的模型可能无法记住所有事实,却能真正理解问题。他说:“那时的AI不会假装全知,它会知道自己不知道。”

这种系统更像人类的“前额叶皮层”,专注于结构化思维,而非语料复现。

他将AI演化分为三段:模仿、反思、抽象。

模仿是今天的语言模型阶段。反思是即将到来的“持续学习agent”阶段。而抽象,将是AI真正与人类认知平行的一刻。

他说,届时AI不会再被训练成“人类对话的镜像”,而会发展出属于自己的“文化”。

他甚至设想,未来模型之间会互相写书、评论、交流、形成共享的知识传统。

“AI之间的文化,可能是智能自我加速的起点。”

Karpathy对未来持谨慎乐观。

他说,AI的发展将持续十年缓慢爬坡,不会出现“瞬间爆炸”。他警告业界:“每一个提升都需要同样多的努力。

所谓“Demo到产品”的落差,远比外界想象的漫长。他以特斯拉自动驾驶为例,从1980年代的CMU演示,到今天的城市实测,花了四十年。

“AI代码比方向盘更容易出错。”他提醒研究者不要被短期的“演示幻觉”蒙蔽。“任何能在一小时展示的技术,可能需要十年才能可靠。”

谈到AI的终点,他的语气转为哲学。“我不认为有‘爆炸’,只有平滑增长。”他认为,所谓“智能爆炸”只是工业革命以来指数曲线的继续。

“AI只会让指数更陡,但不会让世界突然断裂。”换句话说,人工智能不会点燃世界,而会继续燃烧它。

在访谈的最后,话题转向教育。Karpathy正在创建一家新机构:Eureka

他说,这是一个“教人类重新学习思考”的项目。他解释道:“我害怕AI把人类变成旁观者。”

因此他选择离开前线,投入教育。在他看来,教育是“让人类重新站在系统中心”的唯一方式。

他希望Eureka能训练出能与AI共事、理解AI结构、掌握AI逻辑的“新型工程师”。“我不想人类变成操作提示词的物种。”

相关资讯

慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统

编辑 | ScienceAIOpenAI o1、DeepSeek R1 等模型成功实现了在数学、编程等领域的智能慢思考推理,通过自我反思和修正实现了运行时的性能外推。 然而,在医疗领域,仍然很少有模型可以实现具有长链慢思考的推理。 目前医疗领域的推理模型大多是通过在医疗考试题上对 OpenAI 系列的模型进行蒸馏,并没有考虑推理过程的可验证性,以及医疗任务的覆盖度。
2/21/2025 4:04:00 PM
ScienceAI

MARFT:多智能体协作与强化学习微调的协同进化

大家好,我是肆〇柒。 今天,继续 RL 相关话题,我们来探讨一个在人工智能领域极具应用潜力的话题 —— Multi-Agent Reinforcement Fine-Tuning(MARFT)。 这个概念融合了大型语言模型(LLM)、多智能体系统(LaMAS)和强化学习(RL)的精华,为解决复杂任务提供了全新的视角和方法论。
6/3/2025 6:12:03 AM
肆零柒

智能体式推理与工具集成:ARTIST 基于强化学习的新思路

大家好,我是肆〇柒。 这两天,我看到一篇论文《Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning》讲述的是ARTIST 框架,为 LLM 赋予智能体式推理与工具集成的全新维度。 今天,就一起了解一下这个 ARTIST 框架,看看 LLM 如何借助强化学习突破局限,开启智能体式推理与工具集成。
6/10/2025 2:30:00 AM
肆零柒
  • 1