Andrej Karpathy

从课程高分到人生进阶，为何Andrej Karpathy两年前的一份「本科生实用」学习指南再次引起热议？

近日，AI 学者 Andrej Karpathy（安德烈・卡帕斯）激烈抨击智能体、强化学习的言论在网上甚嚣尘上，也使得他的过往言论引起大家的好奇。这不，他几年前写的一份「学习指南」就被网友找出，并引起热烈讨论，不过不是关于智能体，也不是对强化学习的吐槽，而是给那些想要在本科课程中取得好成绩的年轻学生的建议。在这份学习指南中，Andrej 表示，自己多年来一直经受各种考试的「检验」，且成绩还不错，所以他想将那些对自己很有帮助的经验法则传授给大家。

10/24/2025 1:39:00 PM

机器之心

Andrej Karpathy 开炮：智能体都在装样子，强化学习很糟糕，AGI 十年也出不来

AI 会给世界带来每年 2% 的 GDP 增量，不过不是以你想的那样。「总的来说，这种模型并不存在。我觉得这个行业…… 它的步子迈得太大了，而且还试图假装这很了不起…… 但事实并非如此 —— 这只是垃圾！

10/18/2025 9:49:00 PM

机器之心

卡帕西8000行代码手搓ChatGPT，成本仅100美元，训练12小时CORE表现超越GPT-2，手把手教程来了

西风发自凹非寺. 量子位 | 公众号 QbitAI100美元成本、8000行代码纯手搓克隆ChatGPT！特斯拉前AI总监、OpenAI创始成员、宣布全职搞教育的AI大神Andrej Karpathy（卡帕西）沉寂了好久，终于终于终于来上新课了！

10/14/2025 10:39:29 AM

西风

100美元、8000行代码手搓ChatGPT，Karpathy最新开源项目爆火，一夜近5k star

「这是我写过最疯狂的代码之一。」本周一，AI 领域大神 Andrej Karpathy 发布了自己的最新开源项目，瞬间引来了整个社区的关注。这个名为 nanochat 的项目据说可以教你从零开始，以 100 美元的成本自建 ChatGPT。

10/14/2025 10:30:00 AM

机器之心

LLM总是把简单任务复杂化，Karpathy无语：有些任务无需那么多思考

随着推理大模型和思维链的出现与普及，大模型具备了「深度思考」的能力，不同任务的泛用性得到了很大的提高。借助思维链，大模型能够对任务进行深入分析，完成任务规划与拆解，从而胜任长周期、复杂度高的工作。同时，我们也能更直观地了解模型的推理与分析过程，从中发现执行环节中的问题，并有针对性地调整指令，以更高效地完成目标。

8/12/2025 11:41:00 AM

机器之心

「幻觉」竟是Karpathy十年前命名的？这个AI圈起名大师带火了多少概念？

取名大王 Karpathy。万万没想到，「幻觉」这个词，竟然是 AI 大牛 Andrej Karpathy 命名的。最近，一位网友在「The Thinking Machine」（一本新书）里发现了这么一段描述：「Karpathy 承认他的（神经）网络有局限性：它只是在模仿言语，而不必真正理解其含义，当遇到它不理解的概念时，它就会『骄傲地』生成一些无意义的内容。

7/28/2025 7:01:00 PM

机器之心

Karpathy最新脑洞「细菌编程」：优秀的代码应该具备细菌的三大特质

西风发自凹非寺. 量子位 | 公众号 QbitAI像细菌一样编写代码！创造出“氛围编程”、“软件3.0”的大神Karpathy又抛出一个新概念，引起网友广泛讨论——.

7/7/2025 12:21:02 PM

西风

正在和DeepSeek-V3-0324做个大项目，「氛围编程」简直太疯狂了

最近超火的氛围编程（Vibe coding）你听说了吗？这个概念是由 AI 大神 Andrej Karpathy 提出的，用户只需要自然语言描述，就能生成代码。仅仅过去一个多月，这一术语就迅速席卷了开发者社区，大家开始纷纷整活。

3/31/2025 1:06:00 PM

机器之心

Karpathy更新AI科普视频，网友：原本周末打算结个婚，改看视频了

他是真的想教会大家。刚刚，赛博活佛 Andrej Karpathy 更新了一个长达 2 个多小时的学习视频，主题是 ——「我是如何使用大型语言模型（LLM）的」。这个视频是 Karpathy 面向普通观众的系列视频之一。

2/28/2025 1:20:00 PM

机器之心

被忽略的起点？Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

几个小时前，著名 AI 研究者、OpenAI 创始成员之一 Andrej Karpathy 发布了一篇备受关注的长推文，其中分享了注意力机制背后一些或许少有人知的故事。其中最值得注意的一个故事是真正首次提出注意力机制的论文其实是 Dzmitry Bahdanau、Kyunghyun Cho 和 Yoshua Bengio 的《Neural Machine Translation by Jointly Learning to Align and Translate》，这比《Attention is All you Need》还早 3 年，但很显然，这篇论文并没有收获后者那般的关注。 Karpathy 长推文的不完整截图实际上，这个故事来自 Dzmitry Bahdanau 发给 Karpathy 的一封邮件。

12/4/2024 3:51:00 PM

机器之心

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

大模型回答人类的对话内容，究竟有多少「智能」成分在里面？本周五，知名 AI 领域学者，OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 发表观点：「人们对『向人工智能询问某件事』的解释过于夸张」，引发网友热议。 Karpathy 称：人工智能基本上是通过模仿人工标注数据来进行训练的语言模型。

12/1/2024 2:03:00 PM

机器之心

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

耽误业界好多年？「这是有史以来最大、最令人困惑的研究生涯错误，」Andrej Karpathy 感叹道。上个周末，OpenAI 创始成员、研究科学家、原特斯拉前 AI 高级总监、AI 领域的大神 Andrej Karpathy 一直在后悔。

11/18/2024 1:30:00 PM

机器之心

OpenAI创始成员Andrej Karpathy：这才是技术之美

技术应该是大脑的插件，而不是计算机病毒。技术应该是什么样子？我们知道乔布斯有「为改变混乱繁杂而生的现代简约主义」的设计理念。所以苹果提供的科技产品都是简洁的。可斯人已逝，如今我们身边的科技产品似乎又进入了复杂与不实用的怪圈之中。近日，知名 AI 领域学者 Andrej Karpathy 发表了自己对于产品哲学的看法，引发了人们的讨论。 Andrej Karpathy：我爱计算器。Andrej Karpathy 博士毕业于斯坦福大学，师从李飞飞，是 OpenAI 的

9/29/2024 12:43:00 PM

机器之心

Andrej Karpathy：自动驾驶已经实现AGI，汽车其实就是机器人

自己称赞自己千句，不如别人称赞你一句。例如马斯克在播客、推特上经常自称特斯拉的自动驾驶和机器人“天下第一”，但这样的话看多了，难免也有些审美疲劳。不过，前几天，Andrej Karpathy在No Priors播客中现身，透露了特斯拉在Optimus人形机器人和自动驾驶领域的一些鲜为人知的进展。

9/12/2024 10:42:00 AM

刘洁

Andrej Karpathy最新激进观点：Transformer将超越人脑

还说 AI 可能会与人类融合……前些天，OpenAI 前首席科学家 Ilya Sutskever 创立的新公司获得 10 亿美元投资的新闻刷遍了各大新闻头条，而 OpenAI 的另一位早期成员和著名 AI 研究者 Andrej Karpathy 则正在「AI 教育」赛道耕耘，其创立的 Eureka Labs 公司正在积极打造其第一款产品。近日，播客节目 No Priors 发布了对这位著名 AI 研究者的专访视频。来自：No PriorsAndrej Ka

9/6/2024 6:05:00 PM

机器之心

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

大模型的安全性，可以说是「有很大进步空间」。AI 大牛 Andrej Karpathy 又来科普知识了，这次的主题是「利用特殊 token 对 LLM 进行类 SQL 注入的攻击」。所谓 SQL 注入攻击，它是一种网络攻击技术。攻击者通过将恶意的 SQL 语句插入到应用程序的输入字段中，诱使后台数据库执行这些恶意的 SQL 语句。此类攻击通常利用应用程序对用户输入的处理不当，比如没有正确地对输入进行过滤或转义，导致攻击者能够访问、修改甚至删除数据库中的数据。由于人们的安全意识逐渐升高，目前对于大多数软件产品来说，

8/16/2024 2:20:00 PM

机器之心

全网祝贺！Andrej Karpathy官宣创业：是自己热爱的AI+教育

Karpathy：以前在特斯拉、OpenAI都是「副业」，现在做的才是「正职」。刚刚，Andrej Karpathy在X平台宣布了自己的下一站去向：创办一家名为 Eureka Labs 的人工智能教育公司。很高兴与大家分享，我正在创办一家名为 Eureka Labs 的人工智能教育公司。公告如下：我们是 Eureka Labs，我们正在打造一所AI原生的新型学校。我们如何才能获得学习新知识的理想体验？例如，在物理学方面，我们可以想象与费曼（Feynman）一起学习高质量的课程材料，费曼会在每一步都为你提供指导。

7/17/2024 4:48:00 PM

机器之心

五年后的今天，训练GPT-2只需不到700刀、24小时，Karpathy又整新活

论老黄卖铲子的技术含量。2019 年 2 月，OpenAI 发布了 GPT-2，因为在文本生成上的优异表现，以及对于预训练 Transformer 架构的充分运用，被认为是如今大预言模型的「始祖」。五年后的今天，训练 GPT-2 这样 15 亿参数的大模型，只需要花费 672 美元，在一个 8XH100 的 GPU 节点上跑 24 个小时就可以搞定了。本周四，前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 在他纯 C 语言复现 GPT-2 大模型的项目「llm.c」的最新

7/12/2024 3:32:00 PM

机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型特斯拉场景深度学习亚马逊架构 Transformer MCP Copilot 编程视觉