Andrej Karpathy
AI大佬Karpathy焦虑了:作为程序员,我从未感到如此落后
不过对于程序员来说,仔细这么一想可能会感觉有点不对劲。 刚刚,Andrej Karpathy 在 X 上发的一条帖子,引发数万程序员和从业者强烈共鸣与热议。 Karpathy 坦言:「我从未像现在这样觉得自己作为一个程序员如此落后。
近两百万人围观的Karpathy年终大语言模型清单,主角是它们
2025 年还有 10 天就要结束,这意味着是时候进行一波年终总结了。 对于人工智能领域而言,2025 年是大语言模型(LLM)快速演进、重磅事件密集出现的一年。 就在昨天,知名 AI 学者 Karpathy 列出了一份清单,记录了他个人认为最重要、也多少有些出乎意料的「范式转变」。
从课程高分到人生进阶,为何Andrej Karpathy两年前的一份「本科生实用」学习指南再次引起热议?
近日,AI 学者 Andrej Karpathy(安德烈・卡帕斯)激烈抨击智能体、强化学习的言论在网上甚嚣尘上,也使得他的过往言论引起大家的好奇。 这不,他几年前写的一份「学习指南」就被网友找出,并引起热烈讨论,不过不是关于智能体,也不是对强化学习的吐槽,而是给那些想要在本科课程中取得好成绩的年轻学生的建议。 在这份学习指南中,Andrej 表示,自己多年来一直经受各种考试的「检验」,且成绩还不错,所以他想将那些对自己很有帮助的经验法则传授给大家。
Andrej Karpathy 开炮:智能体都在装样子,强化学习很糟糕,AGI 十年也出不来
AI 会给世界带来每年 2% 的 GDP 增量,不过不是以你想的那样。 「总的来说,这种模型并不存在。 我觉得这个行业…… 它的步子迈得太大了,而且还试图假装这很了不起…… 但事实并非如此 —— 这只是垃圾!
卡帕西8000行代码手搓ChatGPT,成本仅100美元,训练12小时CORE表现超越GPT-2,手把手教程来了
西风 发自 凹非寺. 量子位 | 公众号 QbitAI100美元成本、8000行代码纯手搓克隆ChatGPT! 特斯拉前AI总监、OpenAI创始成员、宣布全职搞教育的AI大神Andrej Karpathy(卡帕西)沉寂了好久,终于终于终于来上新课了!
100美元、8000行代码手搓ChatGPT,Karpathy最新开源项目爆火,一夜近5k star
「这是我写过最疯狂的代码之一。 」本周一,AI 领域大神 Andrej Karpathy 发布了自己的最新开源项目,瞬间引来了整个社区的关注。 这个名为 nanochat 的项目据说可以教你从零开始,以 100 美元的成本自建 ChatGPT。
LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
随着推理大模型和思维链的出现与普及,大模型具备了「深度思考」的能力,不同任务的泛用性得到了很大的提高。 借助思维链,大模型能够对任务进行深入分析,完成任务规划与拆解,从而胜任长周期、复杂度高的工作。 同时,我们也能更直观地了解模型的推理与分析过程,从中发现执行环节中的问题,并有针对性地调整指令,以更高效地完成目标。
「幻觉」竟是Karpathy十年前命名的?这个AI圈起名大师带火了多少概念?
取名大王 Karpathy。 万万没想到,「幻觉」这个词,竟然是 AI 大牛 Andrej Karpathy 命名的。 最近,一位网友在「The Thinking Machine」(一本新书)里发现了这么一段描述:「Karpathy 承认他的(神经)网络有局限性:它只是在模仿言语,而不必真正理解其含义,当遇到它不理解的概念时,它就会『骄傲地』生成一些无意义的内容。
Karpathy最新脑洞「细菌编程」:优秀的代码应该具备细菌的三大特质
西风 发自 凹非寺. 量子位 | 公众号 QbitAI像细菌一样编写代码! 创造出“氛围编程”、“软件3.0”的大神Karpathy又抛出一个新概念,引起网友广泛讨论——.
正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了
最近超火的氛围编程(Vibe coding)你听说了吗? 这个概念是由 AI 大神 Andrej Karpathy 提出的,用户只需要自然语言描述,就能生成代码。 仅仅过去一个多月,这一术语就迅速席卷了开发者社区,大家开始纷纷整活。
Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了
他是真的想教会大家。 刚刚,赛博活佛 Andrej Karpathy 更新了一个长达 2 个多小时的学习视频,主题是 ——「我是如何使用大型语言模型(LLM)的」。 这个视频是 Karpathy 面向普通观众的系列视频之一。
被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事
几个小时前,著名 AI 研究者、OpenAI 创始成员之一 Andrej Karpathy 发布了一篇备受关注的长推文,其中分享了注意力机制背后一些或许少有人知的故事。 其中最值得注意的一个故事是真正首次提出注意力机制的论文其实是 Dzmitry Bahdanau、Kyunghyun Cho 和 Yoshua Bengio 的《Neural Machine Translation by Jointly Learning to Align and Translate》,这比《Attention is All you Need》还早 3 年,但很显然,这篇论文并没有收获后者那般的关注。 Karpathy 长推文的不完整截图实际上,这个故事来自 Dzmitry Bahdanau 发给 Karpathy 的一封邮件。
Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿
大模型回答人类的对话内容,究竟有多少「智能」成分在里面? 本周五,知名 AI 领域学者,OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 发表观点:「人们对『向人工智能询问某件事』的解释过于夸张」,引发网友热议。 Karpathy 称:人工智能基本上是通过模仿人工标注数据来进行训练的语言模型。
Karpathy后悔了:2015年就看到了语言模型的潜力,却搞了多年强化学习
耽误业界好多年? 「这是有史以来最大、最令人困惑的研究生涯错误,」Andrej Karpathy 感叹道。 上个周末,OpenAI 创始成员、研究科学家、原特斯拉前 AI 高级总监、AI 领域的大神 Andrej Karpathy 一直在后悔。
OpenAI创始成员Andrej Karpathy:这才是技术之美
技术应该是大脑的插件,而不是计算机病毒。技术应该是什么样子?我们知道乔布斯有「为改变混乱繁杂而生的现代简约主义」的设计理念。所以苹果提供的科技产品都是简洁的。可斯人已逝,如今我们身边的科技产品似乎又进入了复杂与不实用的怪圈之中。近日,知名 AI 领域学者 Andrej Karpathy 发表了自己对于产品哲学的看法,引发了人们的讨论。 Andrej Karpathy:我爱计算器。Andrej Karpathy 博士毕业于斯坦福大学,师从李飞飞,是 OpenAI 的
Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人
自己称赞自己千句,不如别人称赞你一句。 例如马斯克在播客、推特上经常自称特斯拉的自动驾驶和机器人“天下第一”,但这样的话看多了,难免也有些审美疲劳。 不过,前几天,Andrej Karpathy在No Priors播客中现身,透露了特斯拉在Optimus人形机器人和自动驾驶领域的一些鲜为人知的进展。
Andrej Karpathy最新激进观点:Transformer将超越人脑
还说 AI 可能会与人类融合……前些天,OpenAI 前首席科学家 Ilya Sutskever 创立的新公司获得 10 亿美元投资的新闻刷遍了各大新闻头条,而 OpenAI 的另一位早期成员和著名 AI 研究者 Andrej Karpathy 则正在「AI 教育」赛道耕耘,其创立的 Eureka Labs 公司正在积极打造其第一款产品。近日,播客节目 No Priors 发布了对这位著名 AI 研究者的专访视频。 来自:No PriorsAndrej Ka
大神Karpathy:我给大模型「SQL注入」攻击,简直不要太轻松
大模型的安全性,可以说是「有很大进步空间」。AI 大牛 Andrej Karpathy 又来科普知识了,这次的主题是「利用特殊 token 对 LLM 进行类 SQL 注入的攻击」。所谓 SQL 注入攻击,它是一种网络攻击技术。攻击者通过将恶意的 SQL 语句插入到应用程序的输入字段中,诱使后台数据库执行这些恶意的 SQL 语句。此类攻击通常利用应用程序对用户输入的处理不当,比如没有正确地对输入进行过滤或转义,导致攻击者能够访问、修改甚至删除数据库中的数据。 由于人们的安全意识逐渐升高,目前对于大多数软件产品来说,
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉