Yann LeCun
LeCun在Meta还有论文:JEPA物理规划的「终极指南」
长期以来,AI 领域一直怀揣着一个宏大的梦想:创造出能够像人类一样直观理解物理世界,并在从未见过的任务和环境中游刃有余的智能体。 传统的强化学习方法往往比较笨拙,需要通过无数次的试错和海量的样本才能学到一点皮毛,这在奖励信号稀疏的现实环境中简直是灾难。 为了打破这一僵局,研究者们提出了「世界模型」这一概念,即让智能体在脑海中构建一个物理模拟器,通过预测未来状态来进行演练。
LeCun和哈萨比斯「吵」起来了:「通用智能」到底存不存在?
今天 AI 圈最大的热闹莫过于 LeCun 和哈萨比斯在推上「吵」了起来。 事情的起因,源于 Yann LeCun 最近的一次「火力全开」。 前段时间,一位博主发布了一段 LeCun 的访谈剪辑,LeCun 在播客节目中表示:「通用智能」不存在,是彻头彻尾的胡说八道。
LeCun在Meta的最后论文?还是共同一作,LeJEPA:JEPAs理论拼图补完
这可能是 LeCun 在 Meta 发表的最后几篇论文之一。 这次,LeCun 为 JEPA 架构补上了关键的理论拼图。 学习世界及其动态的可操控表征是人工智能的核心。
突发|Yann LeCun离职,要创业?
突然,却又在预料之内,Meta 经过人事地震之后,图灵奖得主 Yann LeCun 还是选择离开。 据《金融时报》刚刚援引知情人士的报道,Meta 首席人工智能科学家 Yann LeCun 计划离开这家公司,并创办自己的初创公司。 也就是,Yann LeCun 要正式自己创业了。
LeCun力荐的JEPA杀入LLM,用CV的思路训练LLM,性能鲁棒性双丰收
LeCun 这次不是批评 LLM,而是亲自改造。 当前 LLM 的训练(包括预训练、微调和评估)主要依赖于在「输入空间」进行重构与生成,例如预测下一个词。 而在 CV 领域,基于「嵌入空间」的训练目标,如联合嵌入预测架构(JEPA),已被证明远优于在输入空间操作的同类方法。
马斯克:研究者不存在了,只有工程师;LeCun:大错特错
长期以来,科学家(研究者)和工程师的角色定位泾渭分明。 这种分野不仅存在于学术界,也深植于大众文化之中。 比如在美剧《生活大爆炸》中,物理学家谢尔顿・库珀就时常以「真正的科学家」自居,对身为工程师的霍华德・沃洛维兹冷嘲热讽,两者的职业差异甚至成为该喜剧的重要素材。
LeCun出手,造出视频世界模型,挑战英伟达COSMOS
2018 年,LSTM 之父 Jürgen Schmidhuber 在论文中( Recurrent world models facilitate policy evolution )推广了世界模型(world model)的概念,这是一种神经网络,它能够根据智能体过去的观察与动作,预测环境的未来状态。 近年来,世界模型逐渐受到大家的关注,当然也包括深度学习三巨头之一的 Yann LeCun,他将世界模型视为通向人类智能的核心路径。 然而,训练出有效的世界模型仍面临诸多挑战。
是的,LeCun要向28岁的Alexandr Wang汇报!这是Meta新AI团队的一些独家内部消息
LeCun 向 Alexandr Wang 汇报? Meta 内部:是的。 招募了一众 AI 大牛以后,Meta 能吃得消吗?
Llama惨遭抛弃!Meta内部改用Claude写代码
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAILlama惨遭抛弃! 据Meta工程师透露,现在Meta内部开发都已经换掉了自家的Llama,改用Claude Sonnet写代码。
LeCun团队新作:在世界模型中导航
现实世界版的 Genie-2? 最近,世界模型(World Models)似乎成为了 AI 领域最热门的研究方向。 继 World Labs(李飞飞)、谷歌 DeepMind 接连发布自己的世界模型研究之后,Meta FAIR 的 Yann LeCun 团队也加入了战场,也在同一周之内发布了导航世界模型(Navigation World Models/NWM)。
LeCun 的世界模型初步实现!基于预训练视觉特征,看一眼任务就能零样本规划
机器之心报道,编辑:Panda。
LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话
图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI 。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更
Yann LeCun不看好强化学习:「我确实更喜欢 MPC」
五十多年前的理论还值得再研究一下? 「相比于强化学习(RL),我确实更喜欢模型预测控制(MPC)。至少从 2016 年起,我就一直在强调这一点。强化学习在学习任何新任务时都需要进行极其大量的尝试。相比之下,模型预测控制是零样本的:如果你有一个良好的世界模型和一个良好的任务目标,模型预测控制就可以在不需要任何特定任务学习的情况下解决新任务。这就是规划的魔力。这并不意味着强化学习是无用的,但它的使用应该是最后的手段。」在最近发布的一个帖子中,Meta 首席人工智能科学家 Yann LeCun 发表了这样一番看法。一直
LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程
编辑 | ScienceAI终于,半导体设计行业有了专属的开源大模型!7 月 9 日,国外公司 Aitomatic 宣布推出「Semi Kong」,这是世界上首个专为半导体行业设计的开源 AI 大型语言模型(LLM)。SemiKong 在 2024 年 Semicon West 展会上亮相,旨在彻底改变半导体工艺和制造技术,并有可能在未来五年内重塑价值 5000 亿美元的半导体行业。图示:LeCun 在 X 转发了 SemiKong 内容。(来源:X)Yann LeCun 在 X 转发了这条激动人心的内容:「这是专
ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为世界模拟器来使用吗?最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议,就连图灵奖得主 Yann LeCun 也参与了进来。这篇论文探讨的问题是:当前语言模型本身是否可以充当世界模拟器,并正确预测动作如何改变不同的世界状态,从而避免大量手动编码的需要呢?针对这一问题,来自亚利
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
有了 StoryDiffusion,更加一致性的图像和视频生成得到了保障。两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。其实,产出这些漫画的研究出自南开大学、字节跳动等机构。在《StoryDiffusion:Consistent Self-Attention for long-range image and video generation》这篇论文中,该研究团队提出了一种名为 StoryDiffusion 的新方法,用于生成一致的图像和视频以讲述复杂故事。论文
LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向
LeCun 一如既往地不看好自回归 LLM。机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划……当一系列问题被提出时,有人回答自回归 LLM 足以胜任。然而,知名 AI 学者、图灵奖得主 Yann LeCun 并不这么认为,他一直唱衰自回归 LLM。近日 LeCun 在哈佛大学的演讲内容深入探讨了这些问题,内容长达 95 页,可谓干货满满。LeCun 给出了一个模块化的认知架构,它可能构成回答这些问题的途径。该架构的核心是一个可预测的世界模型,它允许系统预测其行动的后
Transformer本可以深谋远虑,但就是不做
语言模型是否会规划未来 token?这篇论文给你答案。「别让 Yann LeCun 看见了。」Yann LeCun 表示太迟了,他已经看到了。今天要介绍的这篇 「LeCun 非要看」的论文探讨的问题是:Transformer 是深谋远虑的语言模型吗?当它在某个位置执行推理时,它会预先考虑后面的位置吗?这项研究得出的结论是:Transformer 有能力这样做,但在实践中不会这样做。 我们都知道,人类会思而后言。数十年的语言学研究表明:人类在使用语言时,内心会预测即将出现的语言输入、词或句子。不同于人类,现在的语言
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉