田渊栋

Meta裁员后续：田渊栋被过河拆桥，姚顺雨等集体「抢人」

Meta 裁员余波渐起。昨天的消息，Meta 已在其人工智能部门裁减约 600 个职位，调整波及 FAIR、AI 产品以及基础设施团队。最令人震惊的是田渊栋团队都被 Alexandr Wang 大手一挥给裁撤了，详见报道：Meta AI 大裁员，裁到了田渊栋？

10/24/2025 2:46:00 PM

机器之心

Meta AI大裁员，裁到了田渊栋？

Meta 内斗的瓜真是吃不完呐。上回说到，因不满 Meta 对 FAIR 部门论文发表的限制等一系列问题，Lecun 表示正考虑辞职。（参见Meta 内部混乱持续：FAIR 自由不再，LeCun 考虑辞职）Meta 这边新的风暴已经出现，据 Axios 与《纽约时报》报道，Meta 已在其人工智能部门裁减约 600 个职位，这次调整波及 FAIR、AI 产品以及基础设施团队。

10/23/2025 11:13:00 AM

机器之心

田渊栋与Russell团队联手，证明Transformer能在训练中自然学会叠加推理

对于大型语言模型而言，生成更长、更复杂的推理链，往往意味着巨大的计算成本。为了解决这一难题，田渊栋团队在 2024 年提出的「连续思维链」 (Coconut) 提供了一种全新的范式，它将推理轨迹保留在连续的隐空间中，而非离散的文字符号。现在，他们与 Stuart Russell 团队的最新合作研究则从理论上回答了一个核心问题：这种高效的推理范式是如何在训练中自发产生的？

10/7/2025 7:37:00 PM

机器之心

Meta FAIR田渊栋唯一作者发文：拆解模型「顿悟时刻」

早在 2021 年，研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象，模型在早期训练阶段对训练数据的记忆能力较弱，但随着持续训练，在某一个时间点，会突然从记忆转向强泛化。类似于「顿悟时刻」，模型在某一刻突然理解了数据的内在规律。这种现象被称为「grokking（延迟泛化）」。

10/5/2025 8:09:00 PM

机器之心

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

一个非常简单的更改，就能提高 LLM 推理能力。在认知科学领域，关于语言是用于思考还是用于交流的辩论一直持续。随着 LLM 和 CoT 的兴起，语言已经成为机器推理的默认媒介 —— 但它真的是最佳方法吗？

12/11/2024 8:54:00 PM

机器之心

在 AI 最火热的时候，AI 大牛田渊栋写了本小说《破晓之钟》

“在 AI 最火热的时候，我写了本小说。”这话不是别人说的，这话是 AI 大牛田渊栋说的。这个名字可能不彰显于大众媒体，但在计算机和 AI 领域，几乎是判别式一样的存在。至少在华人科学家面孔中，盘点谷歌无人车时绕不过他，盘点围棋 AI 时绕不过他，梳理巨头 Meta 的 AI 人才时也遗漏不了他。田渊栋现在是 Meta AI Research（FAIR）研究科学家总监，正在带队研究，如何让 AI 在推理和规划问题上，产生现有的大模型产生不了的能力。他是上海交大校友，在计算机系获得了本科和硕士学位，其后又进一步到了

8/23/2024 12:06:20 PM

清源

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

只用 24G 显存，消费级 GPU 就能搞定大模型了。上个月，Meta FAIR 田渊栋参与的一项研究广受好评，他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10 亿以下参数小模型，主打在移动设备上运行 LLM。3 月 6 日，田渊栋又一项研究出炉，这次，他们主攻 LLM 内存效率。除了田渊栋本人，还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。他们合

3/8/2024 2:56:00 PM

机器之心

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免注册免费用！17种AI绘图模型一站式体验平台LMArena Sora、可灵、即梦哪家强？AI视频软件深度测评！可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评借助 AgentCore Memory 为智能体应用添加记忆功能深度拆解！这可能是全网最详细的AI视频创作教程

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney AI新词开源 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法 AI for Science Agent 苹果 Claude 芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 具身智能生成式神经网络机器学习 3D 人形机器人 RAG AI视频大语言模型研究百度 Sora 生成 GPU 工具华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成生成式AI 场景 DeepMind 深度学习特斯拉 AI模型架构 MCP Transformer 亚马逊编程视觉预测