AI在线 AI在线

Ilya宣判:预训练即将终结!NeurIPS现场沸腾

继李飞飞、Bengio、何恺明之后,在刚刚的NeurIPS 2024中,Ilya Sutskever最新演讲也来了。 虽然时长仅有15分钟左右,但内容依旧看头十足。 例如这一句:Pre-training as we know it will end.我们所熟知的预训练即将终结。

继李飞飞、Bengio、何恺明之后,在刚刚的NeurIPS 2024中,Ilya Sutskever最新演讲也来了。

虽然时长仅有15分钟左右,但内容依旧看头十足。

例如这一句:

Pre-training as we know it will end.我们所熟知的预训练即将终结。

图片

而之于未来,Ilya还预测道:

what comes next is superintelligence: agentic, reasons, understands and is self aware.接下来将是超级智能:代理、推理、理解和自我意识。

那么为何会有如此?我们一起来看看完整演讲。

回顾十年技术发展

Ilya先是用一张十年前的PPT截图开启了这次演讲,那时候深度学习还处于探索阶段。

图片

在2014年的蒙特利尔,他和团队(还有Oriol Vinyals和Quoc Le)首次提出了如今成为AI领域基石的深度学习理念。

Ilya展示了当时的一张PPT,揭示了他和团队的核心工作:自回归模型大型神经网络大数据集的结合。

图片

在十年前,这些元素并不被广泛看作成功的保证,而今天,它们已经成为人工智能领域最重要的基础。

例如在谈到深度学习假设时,Ilya强调了一个重要观点:

如果有一个10层的大型神经网络,它就能在一秒钟内完成人类能做的任何事情。

他解释说,深度学习的核心假设是人工神经元与生物神经元的相似性。

基于这一假设,如果人类能够在0.1秒钟内完成某项任务,那么同样的任务,一个训练良好的10层神经网络也能完成。

这一假设推动了深度学习的研究,并最终实现了当时看似大胆的目标。

图片

Ilya还介绍了自回归模型的核心思想:通过训练模型预测序列中的下一个token,当模型预测得足够准确时,它就能捕捉到整个序列的正确分布。

这一思想为后来的语言模型奠定了基础,特别是在自然语言处理领域的应用。

图片

当然除了“押对宝”的技术之外,也有“押错”的。

LSTM(长短期记忆网络)就是其中之一。

Ilya提到LSTM是深度学习研究者在Transformer之前的主要技术之一。

尽管LSTM在当时为神经网络提供了强大的能力,但它的复杂性和局限性也显而易见。

图片

另一个便是并行化(parallelization)。

尽管现在我们知道pipeline并不是一个好主意,但当时他们通过在每个GPU上运行一层网络,实现了3.5倍的速度提升。

图片

Ilya认为,规模假设(scaling hypothesis)是深度学习成功的关键。

这一假设表明,如果你有一个非常大的数据集,并训练一个足够大的神经网络,那么成功几乎是可以预见的。

这个观点已经成为今天深度学习领域的核心法则。

图片

Ilya进一步阐述了连接主义的思想,认为人工神经元与生物神经元之间的相似性给了我们信心,认为即使不完全模仿人脑的结构,巨大的神经网络也能完成与人类相似的任务。

图片

预训练时代即将结束

基于上述技术的发展,也让我们迎来了预训练的时代。

预训练是推动所有进步的动力,包括大型神经网络和大规模数据集。

图片

但Ilya接下来预测说:

虽然计算能力在不断增长,硬件和算法的进步使得神经网络的训练效率得到了提升,但数据的增长却已接近瓶颈。

他认为,数据是AI的化石燃料,随着全球数据的限制,未来人工智能将面临数据瓶颈。

虽然当前我们仍然可以使用现有数据进行有效训练,但Ilya认为这一增长趋势终将放缓,预训练的时代也会逐步结束

图片

超级智能将是未来

在谈到未来的发展方向时,Ilya提到了“Agent”和“合成数据”的概念。

图片

许多专家都在讨论这些话题,认为Agent系统和合成数据将是突破预训练瓶颈的关键。

Agent系统指的是能够自主推理和决策的人工智能,而合成数据则可以通过模拟环境创造新的数据,弥补现实世界数据的不足。

Ilya还引用了一个生物学上的例子,展示了哺乳动物身体与大脑大小的关系,暗示不同生物可能通过不同的“规模法则”进化出不同的智能表现。

这一思想为深度学习领域的进一步扩展提供了启示,表明人工智能也许可以通过不同的方式突破目前的规模限制。

图片

Ilya最后谈到了超级智能的前景。

他指出,虽然当前的语言模型和AI系统在某些任务上表现出超人类的能力,但它们在推理时仍显得不稳定和不可预测。

推理越多,系统变得越不可预测,这一点在一些复杂任务中表现得尤为突出。

他还提到:

目前的AI系统还不能真正理解和推理,虽然它们能模拟人类的直觉,但未来的AI将会在推理和决策方面展现出更加不可预测的能力。

Ilya进一步推测,未来的AI将不仅仅是执行任务的工具,而会发展成“Agent”,能够自主进行推理和决策,甚至可能具备某种形式的自我意识

这将是一个质的飞跃,AI将不再是人类的延伸,而是一个具有独立智能的存在。

相关资讯

低价Claude3.7极速使用,白票Deepseek满血R1

在当今数字化时代,人工智能技术正以前所未有的速度改变着我们的工作和生活方式。 无论你是开发者、创意工作者、还是企业管理者,拥有高效、经济的AI工具已成为提升效率的关键。 而今天,我要向大家隆重推荐的Token-AI平台,正是实现这一目标的完美解决方案。
3/11/2025 2:00:00 AM
tokengo

折腾半天,我终于找到最懂中文的 AI 音频产品

最近我注意到一个趋势:各大短视频平台上,AI 生成的内容慢慢多了起来,而且其中有很多创意不错的内容,点赞和评论数据都很好。 用 AI 来去制作一些之前没办法实现,或者实现成本很高的内容,我感觉这里面是有机会的。 上个月,我曾经做过一个 Demo,思路是利用最新的 AI 工具,通过视频的方式来重新演绎中国历史上那些经典老故事,比如女娲补天、牛郎织女、岳飞抗金、花木兰替父从军、狸猫换太子、穆桂英挂帅、梁山伯与祝英台。
7/16/2025 6:00:45 PM
阿颖

国际研究:AI 助手常歪曲新闻内容,45% 回答存重大问题

10 月 27 日消息,由欧洲广播联盟(EBU)协调、英国广播公司(BBC)主导的一项最新研究发现,如今作为数百万人日常信息获取渠道的人工智能助手,无论在测试哪种语言、哪个地区或哪个人工智能平台时,都经常歪曲新闻内容。 这项史无前例、覆盖范围最广、规模最大的国际研究于 EBU 新闻大会在那不勒斯发布。 来自 18 个国家、使用 14 种语言的 22 家公共媒体机构(PSM)共同参与了该研究,揭示了四款主流 AI 工具中存在的多项系统性问题。
10/27/2025 9:13:52 AM
远洋

IDEA研究院工程总监谢育涛谈AI创新的工具:工欲善其事必先利其器

AI 领域有没有好用的科研工具?谢育涛团队打造 AI 工具显著提升 AI 科研效率。
4/3/2022 9:33:00 PM
机器之心

腾讯发布 GiiNEX AI 游戏引擎:面向 AI NPC、场景制作与内容生成

感谢腾讯近日在 GDC 2024 游戏开发者大会上,发布了 AI Lab 团队打造的 GiiNEX AI 游戏引擎,基于生成式 AI 和决策 AI 技术。腾讯表示,GiiNEX AI 游戏引擎面向 AI NPC、场景制作、内容生成等场景,提供了包括 2D 图像、动画、3D 城市、剧情、对话、关卡以及音乐等 AIGC 能力,可被用于 MOBA、FPS、MMO 等各类游戏。IT之家从官方获悉,腾讯在 GDC 2024 上展示了 GiiNEX 的游戏 3D 城市生成工具。采用 GiiNEX 城市布局工具构思并创建一个面积
3/21/2024 5:45:32 PM
泓澄(实习)

Linux 发行版 Gentoo 宣布禁止提供 AI 自然语言技术协助下创建的内容

感谢Gentoo 理事会 4 月 14 日一致通过了一项新的 AI 政策:明令禁止向 Gentoo 提供任何借助 AI 自然语言处理工具创建的内容。如果此类工具不涉及版权、道德和质量问题,则可重新讨论这一动议。这项 AI 政策影响 Gentoo 代码贡献与官方 Gentoo 项目,但并不禁止为 AI 相关软件或上游借助 AI 工具开发的软件添加软件包。Gentoo 在官方文档中列出了其对 AI 自然语言工具的担忧:版权问题目前,有关 AI 生成内容版权的法规仍在全球范围内酝酿之中。使用此类材料可能会造成侵犯版权的危
4/17/2024 9:48:18 AM
泓澄(实习)

实时AI,最难躺平的战场

机器之能报道编辑:Sia有人预测 2024 将是视频之年,其实今年已经看出端倪。年终将至,图像、视频生成战场仍然高潮迭起。前阵子上线的 Pika Labs 1.0 炸了一波,Meta 又推出一个免费的 AI 图像生成器,口碑不错。谷歌 DeepMind 最新文生图模型  Imagen 2 毫无悬念地登上了今天的头条 。如果有内测资格,你会发现谷歌搜索居然可以直接生图。进入谷歌实验室,测试中的谷歌搜索可以直接生图了。与此同时,之前热度不减、但一直处在内测阶段的 AI 设计工具 Krea AI Beta 版也终于开放,
12/14/2023 6:56:00 PM
机器之能

英国警方测试 AI 工具:可短时间分析大量数据,为破获悬案带来新希望

英国警方正在测试一款新的 AI 工具,有望帮助侦探们破获数十年前的悬案。据AI在线了解,这款名为 Söze 的工具由澳大利亚 Akkodis 公司开发,目前正在英国 Avon and Somerset 警方进行试验。该技术能够在数小时内分析多年的数据,包括视频、财务记录和社交媒体,从而为侦探们节省大量的时间。评估发现,Söze 仅用 30 个小时就审查了 27 个复杂案件的证据,而人类则需要数十年才能完成这项工作。英国国家警察局长委员会主席 Gavin Stephens 明确表示,AI 在悬案中的潜力巨大,因为大量
9/24/2024 9:46:15 PM
远洋

AI 驱动的「科学搜索引擎」如何加速你的课题进度

编辑 | 白菜叶人工智能 (AI) 工具正在改变我们的工作方式。许多产品试图通过帮助研究人员整理大量文献来提高科学研究的效率。这些科学搜索引擎基于大型语言模型 (LLM),旨在筛选现有研究论文并总结关键发现。
10/15/2024 3:49:00 PM
ScienceAI

Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与

据路透社报道,Meta 当地时间周五宣布,其研究团队推出了一系列新的 AI 模型,其中包括一个名为“自我训练评估器”的工具。该工具有望推动 AI 开发过程中减少对人类干预的依赖。这个工具早前在 8 月的论文中首次亮相,其使用与 OpenAI 新发布的 o1 模型类似的“思维链”技术,让 AI 对模型的输出做出可靠判断。
10/19/2024 11:11:36 AM
清源

研究发现 AI 工具对学生来说是“双刃剑”,需谨慎使用

瑞典研究人员对人工智能工具的使用与学龄儿童的执行功能之间的关联进行了调查。研究发现,人工智能工具的使用对学龄儿童的学习既有潜在的好处,也有潜在的风险。图源 Pexels该研究重点关注人工智能工具在学校作业中的使用与执行功能(EF)之间的关系。
10/21/2024 11:47:57 AM
远洋

填补 AI 安全空白:谷歌上线安全人工智能框架风险评估工具

感谢谷歌公司于 10 月 24 日发布博文,宣布推出 SAIF 风险评估工具,旨在帮助人工智能开发者和组织评估其安全态势,识别潜在风险,并实施更强的安全措施。 SAIF 简介AI在线注:谷歌去年发布了安全人工智能框架(SAIF),旨在帮助用户安全、负责任地部署 AI 模型,SAIF 不仅分享了最佳实践,还为行业提供了一个安全设计的框架。 为了推广这一框架,谷歌与行业伙伴共同成立了安全人工智能联盟(CoSAI),以推动关键的 AI 安全措施。
10/26/2024 8:21:09 AM
故渊

AI自动操作VS Code,自然语言搞定各种配置,来自阿里通义智能计算实验室 | 开源

国产AI已经学会直接操纵编程软件了! 阿里通义智能计算实验室在推出了一款专门针对VSCode的AI助手工具——SmartVscode。 通过自然语言指令,不仅可以让它帮你编程,还能搞定各种配置的控制和修改。
11/20/2024 9:38:40 AM
量子位

Nature:谷歌学术正在被AI工具颠覆

曾经每天都用谷歌学术的科学家们,正在转向新的AI工具。 就在谷歌学术迎来20岁生日之际,Nature却担忧发文:谷歌学术能否在人工智能变革中活下来? 没错,每月访问量超过1亿次的谷歌学术,正在被AI工具悄然颠覆。
11/25/2024 9:00:00 AM
量子位

MidJourney 上线 Patchwork:用户化身“造物主”,AI 构造故事宇宙

Midjourney 公司最新推出名为“Patchwork”的全新叙事工具,将业务拓展至 AI 图像创作和编辑以外的领域,目标打造 AI 驱动的沉浸式故事世界。
12/12/2024 2:38:17 PM
故渊

解码通用 AI Agent:七步构建你的智能系统

LLM Agent 高层次概述(图片由原文作者提供)为什么要构建通用 Agent? 因为这是一个很好的工具,可以为我们的目标使用场景提供原型,并为设计我们自己的定制 Agent 架构奠定基础。 在我们继续深入之前,先快速介绍一下 LLM Agent。
12/19/2024 9:50:04 AM
Baihai IDP

字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)AI画图模型也能“减肥”? 简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。 大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。
1/2/2025 1:50:00 PM
AI寒武纪

打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度

很多大模型的官方参数都声称自己可以输出长达32K tokens的内容,但这数字实际上是存在水分的? ? 最近,陈丹琦团队提出了一个全新的基准测试工具LONGPROC,专门用于检测长上下文模型处理复杂信息并生成回复的能力。
1/16/2025 9:00:00 AM
量子位
  • 1