teacher
讨论下一个token预测时,我们可能正在走进陷阱
自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。然而,越来越多的人认为,以下一个 token 的预测为目标只能得到一个优秀的「即兴表演艺术家」,并不能真正模拟人类思维。人类会在执行计划之前在头脑中进行细致的想象、策划和回溯。遗憾的是,这种策略并没有明确地构建在当今语言模型的框架中。对此,部分学者如 LeCun,在其论文中已有所评判。在一篇论文中,来自苏黎世联邦理工学院的 Gregor Bachmann
3/25/2024 2:42:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AI
AIGC
ChatGPT
DeepSeek
AI绘画
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
微软
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
芯片
蛋白质
代码
生成式
英伟达
腾讯
神经网络
研究
Anthropic
计算
3D
Sora
AI设计
开发者
机器学习
AI for Science
GPU
AI视频
场景
苹果
华为
人形机器人
百度
预测
伟达
Transformer
深度学习
Claude
搜索
xAI
大语言模型
字节跳动
模态
驾驶
具身智能
神器推荐
文本
训练
LLaMA
Copilot
视觉
算力
应用
安全
视频生成
干货合集
智能体
大型语言模型
亚马逊
科技
AGI
API