Daphne Koller
Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测
AI 理解视频不能依靠在像素空间中预测。在互联网文本数据即将枯竭之际,很多 AI 研究者将目光转向了视频。但如何让 AI 理解视频数据成了新的难题。在 2024 世界经济论坛的一次会谈中,图灵奖得主、Meta 首席 AI 科学家 Yann LeCun 被问到了这个问题。他认为,虽然这个问题还没有明确的答案,但适合用来处理视频的模型并不是我们现在大范围应用的生成模型。而且新的模型应该学会在抽象的表征空间中预测,而不是在像素空间中。一起参与讨论的还有斯坦福大学教授、Coursera 联合创始人 Daphne Kolle
1/24/2024 11:11:00 AM
机器之心
- 1
资讯热榜
3分钟生成UI源文件!实测谷歌最新UI设计神器Google Stitch
Anthropic拒绝为Windsurf提供Claude Sonnet 4与Opus 4支持,商战大戏开演!
进化智能体 AlphaEvolve:科学发现与算法优化的新引擎
DeepSeek R1-0528震撼发布:免费128K上下文,性能直逼OpenAI o3!
早报速读!2025年5月最新AI视频产品评测&优秀案例
《Nature》研究显示:ChatGPT 可使中小学生学习效果暴涨 86.7%
从设计到开发一步到位!Figma 5大新功能深度解析!
被困在 4GB 内存里的 Llama 3.2:AI 在树莓派中上演“死亡循环”
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
研究
神经网络
3D
计算
Sora
机器学习
生成
AI设计
AI for Science
苹果
GPU
AI视频
训练
华为
搜索
Claude
场景
百度
人形机器人
智能体
xAI
预测
伟达
大语言模型
深度学习
Transformer
字节跳动
模态
LLaMA
文本
神器推荐
具身智能
Copilot
视觉
驾驶
API
Agent
算力
应用
大型语言模型
工具
安全
干货合集
视频生成