CameraBench
AI连镜头都不会看?别闹了!CameraBench 能直接给你上“电影课”
咱们天天聊 AI 多牛逼,能写诗、能画画、还能跟你唠嗑到天亮。 但你有没有想过,当 AI 看视频的时候,它真的“看懂”了吗?你可能会说:“当然了,都能识别猫猫狗狗、人山人海了!”打住!识别物体是一回事,但理解视频的 “灵魂” —— 也就是 摄像机是怎么动的 —— 那又是另一回事了!想象一下,你看希区柯克的电影,那经典的“滑动变焦”(dolly zoom)带来的眩晕感;或者《侏罗纪公园》里,镜头缓缓抬起(tilt up)又平移(pan right),第一次看到恐龙时的那种敬畏感;甚至是你看爱豆 vlog 时,那跟着爱豆跑的“跟踪镜头”(tracking shot)…… 这些运镜,都在讲故事,都在传递情感!可对 AI 来说,这些微妙的动作语言,之前很大程度上就是个“谜”。 它可能知道画面里有个人在跑,但很难说清摄像机是在跟着跑(tracking),还是在原地转圈(panning),或者是像喝醉了一样在那儿瞎晃(unsteady)。
4/30/2025 11:00:51 AM
AI在线
- 1
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
苹果将 ChatGPT 和其他 AI 模型引入 Xcode
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构