Picsart AI Resarch
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running...这段长达 1200 帧的 2 分钟视频来自一个文生视频(text-to-video)模型,尽管 AI 生成的痕迹依然浓重,但我们必须承认,其中的人物和场景具有相当不错的一致性。这是如何办到的呢?要知道,虽然近些年文生视频技术的生成质量和文本对齐质量都已经相当出色,但大多数现有方法都聚焦于生成短视频(通常是 16 或 24
3/28/2024 11:45:00 AM
机器之心
- 1
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA
YouTube 推出 AI 广告新利器“Peak Points”,Gemini 精准捕捉用户注意力
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
学习
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
神经网络
Anthropic
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
苹果
GPU
生成
AI视频
搜索
场景
华为
百度
训练
人形机器人
预测
伟达
Claude
xAI
深度学习
Transformer
大语言模型
字节跳动
模态
智能体
具身智能
神器推荐
Copilot
文本
驾驶
视觉
LLaMA
API
应用
算力
安全
干货合集
大型语言模型
视频生成
Agent
工具