Picsart AI Resarch

两分钟1200帧的长视频生成器StreamingT2V来了，代码将开源

广阔的战场，风暴兵在奔跑…… prompt：Wide shot of battlefield, stormtroopers running...这段长达 1200 帧的 2 分钟视频来自一个文生视频（text-to-video）模型，尽管 AI 生成的痕迹依然浓重，但我们必须承认，其中的人物和场景具有相当不错的一致性。这是如何办到的呢？要知道，虽然近些年文生视频技术的生成质量和文本对齐质量都已经相当出色，但大多数现有方法都聚焦于生成短视频（通常是 16 或 24

3/28/2024 11:45:00 AM

机器之心

资讯热榜

昆仑万维面向全球发布天工超级智能体Skywork Super Agents 超多案例！让 Lovart 作图更好看更高效的提示词在这里了！ Flowith NEO发布！全球首款无限步骤、上下文与工具的AI Agent Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA YouTube 推出 AI 广告新利器“Peak Points”，Gemini 精准捕捉用户注意力告别“单打独斗”！AI 协作新范式 MoA，如何集结大模型“梦之队”？谷歌发布Flow AI剪辑工具：Veo3 与Imagen4 驱动、镜头控制与场景扩展 Google搜索推出AI Mode实验，探索全新智能问答体验

标签云

人工智能 AI OpenAI AIGC ChatGPT 模型 DeepSeek AI绘画机器人数据谷歌大模型 Midjourney 用户智能开源微软学习 GPT Meta 图像 AI创作技术 Gemini 论文马斯克 Stable Diffusion 算法代码芯片英伟达生成式蛋白质开发者腾讯神经网络 Anthropic 研究 3D 计算 Sora 机器学习 AI设计 AI for Science 苹果 GPU 生成 AI视频搜索场景华为百度训练人形机器人预测伟达 Claude xAI 深度学习 Transformer 大语言模型字节跳动模态智能体具身智能神器推荐 Copilot 文本驾驶视觉 LLaMA API 应用算力安全干货合集大型语言模型视频生成 Agent 工具