阿里万相2.6发布:支持“角色扮演”与多分镜控制，单次视频时长达15秒

作者：AI在线 2025-12-16 03:16

12月16日，阿里巴巴宣布推出新一代万相2.6系列模型，该模型针对专业影视制作和图像创作场景进行了全面升级，并被称为**“全球功能最全的视频生成模型”。万相2.6已同步上线阿里云百炼和万相官网**。万相2.6系列最大的亮点在于它是国内首个支持“角色扮演”功能的视频模型，同时支持音画同步、多镜头生成及声音驱动等功能。

12月16日，阿里巴巴宣布推出新一代 万相2.6系列模型，该模型针对专业影视制作和图像创作场景进行了全面升级，并被称为**“全球功能最全的视频生成模型”。万相2.6已同步上线阿里云百炼和万相官网**。

万相2.6系列最大的亮点在于它是国内首个支持“角色扮演”功能的视频模型，同时支持音画同步、多镜头生成及声音驱动等功能。

核心升级与技术突破

此次升级在画质、音效、指令遵循等方面进一步提升，并将单次视频时长提升至国内最高的15秒。该模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力。

1. 角色扮演功能（国内首创）:

万相2.6能够参考输入视频中的角色外观和音色，按照提示词生成单人、多人、人与物合拍的视频。在模型结构上，通义万相集成了多项创新技术，可对参考视频进行多模态联合建模与学习，提取主体情绪、姿态、视觉特征以及音色、语速等声学特征，确保全感官全维度的一致性保持与迁移。

2. 专业级分镜控制:

模型新增分镜控制功能，可将用户简单的提示词转换为多分镜脚本，生成包含多个镜头的连贯叙事视频。通过高层语义理解，万相2.6能构建具备完整故事线和叙事张力的专业级多镜头段落，并在镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围的高度一致性。

赋能影视级创作场景

万相2.6的角色扮演和分镜控制功能极大地满足了专业影视级场景需求。

例如，普通用户上传一段个人视频，输入科幻悬疑风格的提示词，万相2.6仅需几分钟就能完成分镜设计、角色演绎、画面配音等工作，生成一段镜头叙事完整、电影级运镜的短片，帮助用户“圆电影主角梦”。

面向广告设计、短剧制作等专业场景，通过输入连续提示词，模型可以生成一段完整叙事的短片，让人人都能当导演。

延续国内领先地位

阿里曾在今年9月率先在国内发布音画同步的视频生成模型万相2.5，在权威大模型评测集 LMArena 上，万相图生视频位居国内第一。此次2.6版本的发布，进一步巩固了其在国内视频生成领域的领先地位。

即日起，所有人可直接在万相官网体验万相2.6，企业用户可通过阿里云百炼调用 API。据悉，千问 APP 也将于近期上线该模型，并提供更丰富的玩法。

新一代 AI 视频生成模型 LTX-2发布:完整叙事高清视频一键生成

在 AI 技术迅猛发展的背景下，Lightricks 公司近日发布了其最新研发的 AI 视频生成模型 ——LTX-2。这一模型能够一次性生成长达20秒的完整4K 叙事高清视频，配有声音和口型同步，为视频创作带来了革命性的进展。 LTX-2的核心技术在于其音画同步生成能力，传统的 AI 视频生成工具往往只能生成无声视频，随后需要人工添加配音。

10/31/2025 5:21:45 PM AI在线

阿里深夜开源万相2.1，这是AI视频领域的DeepSeek！

最近的 AI 新闻有点太密集了，肝快废了。 25号凌晨 2 点半，Claude 发 3.7 Sonnet，凌晨 5 点半，阿里发了推理模型 QwQ-Max 的预览版，早上 10 点 DeepSeek 开源了一个 DeepEP 代码库，然后晚上 10 点 20，阿里的视频模型万相 2.1，也来了。 Claude 3.7 Sonnet深夜上线，AI编程的天又被捅破了AI 这个行业真的卷生卷死，凌晨 2 点半，刚想早睡一点点，9 点起来蹲 DeepSeek 的开源。

2/28/2025 6:01:37 AM 数字生命卡兹克

LiblibAI接入阿里通义大模型推出10秒AI视频生成功能

近日，国内AI图像创作领域的领军平台LiblibAI宣布一项重大举措——接入阿里通义系列大模型，这一动作显著提升了其AI创作能力，为用户带来了更强大的创作工具。此次接入后，基于万相最新开源模型，LiblibAI推出了文生视频和图生视频功能。用户只需输入文本提示词，或者上传图片，就能快速生成10秒短视频。

3/24/2025 6:00:40 PM AI在线