AI在线 AI在线

阿里万相2.6发布:支持“角色扮演”与多分镜控制,单次视频时长达15秒

12月16日,阿里巴巴宣布推出新一代 万相2.6系列模型,该模型针对专业影视制作和图像创作场景进行了全面升级,并被称为**“全球功能最全的视频生成模型”。 万相2.6已同步上线阿里云百炼和万相官网**。 万相2.6系列最大的亮点在于它是国内首个支持“角色扮演”功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能。

12月16日,阿里巴巴宣布推出新一代 万相2.6系列模型,该模型针对专业影视制作和图像创作场景进行了全面升级,并被称为**“全球功能最全的视频生成模型”。万相2.6已同步上线阿里云百炼万相官网**。

万相2.6系列最大的亮点在于它是国内首个支持“角色扮演”功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能。

 核心升级与技术突破

此次升级在画质、音效、指令遵循等方面进一步提升,并将单次视频时长提升至国内最高的15秒。该模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力。

1. 角色扮演功能(国内首创):

万相2.6能够参考输入视频中的角色外观和音色,按照提示词生成单人、多人、人与物合拍的视频。在模型结构上,通义万相集成了多项创新技术,可对参考视频进行多模态联合建模与学习,提取主体情绪、姿态、视觉特征以及音色、语速等声学特征,确保全感官全维度的一致性保持与迁移。

2. 专业级分镜控制:

模型新增分镜控制功能,可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频。通过高层语义理解,万相2.6能构建具备完整故事线和叙事张力的专业级多镜头段落,并在镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围的高度一致性。

QQ20251216-141210.png

赋能影视级创作场景

万相2.6的角色扮演和分镜控制功能极大地满足了专业影视级场景需求。

例如,普通用户上传一段个人视频,输入科幻悬疑风格的提示词,万相2.6仅需几分钟就能完成分镜设计、角色演绎、画面配音等工作,生成一段镜头叙事完整、电影级运镜的短片,帮助用户“圆电影主角梦”。

面向广告设计、短剧制作等专业场景,通过输入连续提示词,模型可以生成一段完整叙事的短片,让人人都能当导演。

 延续国内领先地位

阿里曾在今年9月率先在国内发布音画同步的视频生成模型万相2.5,在权威大模型评测集 LMArena 上,万相图生视频位居国内第一。此次2.6版本的发布,进一步巩固了其在国内视频生成领域的领先地位。

即日起,所有人可直接在万相官网体验万相2.6,企业用户可通过阿里云百炼调用 API。据悉,千问 APP 也将于近期上线该模型,并提供更丰富的玩法。

相关资讯

新一代 AI 视频生成模型 LTX-2发布:完整叙事高清视频一键生成

在 AI 技术迅猛发展的背景下,Lightricks 公司近日发布了其最新研发的 AI 视频生成模型 ——LTX-2。 这一模型能够一次性生成长达20秒的完整4K 叙事高清视频,配有声音和口型同步,为视频创作带来了革命性的进展。 LTX-2的核心技术在于其音画同步生成能力,传统的 AI 视频生成工具往往只能生成无声视频,随后需要人工添加配音。
10/31/2025 5:21:45 PM
AI在线

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

最近的 AI 新闻有点太密集了,肝快废了。 25号凌晨 2 点半,Claude 发 3.7 Sonnet,凌晨 5 点半,阿里发了推理模型 QwQ-Max 的预览版,早上 10 点 DeepSeek 开源了一个 DeepEP 代码库,然后晚上 10 点 20,阿里的视频模型万相 2.1,也来了。 Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了AI 这个行业真的卷生卷死,凌晨 2 点半,刚想早睡一点点,9 点起来蹲 DeepSeek 的开源。
2/28/2025 6:01:37 AM
数字生命卡兹克

LiblibAI接入阿里通义大模型 推出10秒AI视频生成功能

近日,国内AI图像创作领域的领军平台LiblibAI宣布一项重大举措——接入阿里通义系列大模型,这一动作显著提升了其AI创作能力,为用户带来了更强大的创作工具。 此次接入后,基于万相最新开源模型,LiblibAI推出了文生视频和图生视频功能。 用户只需输入文本提示词,或者上传图片,就能快速生成10秒短视频。
3/24/2025 6:00:40 PM
AI在线