通义万相

硬刚Sora2，万相2.6轻松定制角色、控制分镜，普通人也能当导演

硬刚Sora2，万相2.6轻松定制角色、控制分镜，普通人也能当导演

2025 年即将画上句号，回望这一年的视频生成领域，用「突飞猛进」来形容毫不为过，甚至可以说，视频内容创作的范式正在悄然发生改变。 9 月，OpenAI 发布的 Sora 2 凭借「客串（Cameo）」功能，打破了困扰行业已久的「角色一致性」瓶颈，首创的「角色扮演功能」玩法让 AI 视频从充满不确定性的「盲盒抽卡」进化为可控的「导演游戏」。与此同时，商业落地的速度快得惊人：在 B 端，大量 AI 短剧、漫剧上线，制作成本大幅降低；在 C 端，社交平台上不仅有「粘土滤镜」这样的爆款特效，更有大量博主开始常态化使用 AI 制作剧情短片。

12/17/2025 2:47:00 PM 机器之心

阿里发布万相 2.6 系列模型，上线国内首个角色扮演功能

阿里发布万相 2.6 系列模型，上线国内首个角色扮演功能

AI在线 12 月 16 日消息，阿里发布新一代万相 2.6 系列模型，该系列模型面向专业影视制作和图像创作场景进行了全面升级，全新的万相 2.6 是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能，是全球功能最全的视频生成模型。万相 2.6 已同步上线阿里云百炼、万相官网。

12/16/2025 1:59:26 PM 远洋

阿里巴巴开源视频生成模型通义万相 Wan2.2，首创电影美学控制系统

阿里巴巴开源视频生成模型通义万相 Wan2.2，首创电影美学控制系统

AI在线 7 月 28 日消息，今晚，阿里开源视频生成模型「通义万相 Wan2.2」，此次共开源文生视频（Wan2.2-T2V-A14B）、图生视频（Wan2.2-I2V-A14B）和统一视频生成（Wan2.2-IT2V-5B）三款模型，其中文生视频模型和图生视频模型均为业界首个使用 MoE 架构的视频生成模型，总参数量为 27B，激活参数 14B；同时，首创电影美学控制系统，光影、色彩、构图、微表情等能力媲美专业电影水平。开发者可在 GitHub、HuggingFace、魔搭社区下载模型和代码，企业可在阿里云百炼调用模型 API，用户还可在通义万相官网和通义 App 直接体验。据官方介绍，通义万相 2.2 率先在视频生成扩散模型中引入 MoE 架构，有效解决视频生成处理 Token 过长导致的计算资源消耗大问题。

7/28/2025 8:30:14 PM 远洋

阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE

阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE

阿里巴巴开源通义万相Wan2.1-VACE，支持视频生成与编辑，单一模型可完成文生视频、视频重绘等多种任务。1.3B版本可在消费级显卡运行。#AI视频生成##阿里巴巴#

5/14/2025 10:42:53 PM 远洋

业界首个，阿里通义万相“首尾帧生视频模型”开源

业界首个，阿里通义万相“首尾帧生视频模型”开源

它可根据用户指定的开始和结束图片，生成一段能衔接首尾画面的 720p 高清视频，此次升级将能满足用户更可控、更定制化的视频生成需求。

4/17/2025 10:55:39 PM 汪淼

首次实现中文文字生成，消息称阿里通义万相 2.1 视频生成模型今晚开源

首次实现中文文字生成，消息称阿里通义万相 2.1 视频生成模型今晚开源

据新浪科技援引知情人士消息称，阿里巴巴将于今晚全面开源旗下视频生成模型万相2.1模型。

2/25/2025 5:28:36 PM 清源

阿里通义万相 2.1 模型宣布升级：首次实现中文文字视频生成功能，支持无限长 1080P 视频的高效编解码

阿里通义万相 2.1 模型宣布升级：首次实现中文文字视频生成功能，支持无限长 1080P 视频的高效编解码

通义万相 2.1 还支持复杂运镜，可还原碰撞、反弹、切割、挤压等真实世界的物理规律，例如雨滴落在伞上会溅起水花。

1/10/2025 11:03:37 AM 问舟

案例超多！5个知名国产AI视频产品实战评测

案例超多！5个知名国产AI视频产品实战评测

2 月初 Sora 发布的文生视频 demo 炸裂，让更多人关注到AI视频生成这个领域。不过 OpenAI 公司的人事动荡频繁，其产品上线时间尚不确定。从年中可灵低调发布获国内外众多网友好评后，最近国内视频大模型也开始卷啦，9 月份相继更新的有可灵、Vidu、海螺、通义万相和字节的豆包，我们今天测评一下国内知名视频模型的图生视频功能。

10/17/2024 12:42:19 AM AI设计师Lena

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉