通义万相
硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演
2025 年即将画上句号,回望这一年的视频生成领域,用「突飞猛进」来形容毫不为过,甚至可以说,视频内容创作的范式正在悄然发生改变。 9 月,OpenAI 发布的 Sora 2 凭借「客串(Cameo)」功能,打破了困扰行业已久的「角色一致性」瓶颈,首创的「角色扮演功能」玩法让 AI 视频从充满不确定性的「盲盒抽卡」进化为可控的「导演游戏」。 与此同时,商业落地的速度快得惊人:在 B 端,大量 AI 短剧、漫剧上线,制作成本大幅降低;在 C 端,社交平台上不仅有「粘土滤镜」这样的爆款特效,更有大量博主开始常态化使用 AI 制作剧情短片。
12/17/2025 2:47:00 PM
机器之心
阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能
AI在线 12 月 16 日消息,阿里发布新一代万相 2.6 系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相 2.6 是国内首个支持角色扮演功能的视频模型。 该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。 万相 2.6 已同步上线阿里云百炼、万相官网。
12/16/2025 1:59:26 PM
远洋
阿里巴巴开源视频生成模型通义万相 Wan2.2,首创电影美学控制系统
AI在线 7 月 28 日消息,今晚,阿里开源视频生成模型「通义万相 Wan2.2」,此次共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用 MoE 架构的视频生成模型,总参数量为 27B,激活参数 14B;同时,首创电影美学控制系统,光影、色彩、构图、微表情等能力媲美专业电影水平。 开发者可在 GitHub、HuggingFace、魔搭社区下载模型和代码,企业可在阿里云百炼调用模型 API,用户还可在通义万相官网和通义 App 直接体验。 据官方介绍,通义万相 2.2 率先在视频生成扩散模型中引入 MoE 架构,有效解决视频生成处理 Token 过长导致的计算资源消耗大问题。
7/28/2025 8:30:14 PM
远洋
阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE
阿里巴巴开源通义万相Wan2.1-VACE,支持视频生成与编辑,单一模型可完成文生视频、视频重绘等多种任务。1.3B版本可在消费级显卡运行。#AI视频生成##阿里巴巴#
5/14/2025 10:42:53 PM
远洋
业界首个,阿里通义万相“首尾帧生视频模型”开源
它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。
4/17/2025 10:55:39 PM
汪淼
首次实现中文文字生成,消息称阿里通义万相 2.1 视频生成模型今晚开源
据新浪科技援引知情人士消息称,阿里巴巴将于今晚全面开源旗下视频生成模型万相2.1模型。
2/25/2025 5:28:36 PM
清源
阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码
通义万相 2.1 还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
1/10/2025 11:03:37 AM
问舟
案例超多!5个知名国产AI视频产品实战评测
2 月初 Sora 发布的文生视频 demo 炸裂,让更多人关注到AI视频生成这个领域。 不过 OpenAI 公司的人事动荡频繁,其产品上线时间尚不确定。 从年中可灵低调发布获国内外众多网友好评后,最近国内视频大模型也开始卷啦,9 月份相继更新的有可灵、Vidu、海螺、通义万相和字节的豆包,我们今天测评一下国内知名视频模型的图生视频功能。
10/17/2024 12:42:19 AM
AI设计师Lena
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
苹果
Agent
腾讯
Claude
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
亚马逊
特斯拉
场景
深度学习
架构
Transformer
MCP
Copilot
编程
视觉