AI在线 AI在线

阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码

通义万相 2.1 还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
感谢阿里旗下通义万相宣布推出 2.1 版本模型升级,视频生成、图像生成两大能力均有显著提升。

在视频生成方面,通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力,支持无限长 1080P 视频的高效编解码,首次实现了中文文字视频生成功能,登上 VBench 榜单第一。

阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码

据介绍,通义万相 2.1 支持中英文视频,都可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等等。

阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码

▲ Prompt:以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画边缘模糊且自然,随着晕染的进行,水墨在纸上呈现“福”字,墨色从深到浅过渡,呈现出独特的东方韵味。背景高级简洁,杂志摄影感。

AI在线注意到,通义万相 2.1 还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。

阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码

▲ Prompt:一对穿着正式晚礼服的夫妇在回家途中遭遇大雨,他们撑着黑色雨伞。平拍镜头下,男士穿着黑色西装,女士穿着白色长裙。他们在雨中缓缓行走,雨水沿着伞面滴落。镜头跟随他们的步伐平稳移动,展现出他们在雨中的优雅姿态。

图片生成方面,通义万相 2.1 支持文生组图,采用了 IC-LoRA 图像生成训练方法,利用 DiT 架构,增强文本到图像的上下文能力;对多张图像进行拼接与联合描述即可实现关联图像间的组合生成,并保持特征稳定连续。

阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码

▲ Prompt:浪漫的公园里,一对青年男女在温馨的拥抱交谈

相关资讯

首次实现中文文字生成,消息称阿里通义万相 2.1 视频生成模型今晚开源

据新浪科技援引知情人士消息称,阿里巴巴将于今晚全面开源旗下视频生成模型万相2.1模型。
2/25/2025 5:28:36 PM
清源

业界首个,阿里通义万相“首尾帧生视频模型”开源

它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。
4/17/2025 10:55:39 PM
汪淼

案例超多!5个知名国产AI视频产品实战评测

2 月初 Sora 发布的文生视频 demo 炸裂,让更多人关注到AI视频生成这个领域。 不过 OpenAI 公司的人事动荡频繁,其产品上线时间尚不确定。 从年中可灵低调发布获国内外众多网友好评后,最近国内视频大模型也开始卷啦,9 月份相继更新的有可灵、Vidu、海螺、通义万相和字节的豆包,我们今天测评一下国内知名视频模型的图生视频功能。
10/17/2024 12:42:19 AM
AI设计师Lena
  • 1