AI在线 AI在线

高一致性、强控制力,腾讯发布多模态视频生成利器 HunyuanCustom

腾讯近日正式开源其全新多模态定制视频生成框架——HunyuanCustom,标志着AI视频创作进入更高自由度与精准控制的全新阶段。 该框架基于腾讯自研的 HunyuanVideo 打造,主打**“主体一致性”与“多模态灵活输入”**,致力于实现视频内容与输入素材高度匹配的个性化生成。 HunyuanCustom 的核心优势在于其强大的多模态输入能力:支持用户通过文本描述、单图或多图图像、参考音频甚至已有的视频片段作为输入,系统可综合这些信息生成定制化视频。

腾讯近日正式开源其全新多模态定制视频生成框架——HunyuanCustom,标志着AI视频创作进入更高自由度与精准控制的全新阶段。该框架基于腾讯自研的 HunyuanVideo 打造,主打**“主体一致性”与“多模态灵活输入”**,致力于实现视频内容与输入素材高度匹配的个性化生成。

HunyuanCustom 的核心优势在于其强大的多模态输入能力:支持用户通过文本描述、单图或多图图像、参考音频甚至已有的视频片段作为输入,系统可综合这些信息生成定制化视频。这种跨模态感知能力为内容创作提供了极大的灵活性和表现力。

QQ20250512-094435.png

在视频内容的准确性方面,HunyuanCustom特别强调人物或物体在视频中的身份一致性,有效解决了传统AI视频中“换脸失真”或形象漂移的问题,使得生成结果更真实、统一、可信。

QQ20250512-094446.png

该框架的潜力正在多个行业场景中逐步显现,包括但不限于:

  • 虚拟人物广告:快速生成具备特定形象的AI人物进行商业宣传;

  • 虚拟试穿:帮助用户在线预览不同穿搭效果,提升电商体验;

  • 唱歌头像生成:将照片与音乐融合,打造趣味性与表现力兼具的个性化视频;

  • 智能视频编辑:自动替换视频中的指定人物或对象,提高后期制作效率。

腾讯表示,HunyuanCustom 的开源将显著降低多模态视频创作门槛,为开发者、内容创作者以及各类行业用户提供高质量、高一致性的视频生产能力,进一步拓展AI视频的实用边界。

地址:https://github.com/Tencent/HunyuanCustom

相关资讯

腾讯混元将开源一致性视频生成工具HunyuanCustom

腾讯混元团队宣布将于5月9日(周五)早上11点推出开源的一致性视频生成工具 HunyuanCustom。 根据官方海报提示,该工具将支持视频编辑。
5/8/2025 5:00:57 PM
AI在线

音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom

腾讯开源的一致性视频生成工具 “HunyuanCustom”,该模型不仅能生成生动的视频内容,还能实现音频与口型的同步。 这一创新技术的发布,标志着在深度伪造视频领域的一次重要进步。  一图生成,深度伪造不再遥远HunyuanCustom 的最大亮点在于用户只需提供一张图像,就能创造出深度伪造风格的视频。
5/9/2025 12:01:52 PM
AI在线

地表最强,全面第一!可灵2.0多模态编辑震撼全场!开辟视频模型的“新语言”,Prompt的门槛被砍没了!

出品 | 51CTO技术栈(微信号:blog51cto)今天,可灵全系正式进入2.0时代了! 先来看看2.0动态质量、语义响应、画面美学等维度做了升级,直接看视频是最直观的: 要知道,可灵1.6表现已经相当能打,做到了文生图行业第一,文生视频行业第二的水平。 图片根据发布会介绍,可灵AI全球用户规模突破2200万,过去的10个月里,其月活用户量增长25倍,累计生成超过1.68亿个视频及3.44亿张图片。
4/15/2025 6:07:32 PM
  • 1