AI在线 AI在线

Bilibili开源动漫视频生成模型AniSora V3版,一键生成多种风格动漫视频镜头

2025年7月,Bilibili(B站)宣布其开源动漫视频生成模型AniSora迎来重大更新,正式发布AniSora V3。 作为Index-AniSora项目的一部分,V3版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、漫画及VTuber内容创作者提供了更强大的工具。 AIbase深入解读AniSora V3的技术突破、应用场景及行业影响。

2025年7月,Bilibili(B站)宣布其开源动漫视频生成模型AniSora迎来重大更新,正式发布AniSora V3。作为Index-AniSora项目的一部分,V3版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、漫画及VTuber内容创作者提供了更强大的工具。AIbase深入解读AniSora V3的技术突破、应用场景及行业影响。

image.png

技术升级:更高质量与精准控制

AniSora V3基于Bilibili此前开源的CogVideoX-5B和Wan2.1-14B模型,结合强化学习与人类反馈(RLHF)框架,显著提升了生成视频的视觉质量和动作一致性。其支持一键生成多种风格的动漫视频镜头,包括番剧片段、国创动画、漫画视频改编、VTuber内容)等

核心升级包括:

  • 时空掩码模块(Spatiotemporal Mask Module)优化:V3版本增强了时空控制能力,支持更复杂的动画任务,如精细的角色表情控制、动态镜头移动和局部图像引导生成。例如,提示“五位女孩在镜头放大时起舞,左手上举至头顶再下放至膝盖”能生成流畅的舞蹈动画,镜头与角色动作同步自然。
  • 数据集扩展:V3继续依托超过1000万高质量动漫视频片段(从100万原始视频中提取)进行训练,新增数据清洗流水线,确保生成内容的风格一致性和细节丰富度。
  • 硬件优化:V3新增对华为Ascend910B NPU的原生支持,完全基于国产芯片训练,推理速度提升约20%,生成4秒高清视频仅需2-3分钟。
  • 多任务学习:V3强化了多任务处理能力,支持从单帧图像生成视频、关键帧插值到唇部同步等功能,特别适合漫画改编和VTuber内容创作。

在最新基准测试中,AniSora V3在VBench和双盲主观测试中,角色一致性和动作流畅度均达到业界顶尖水平(SOTA),尤其在复杂动作(如违反物理规律的夸张动漫动作)上表现突出。

开源生态:社区驱动与透明发展

AniSora V3的完整训练和推理代码已于2025年7月2日在GitHub上更新,开发者可通过Hugging Face访问模型权重及948个动画视频的评估数据集。 Bilibili强调,AniSora是“对动漫世界的开源礼物”,鼓励社区协作优化模型。用户需填写申请表并发送至指定邮箱(如[email protected])以获取V2.0权重和完整数据集访问权限。

V3还引入了首个针对动漫视频生成的RLHF框架,通过AnimeReward和GAPO等工具对模型进行微调,确保输出更符合人类审美和动漫风格需求。社区开发者已开始基于V3开发定制化插件,例如增强特定动漫风格(如吉卜力风)的生成效果。

应用场景:从创意到商业

AniSora V3支持多种动漫风格,包括日本动漫、国产原创动画、漫画改编、VTuber内容及恶搞动画(鬼畜动画),覆盖90%的动漫视频应用场景。 具体应用包括:

  • 单图转视频:用户上传一张高质量动漫图像,配合文本提示(如“角色在向前行驶的车中挥手,头发随风摆动”),即可生成动态视频,保持角色细节和风格一致。
  • 漫画改编:从漫画帧生成带唇部同步和动作的动画,适合快速制作预告片或短篇动画。
  • VTuber与游戏:支持实时生成角色动画,助力独立创作者和游戏开发者快速测试角色动作。
  • 高分辨率输出:生成视频支持高达1080p,确保在社交媒体、流媒体平台上的专业呈现。

AIbase测试显示,V3在生成复杂场景(如多角色交互、动态背景)时,相比V2减少了约15%的伪影问题,生成时间缩短至平均2.5分钟(4秒视频)。

AniSora V3的发布进一步降低了动漫创作门槛,使独立创作者和小型团队能以低成本实现高质量动画制作。相比OpenAI的Sora或Kling等通用视频生成模型,AniSora V3专注于动漫领域,填补了市场空白。 与字节跳动的EX-4D相比,AniSora V3更专注于2D/2.5D动漫风格,而非4D多视角生成,展现了不同的技术路线。

项目:https://t.co/I3HPKPvsBV

相关资讯

B站小红书视频一键变手绘分镜!开源神器ClipSketch AI,短视频创作者省时利器

B站小红书视频一键变手绘分镜!开源神器ClipSketch AI,短视频创作者省时利器

近日,一款名为ClipSketch AI的开源工具在内容创作者社区迅速走红。 该工具专为视频二创和短视频运营者设计,能将长视频瞬间转化为手绘风格的故事板,并自动生成适配社交媒体的爆款文案,帮助用户大幅提升内容生产效率。 ClipSketch AI的核心功能:视频解析与智能提取ClipSketch AI的最大亮点在于其多源视频导入能力,支持直接解析Bilibili(B站)和小红书平台的分享链接(包括短链接及混合文字文案)。
12/29/2025 1:21:19 PM AI在线
智谱清影与AI角色创作平台“捏Ta”开展多模态合作 推动IP一致性落地

智谱清影与AI角色创作平台“捏Ta”开展多模态合作 推动IP一致性落地

2月19日,北京智谱华章科技有限公司宣布,其旗下的多模态创作平台“清影”与AI角色创作平台“捏Ta”达成战略合作,共同探索AI角色设计到动画创作的完整路径,并推动IP一致性的技术落地。 此次合作旨在深入挖掘二次元用户需求与AI应用场景,为用户提供更高质量的生成效果和更快的推理速度。 “清影”基于智谱最新升级的视频生成大模型CogVideoX-2,在模型结构、训练方法和数据工程上进行了全面更新,图生视频基础模型能力大幅提升38%。
2/20/2025 8:55:00 AM AI在线
谷歌 DeepMind 推出新技术:无 3D 模型也能生成真实运动视频

谷歌 DeepMind 推出新技术:无 3D 模型也能生成真实运动视频

近日,谷歌 DeepMind 团队与布朗大学合作,开发了一项名为 “力提示”(force prompting)的新技术。 这项技术能够在没有3D 模型和物理引擎的情况下,生成逼真的运动效果,标志着人工智能视频生成领域的一大突破。 使用这项技术,用户只需简单地指定力的方向和强度,就可以操控 AI 生成的视频内容。
6/4/2025 9:01:04 AM AI在线