运动可控！阶跃星辰 Step-Video-TI2V 图生视频模型开源

作者：AI在线 2025-03-20 02:32

上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成，能够生成102帧、5秒、540P分辨率的视频，具有运动幅度可控和镜头运动可控两大核心特点，尤其在动漫效果方面表现出色。与现有的开源图生视频模型相比，Step-Video-TI2V不仅在参数规模上提供了更高的上限，其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性，为创作者提供了更灵活的选择。

微信截图_20250320143140.png

Step-Video-TI2V的开发过程中，团队进行了两大关键优化。首先，引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同，该模型采用了更直接的方式，将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接，从而确保生成的视频与输入图片高度一致。其次，通过AdaLN模块引入视频动态性打分信息，使用户在生成视频时可以指定不同的运动级别，精准控制视频的动态幅度，从而平衡动态性、稳定性和一致性。此外，团队还对主体动作和镜头运动进行了专项精准标注，进一步提升了模型在主体动态性和运镜效果上的表现。

Step-Video-TI2V的核心特点包括运动幅度可控、多种运镜控制、动漫效果优异以及支持多尺寸生成。用户可以根据创作需求自由切换动态与稳定画面，生成从基本的推拉摇移、升降到复杂电影级运镜效果的视频。该模型在动漫类任务上的表现尤为突出，非常适合动画创作和短视频制作等应用场景。同时，它支持多种尺寸的图生视频，无论是横屏、竖屏还是方屏，都能满足不同平台的需求。

体验地址:

https://yuewen.cn/videos

GitHub:

https://github.com/stepfun-ai/Step-Video-TI2V

Github-ComfyUI:

https://github.com/stepfun-ai/ComfyUI-StepVideo

音乐界的sd?ACE-Step音乐生成模型发布，20秒打造4分钟完整歌曲

ACE-Step，一款由ACE Studio与StepFun联合开发的音乐生成“基础模型”，于近日正式亮相，被誉为“音乐界的Stable Diffusion”。该模型以其惊人的生成速度和多样化功能引发行业热议，支持19种语言，可在短短20秒内生成一首长达4分钟的完整音乐作品，效率比主流模型快15倍以上。核心功能亮点:从歌词到完整歌曲一气呵成ACE-Step以其强大的生成能力重新定义了AI音乐创作。

5/6/2025 5:00:41 PM AI在线

阶跃星辰发布并开源音乐大模型——音跃ACE-Step

阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step（中文名:音跃），标志着音乐创作与生成技术的又一重要突破。 ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果，展现了音乐创作与生成的最新进展。 ACE Studio是一家以生成式AI技术为核心的科技公司，其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品，用户遍布全球，包括格莱美获奖者和世界顶级的工作室。

5/7/2025 4:00:44 PM AI在线

开源端到端语音大模型Step-Audio-AQAA：听懂音频直接生成自然语音

在人工智能领域，尤其是生成式对抗网络（AIGC）方面的不断进展，语音交互已成为一个重要的研究方向。传统的大语言模型(LLM)主要专注于文本处理，无法直接生成自然语音，这在一定程度上影响了人机音频交互的流畅性。为了突破这一局限，Step-Audio 团队开源了一款全新的端到端语音大模型 ——Step-Audio-AQAA。

7/2/2025 5:00:55 PM AI在线

运动可控！阶跃星辰 Step-Video-TI2V 图生视频模型开源

相关资讯

音乐界的sd?ACE-Step音乐生成模型发布，20秒打造4分钟完整歌曲

阶跃星辰发布并开源音乐大模型——音跃ACE-Step

开源端到端语音大模型Step-Audio-AQAA：听懂音频直接生成自然语音