AI在线 AI在线

音乐界的sd?ACE-Step音乐生成模型发布,20秒打造4分钟完整歌曲

ACE-Step,一款由ACE Studio与StepFun联合开发的音乐生成“基础模型”,于近日正式亮相,被誉为“音乐界的Stable Diffusion”。 该模型以其惊人的生成速度和多样化功能引发行业热议,支持19种语言,可在短短20秒内生成一首长达4分钟的完整音乐作品,效率比主流模型快15倍以上。 核心功能亮点:从歌词到完整歌曲一气呵成ACE-Step以其强大的生成能力重新定义了AI音乐创作。

ACE-Step,一款由ACE Studio与StepFun联合开发的音乐生成“基础模型”,于近日正式亮相,被誉为“音乐界的Stable Diffusion”。该模型以其惊人的生成速度和多样化功能引发行业热议,支持19种语言,可在短短20秒内生成一首长达4分钟的完整音乐作品,效率比主流模型快15倍以上。

核心功能亮点:从歌词到完整歌曲一气呵成

ACE-Step以其强大的生成能力重新定义了AI音乐创作。其核心功能包括:

歌词驱动创作:输入歌词,模型自动生成旋律并演唱完整歌曲;

风格化编曲:根据指定的风格标签(如说唱、电子乐、流行等),自动生成伴奏和配器;

精准修改:支持对歌曲某段歌词进行修改,而不影响原有旋律的连贯性;

多样化生成:能够生成带风格的说唱、电子乐、人声或复杂配器,满足不同音乐场景需求。

社交媒体上,开发者与音乐创作者对ACE-Step的“一句歌词快速写歌”功能赞不绝口,认为其为音乐创作提供了前所未有的便捷性与灵活性。

image.png

技术突破:高效生成与多语言支持

ACE-Step基于DiT(Diffusion Transformer)架构,采用轻量化设计,支持在消费级GPU上运行,显著降低了硬件门槛。在A100GPU上,模型仅需20秒即可生成4分钟的高质量音乐,生成速度比传统模型快15倍以上。此外,ACE-Step支持19种语言,覆盖英语、中文、日语、西班牙语等多种语系,为全球音乐创作者提供了广泛的适用性。AIbase编辑团队了解到,该模型通过与StepFun的Step-1(130亿参数语言模型)结合,经过音频上下文预训练和任务特定后训练,实现了跨模态音乐理解与生成的高效融合。

image.png

开源赋能,社区驱动创新

作为一款开源模型,ACE-Step通过GitHub(stepfun-ai/Step-Audio)向开发者开放,允许社区对其进行微调以适配多样化的音乐任务。ACE Studio与StepFun表示,ACE-Step的简单架构和低硬件要求使其易于扩展,未来有望支持更多音乐风格和创作场景。AIbase观察到,社区开发者已开始基于ACE-Step开发定制化的音乐生成工具,进一步推动了AI音乐生态的繁荣。

AI音乐创作的未来标杆

ACE-Step的发布不仅展示了ACE Studio与StepFun在AI音乐生成领域的深厚技术积累,也为全球音乐创作者提供了一个高效、灵活的创作平台。AIbase编辑团队认为,ACE-Step的快速生成能力和多语言支持将大幅降低音乐创作的门槛,助力音乐家、独立创作者乃至影视制作团队实现创意落地。未来,随着模型的迭代和社区的持续贡献,ACE-Step有望成为AI音乐创作领域的标杆,引领“人机共创”的新潮流。

项目地址:https://ace-step.github.io/

相关资讯

阶跃星辰发布并开源音乐大模型——音跃ACE-Step

阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。 ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。 ACE Studio是一家以生成式AI技术为核心的科技公司,其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品,用户遍布全球,包括格莱美获奖者和世界顶级的工作室。
5/7/2025 4:00:44 PM
AI在线

接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型

两款 Step 系列开源多模态大模型,性能位列开源多模态全行业第一。 本周二,国内 AI 创业公司阶跃星辰和吉利汽车集团宣布联合开源两款多模态大模型。 这两款大模型分别是视频生成模型 Step-Video-T2V 和行业内首款产品级开源语音交互模型 Step-Audio。
2/18/2025 12:45:00 PM
机器之心

阿里云魔搭首发上线阶跃星辰最新开源的两款多模态模型

全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括 全球参数量最大的开源视频生成模型 Step-Video-T2V,以及 业界首款产品级开源语音交互模型 Step-Audio。 这一消息瞬间引爆全球AI开源社区,再次彰显中国在人工智能领域的强劲创新实力。 作为中国最大的AI模型社区,阿里云魔搭社区此次发布的这两款重磅模型,无疑是近期全球多模态领域最受瞩目的开源成果。
2/21/2025 3:58:00 PM
AI在线
  • 1