AI在线 AI在线

速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI 生成 11 秒音频

AI 初创公司 Stability AI 推出 Stable Audio Open Small,号称是市场上速度最快的“立体声”音频生成 AI 模型,可在智能手机上运行。

科技媒体 TechCrunch 昨日(5 月 14 日)发布博文,报道称 AI 初创公司 Stability AI 推出 Stable Audio Open Small,号称是市场上速度最快的“立体声”音频生成 AI 模型,可在智能手机上运行。

相比较 Suno 和 Udio 等其他 AI 音频应用,Stable Audio Open Small 无需依赖云端处理,其高效设计让它能在智能手机上流畅运行。Stability AI 表示,该模型能在不到 8 秒的时间内,在手机上生成最长 11 秒的音频片段,适用于快速制作鼓点或乐器片段等音效。

在训练方面,Stability AI 携手芯片制造商 Arm,针对 Arm CPU 特别优化,可以在智能手机上离线运行;在训练数据集方面,不同于 Suno 和 Udio 等竞争对手(据称使用了含版权内容的数据,存在知识产权风险),全部来自 Free Music Archive 和 Freesound 免版税音频库。

AI在线注:现阶段 Stable Audio Open Small 仅支持英文提示,无法生成逼真的歌声或高质量歌曲,且由于训练数据偏向西方风格,不同音乐类型的表现参差不齐

此外使用条款较为严格:研究人员、爱好者及年收入低于 100 万美元的企业可免费使用,但超过这一收入门槛的开发者或组织需购买 Stability AI 的企业许可证。

速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI 生成 11 秒音频

相关资讯

简化芯片设计传统,AI训练的新型算法正改变芯片研发范式

编辑丨&自1971年第一个商用微处理器的草图面世以来,芯片设计已经取得了长足的进步。 但是,随着芯片变得越来越复杂,设计人员必须解决的问题也越来越复杂。 而我们目前的工具并不总是能胜任这项任务。
1/7/2025 2:51:00 PM
ScienceAI

光中介层可能在 2025 年开始加速 AI

编辑丨toileter光纤电缆正在逐渐靠近高性能计算机中的处理器,用玻璃取代铜连接。 科技公司希望通过将光学连接从服务器外部移动到主板上,然后让它们与处理器并排放置,从而加速 AI 并降低其能源成本。 现在,科技公司准备在寻求成倍增加处理器潜力的道路上走得更远——通过滑入处理器下面的连接。
2/5/2025 2:30:00 PM
ScienceAI

2024 年 AI 十大故事,透视技术变革与未来挑战

编辑 | 20492024 年,人工智能技术持续改变着我们的生活和工作方式。 IEEE Spectrum 精选了年度最具影响力的 10 个 AI 故事,从技术突破到社会影响,全方位展现了 AI 发展的现状与挑战。 这些故事不仅反映了生成式 AI 的革命性进展,也揭示了其存在的局限与争议。
2/6/2025 2:06:00 PM
ScienceAI
  • 1