AI在线 AI在线

音频生成模型

阿里通义开源旗下首个音频生成模型 ThinkSound:可像“专业音效师”一样思考

ThinkSound 首次将 CoT(Chain-of-Thought,思维链)应用到音频生成领域,让 AI 学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成 —— 不只是“看图配音”,而是真正“听懂画面”。
7/4/2025 6:17:39 PM
清源
  • 1