声音

NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色

NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色

NBC 近日宣布，将在即将到来的 NBA 赛事中使用已故体育解说员 Jim Fagan 的 AI 生成声音。 Fagan 于2017年去世，他的声音曾在1990至2002年期间为 NBC 的 NBA 报道增添了不少风采。 NBC 计划在10月份重新播出 NBA 比赛时，将 Fagan 的 AI 声音运用于选定的片头序列、节目开场及宣传片中。

5/7/2025 2:00:54 PM AI在线

Google 推出 DolphinGemma，助力海豚语言研究的新里程碑

Google 推出 DolphinGemma，助力海豚语言研究的新里程碑

近日，Google 宣布推出一款名为 DolphinGemma 的大型语言模型，旨在帮助科学家们更深入地理解海豚的交流方式。这项新技术由 Gemini2.5Pro Experimental 驱动，并与佐治亚理工学院及其野生海豚项目（WDP）紧密合作。 WDP 的目标是通过长时间的非侵入式观察，记录和分析大西洋斑点海豚(Stenella frontalis)的自然行为和社会结构，特别是它们的交流模式。

4/15/2025 10:01:27 AM AI在线

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

据谷歌新闻稿，谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型，其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声，并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示，这项技术主要用于海洋学术研究，能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式，目前该模型已公开供学术人员下载使用，AI在线附地址（点此访问）。据悉，谷歌公司自 2018 年以来便与美国国家海洋和大气管理局（NOAA）的太平洋群岛渔业科学中心合作，展开鲸鱼叫声分类的研究。最初，他们针对座头鲸开发了检测模型，成功辨识座头鲸的鸣叫声，从

9/27/2024 12:51:33 PM 漾仔

OpenAI ChatGPT 被曝将新增 8 种新语音：更自然表达狗叫等动物声音

OpenAI ChatGPT 被曝将新增 8 种新语音：更自然表达狗叫等动物声音

科技媒体 testingcatalog 昨日（9 月 2 日）发布博文，报道称通过逆向工程 ChatGPT 应用，发现 OpenAI 即将扩充添加语音，让朗读的声音更加自然和富有表现力。有迹象表明 OpenAI 未来可能会额外推出 8 种新的语音，每种语音都有一个独特的代号，后续可能会逐步推出。这些新声音的另一个有趣特点是，它们能够更自然地表达声音，如动物叫声或其他非语言声音。此外，在朗读加粗或斜体的文字时，它们还能传达或强调特定的情绪。不过，重要的是要记住，这些仍然是 TTS（文本到语音）语音，很可能与目前处于

9/3/2024 7:17:40 AM 故渊

语音克隆技术引发担忧，OpenAI 再次解释其文本转语音工具

语音克隆技术引发担忧，OpenAI 再次解释其文本转语音工具

OpenAI 在几个月内第二次就其文本转语音工具进行解释，并再次强调该工具目前并未大范围开放，且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术，让世界各地的人们理解这项技术的发展方向都非常重要，”OpenAI 公司周五在其网站上发布的一份声明中表示，“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育，以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解，去年年底，OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑，即可

6/10/2024 9:57:21 AM 远洋

斯嘉丽・约翰逊控诉 ChatGPT 复制其声音，OpenAI 文件显示并非故意模仿

斯嘉丽・约翰逊控诉 ChatGPT 复制其声音，OpenAI 文件显示并非故意模仿

好莱坞明星斯嘉丽・约翰逊此前指控人工智能公司 OpenAI 的聊天机器人 ChatGPT 的 “Sky” 语音上复制了她的声音。据《华盛顿邮报》披露的 OpenAI 内部文件显示，该公司并没有刻意模仿斯嘉丽的声音。图源 Pexels文件显示，为“Sky”配音的实际上是另一位演员，而且该演员的聘用时间早于 OpenAI 邀请斯嘉丽为 ChatGPT 配音数月。参与“Sky”配音创作的多位人员也证实，OpenAI 在寻找配音演员时并没有要求声音接近斯嘉丽。文件显示，OpenAI 在招聘启事中对配音演员的描述包括：非工会

5/23/2024 4:50:34 PM 远洋

全国首例 AI 声音侵权案一审宣判，原告配音师获赔 25 万元

全国首例 AI 声音侵权案一审宣判，原告配音师获赔 25 万元

感谢据央视新闻消息，北京互联网法院今天上午对全国首例“AI 声音侵权案”进行一审宣判，认定作为配音师的原告，其声音权益及于案涉 AI 声音，被告方使用原告声音、开发案涉 AI 文本转语音产品未获得合法授权，构成侵权，书面赔礼道歉，并赔偿原告各项损失 25 万元。IT之家汇总案件经过如下：本案原告殷某是一名配音师，曾录制多部有声作品。去年其意外发现自己的声音被 AI 化后，在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。殷某以被告行为侵害其声音权为由，将“魔音工坊”的运营主体北京某智能公司等五被告起诉

4/23/2024 11:50:10 AM 清源

百度文心一言上线新功能，可快速定制自己的 AI 声音

百度文心一言上线新功能，可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能，仅需几秒钟即可定制自己的声音。据IT之家了解，想要体验这一功能，只需打开文心一言 App，点击下方“ ”，然后选择创建智能体。在声音选项里，会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话，只需两秒左右的时间，系统便能捕捉到你的声音特点，为你生成一个独特的“语音助手”。在确认声音质量后，你的专属“语音库”就在瞬间构建完成。今后，在与智能体的每一次对话中，你都可以点击播放键，使用自己合成的音色进行语音播报。此外，还可以点击对话框上的通话按钮，与你自己构建的数字分身实时对话

4/7/2024 3:10:28 PM 远洋

《语音识别基础：（一）语音是什么》

《语音识别基础：（一）语音是什么》

从最起初的一声巨响，到梵音天籁，到耳旁的窃窃私语，到妈妈喊我回家吃饭，总离不开声音。声音是这个世界存在并运动着的证据。

7/29/2021 6:44:00 PM 语音之家

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉