声音
NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色
NBC 近日宣布,将在即将到来的 NBA 赛事中使用已故体育解说员 Jim Fagan 的 AI 生成声音。 Fagan 于2017年去世,他的声音曾在1990至2002年期间为 NBC 的 NBA 报道增添了不少风采。 NBC 计划在10月份重新播出 NBA 比赛时,将 Fagan 的 AI 声音运用于选定的片头序列、节目开场及宣传片中。
5/7/2025 2:00:54 PM
AI在线
Google 推出 DolphinGemma,助力海豚语言研究的新里程碑
近日,Google 宣布推出一款名为 DolphinGemma 的大型语言模型,旨在帮助科学家们更深入地理解海豚的交流方式。 这项新技术由 Gemini2.5Pro Experimental 驱动,并与佐治亚理工学院及其野生海豚项目(WDP)紧密合作。 WDP 的目标是通过长时间的非侵入式观察,记录和分析大西洋斑点海豚(Stenella frontalis)的自然行为和社会结构,特别是它们的交流模式。
4/15/2025 10:01:27 AM
AI在线
谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群
据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从
9/27/2024 12:51:33 PM
漾仔
OpenAI ChatGPT 被曝将新增 8 种新语音:更自然表达狗叫等动物声音
科技媒体 testingcatalog 昨日(9 月 2 日)发布博文,报道称通过逆向工程 ChatGPT 应用,发现 OpenAI 即将扩充添加语音,让朗读的声音更加自然和富有表现力。有迹象表明 OpenAI 未来可能会额外推出 8 种新的语音,每种语音都有一个独特的代号,后续可能会逐步推出。这些新声音的另一个有趣特点是,它们能够更自然地表达声音,如动物叫声或其他非语言声音。此外,在朗读加粗或斜体的文字时,它们还能传达或强调特定的情绪。不过,重要的是要记住,这些仍然是 TTS(文本到语音)语音,很可能与目前处于
9/3/2024 7:17:40 AM
故渊
语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具
OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份声明中表示,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育,以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑,即可
6/10/2024 9:57:21 AM
远洋
斯嘉丽・约翰逊控诉 ChatGPT 复制其声音,OpenAI 文件显示并非故意模仿
好莱坞明星斯嘉丽・约翰逊此前指控人工智能公司 OpenAI 的聊天机器人 ChatGPT 的 “Sky” 语音上复制了她的声音。据《华盛顿邮报》披露的 OpenAI 内部文件显示,该公司并没有刻意模仿斯嘉丽的声音。图源 Pexels文件显示,为“Sky”配音的实际上是另一位演员,而且该演员的聘用时间早于 OpenAI 邀请斯嘉丽为 ChatGPT 配音数月。参与“Sky”配音创作的多位人员也证实,OpenAI 在寻找配音演员时并没有要求声音接近斯嘉丽。文件显示,OpenAI 在招聘启事中对配音演员的描述包括:非工会
5/23/2024 4:50:34 PM
远洋
全国首例 AI 声音侵权案一审宣判,原告配音师获赔 25 万元
感谢据央视新闻消息,北京互联网法院今天上午对全国首例“AI 声音侵权案”进行一审宣判,认定作为配音师的原告,其声音权益及于案涉 AI 声音,被告方使用原告声音、开发案涉 AI 文本转语音产品未获得合法授权,构成侵权,书面赔礼道歉,并赔偿原告各项损失 25 万元。IT之家汇总案件经过如下:本案原告殷某是一名配音师,曾录制多部有声作品。去年其意外发现自己的声音被 AI 化后,在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。殷某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京某智能公司等五被告起诉
4/23/2024 11:50:10 AM
清源
百度文心一言上线新功能,可快速定制自己的 AI 声音
感谢近日百度文心一言上线了新功能,仅需几秒钟即可定制自己的声音。据IT之家了解,想要体验这一功能,只需打开文心一言 App,点击下方“ ”,然后选择创建智能体。在声音选项里,会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话,只需两秒左右的时间,系统便能捕捉到你的声音特点,为你生成一个独特的“语音助手”。在确认声音质量后,你的专属“语音库”就在瞬间构建完成。今后,在与智能体的每一次对话中,你都可以点击播放键,使用自己合成的音色进行语音播报。此外,还可以点击对话框上的通话按钮,与你自己构建的数字分身实时对话
4/7/2024 3:10:28 PM
远洋
《语音识别基础:(一)语音是什么》
从最起初的一声巨响,到梵音天籁,到耳旁的窃窃私语,到妈妈喊我回家吃饭,总离不开声音。声音是这个世界存在并运动着的证据。
7/29/2021 6:44:00 PM
语音之家
- 1
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
AI设计
Claude
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
Transformer
LLM
字节跳动
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构