声音
Google 推出 DolphinGemma,助力海豚语言研究的新里程碑
近日,Google 宣布推出一款名为 DolphinGemma 的大型语言模型,旨在帮助科学家们更深入地理解海豚的交流方式。 这项新技术由 Gemini2.5Pro Experimental 驱动,并与佐治亚理工学院及其野生海豚项目(WDP)紧密合作。 WDP 的目标是通过长时间的非侵入式观察,记录和分析大西洋斑点海豚(Stenella frontalis)的自然行为和社会结构,特别是它们的交流模式。
4/15/2025 10:01:27 AM
AI在线
谷歌公布鲸鱼声音识别 AI 科研模型,可辨别 8 种不同鲸群
据谷歌新闻稿,谷歌公司正持续投入资源开发可用于识别鲸鱼声音的 AI 模型,其最新的多物种鲸鱼声音模型能够识别 8 种鲸鱼的叫声,并进一步细分其中两种鲸鱼的不同发声类型。谷歌表示,这项技术主要用于海洋学术研究,能够帮助科研团队获取布氏鲸等“较难以观察的”鲸群行为模式,目前该模型已公开供学术人员下载使用,AI在线附地址(点此访问)。据悉,谷歌公司自 2018 年以来便与美国国家海洋和大气管理局(NOAA)的太平洋群岛渔业科学中心合作,展开鲸鱼叫声分类的研究。最初,他们针对座头鲸开发了检测模型,成功辨识座头鲸的鸣叫声,从
9/27/2024 12:51:33 PM
漾仔
OpenAI ChatGPT 被曝将新增 8 种新语音:更自然表达狗叫等动物声音
科技媒体 testingcatalog 昨日(9 月 2 日)发布博文,报道称通过逆向工程 ChatGPT 应用,发现 OpenAI 即将扩充添加语音,让朗读的声音更加自然和富有表现力。有迹象表明 OpenAI 未来可能会额外推出 8 种新的语音,每种语音都有一个独特的代号,后续可能会逐步推出。这些新声音的另一个有趣特点是,它们能够更自然地表达声音,如动物叫声或其他非语言声音。此外,在朗读加粗或斜体的文字时,它们还能传达或强调特定的情绪。不过,重要的是要记住,这些仍然是 TTS(文本到语音)语音,很可能与目前处于
9/3/2024 7:17:40 AM
故渊
语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具
OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份声明中表示,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育,以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑,即可
6/10/2024 9:57:21 AM
远洋
斯嘉丽・约翰逊控诉 ChatGPT 复制其声音,OpenAI 文件显示并非故意模仿
好莱坞明星斯嘉丽・约翰逊此前指控人工智能公司 OpenAI 的聊天机器人 ChatGPT 的 “Sky” 语音上复制了她的声音。据《华盛顿邮报》披露的 OpenAI 内部文件显示,该公司并没有刻意模仿斯嘉丽的声音。图源 Pexels文件显示,为“Sky”配音的实际上是另一位演员,而且该演员的聘用时间早于 OpenAI 邀请斯嘉丽为 ChatGPT 配音数月。参与“Sky”配音创作的多位人员也证实,OpenAI 在寻找配音演员时并没有要求声音接近斯嘉丽。文件显示,OpenAI 在招聘启事中对配音演员的描述包括:非工会
5/23/2024 4:50:34 PM
远洋
全国首例 AI 声音侵权案一审宣判,原告配音师获赔 25 万元
感谢据央视新闻消息,北京互联网法院今天上午对全国首例“AI 声音侵权案”进行一审宣判,认定作为配音师的原告,其声音权益及于案涉 AI 声音,被告方使用原告声音、开发案涉 AI 文本转语音产品未获得合法授权,构成侵权,书面赔礼道歉,并赔偿原告各项损失 25 万元。IT之家汇总案件经过如下:本案原告殷某是一名配音师,曾录制多部有声作品。去年其意外发现自己的声音被 AI 化后,在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。殷某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京某智能公司等五被告起诉
4/23/2024 11:50:10 AM
清源
百度文心一言上线新功能,可快速定制自己的 AI 声音
感谢近日百度文心一言上线了新功能,仅需几秒钟即可定制自己的声音。据IT之家了解,想要体验这一功能,只需打开文心一言 App,点击下方“ ”,然后选择创建智能体。在声音选项里,会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话,只需两秒左右的时间,系统便能捕捉到你的声音特点,为你生成一个独特的“语音助手”。在确认声音质量后,你的专属“语音库”就在瞬间构建完成。今后,在与智能体的每一次对话中,你都可以点击播放键,使用自己合成的音色进行语音播报。此外,还可以点击对话框上的通话按钮,与你自己构建的数字分身实时对话
4/7/2024 3:10:28 PM
远洋
《语音识别基础:(一)语音是什么》
从最起初的一声巨响,到梵音天籁,到耳旁的窃窃私语,到妈妈喊我回家吃饭,总离不开声音。声音是这个世界存在并运动着的证据。
7/29/2021 6:44:00 PM
语音之家
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉