AI在线 AI在线

​谷歌云重磅推出高清语音模型 Chirp 3,支持248种声音

谷歌云在位于伦敦的 DeepMind 总部举行了一场会,正式推出其高清语模型 Chirp3。 该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。 Chirp3支持248种不同的声音,并可用31种语言进行语音合成。

谷歌云在位于伦敦的 DeepMind 总部举行了一场会,正式推出其高清语模型 Chirp3。该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。

QQ_1742262673191.png

Chirp3支持248种不同的声音,并可用31种语言进行语音合成。开发者可以利用这一模型创建多种应用,如智能语音助手、有声读物和视频配音等。谷歌表示,Chirp3的语音功能能够捕捉人类语调的细微差别,使得对话更加生动和引人入胜。

除了使用现成的语音,用户还可以通过谷歌云的文本转语音 API 创建自定义语音。然而,谷歌为了确保负责任的使用,限制了这一语音克隆功能的访问权限,以防止潜在的滥用行为,并确保符合伦理 AI 的实践。

在发布会上,谷歌云首席执行官托马斯・库里安(Thomas Kurian)强调,谷歌的总体愿景是提供一系列广泛的模型,除了 Chirp3外,还包括 Gemini、Imagen、Veil 等多款产品。谷歌还推出了一个名为 Agent Space 的新产品,专为商业用户设计,以满足其特定需求。

谷歌 DeepMind 的首席执行官德米斯・哈萨比斯(Sir Demis Hassabis)也介绍了 Gemini 的演进,尤其是其多模态理解能力。他提到,在 AI Studio 中,用户可以发布 YouTube 链接,Gemini 能够处理视频内容,利用其长时上下文窗口让用户提问,快速找到讲座或体育赛事的关键时刻。

此外,谷歌还借此机会宣布了一项计划,旨在通过综合培训项目来提升英国的 AI 技能,帮助专业人士有效掌握 AI 技术。谷歌将向英国初创企业提供云基础设施和 AI 工具的使用积分,支持它们快速开发和扩展创新解决方案,以刺激创业活动。

在隐私和合规性方面,谷歌重申了对数据驻留的承诺,其 Vertex AI 和 Agent Space AI 工具可以帮助组织在符合当地法律的情况下,进行模型的训练和服务。这一点对于医疗和金融等行业至关重要,因为这些领域对隐私和合规性要求极高。

项目:https://cloud.google.com/text-to-speech/docs/chirp3-hd

划重点:

🌟 谷歌云推出 Chirp3语音模型,支持248种声音和31种语言,助力开发者构建智能应用。  

🔒 谷歌限制语音克隆功能的访问权限,以确保伦理 AI 的实践和防止滥用。  

💼 谷歌发起计划提升英国 AI 技能,并向初创企业提供云基础设施支持,促进创新。

相关资讯

Anthropic发布Citations功能,助力开发者获取AI生成答案的来源文献

为了加强其AI模型的透明性和可追溯性,Anthropic于周四宣布推出一项新功能——Citations。 该功能旨在帮助开发者在通过Claude AI系列生成的答案中,提供来自源文档的精确引用,包括句子和段落。 这一创新功能首次推出后,立即在Anthropic的API和Google的Vertex AI平台上提供支持。
1/24/2025 9:28:00 AM
AI在线

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM
准泽(实习)
  • 1