AI在线 AI在线

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。

科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。

AI在线曾于 2023 年 2 月报道,开发者 Jordi Bruin 推出 MacWhisper 应用,主要基于 OpenAI 的 Whisper 转录模型,可以在本地完成音频文件转录为文本的工作。

不过随着 OpenAI 将重点转向更具商业价值的 gpt-4o-transcribe 模型,Whisper 开始显得有些过时,更快、更新的转录模型一次次超越 Whisper。

英伟达于上月宣布 Parakeet 模型,拥有 A100、H100、T4 或 V100 GPU 的硬件上,仅需 1 秒钟就能转录 60 分钟的音频。

Parakeet 可以通过开源工具获得,但问题在于,并非每个人都熟悉命令行界面或自定义模型部署,而用户现在通过新版 MacWhisper,可以更轻松地使用该功能。

应用开发者 Jordi Bruin 表示:“得益于我们与 Argmax 团队的协作,MacWhisper 现在支持 Parakeet 模型。为了展示这一变化的重大意义,请查看下面的 GIF,我们用不到 8 秒的时间转录并整理了一个 30 分钟的播客!

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

该媒体随后用新版 MacWhisper 应用实测,一个 3 小时的 9to5Mac Happy Hour 播客节目,转录仅用了 1 分 22 秒。

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

相关资讯

​ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。 该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。 根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。
2/27/2025 9:56:00 AM
AI在线

ChatGPT 新增音频转录功能!办公利器让你轻松记录会议要点

近日,OpenAI 在 macOS 平台上推出了一项备受瞩目的新功能 ——ChatGPT 音频录制与转录模式。 这一功能专为付费用户设计,旨在帮助他们更加高效地记录和分析各种音频内容,比如会议、头脑风暴讨论以及个人语音笔记。 自6月初发布更新视频以来,这一新功能备受期待。
7/17/2025 2:21:40 PM
AI在线

微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言

AI在线 7 月 31 日消息,科技媒体 NeoWin 今天(7 月 31 日)发布博文,报道称微软推出了 DragonV2.1Neural 零次学习(Zero-Shot Learning)模型,仅凭少量数据就能创建更加自然、表现力强的声音,并支持超过 100 种语言。 AI在线援引博文介绍,这是一种零次学习的文本到语音(TTS)模型,承诺提供更加自然和富有表现力的声音,并提高了发音的准确性以及增强了可控性。 新模型仅需几秒钟的语音样本即可合成超过 100 种语言的语音。
7/31/2025 12:57:12 PM
故渊
  • 1