AI在线 AI在线

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。

科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。

AI在线曾于 2023 年 2 月报道,开发者 Jordi Bruin 推出 MacWhisper 应用,主要基于 OpenAI 的 Whisper 转录模型,可以在本地完成音频文件转录为文本的工作。

不过随着 OpenAI 将重点转向更具商业价值的 gpt-4o-transcribe 模型,Whisper 开始显得有些过时,更快、更新的转录模型一次次超越 Whisper。

英伟达于上月宣布 Parakeet 模型,拥有 A100、H100、T4 或 V100 GPU 的硬件上,仅需 1 秒钟就能转录 60 分钟的音频。

Parakeet 可以通过开源工具获得,但问题在于,并非每个人都熟悉命令行界面或自定义模型部署,而用户现在通过新版 MacWhisper,可以更轻松地使用该功能。

应用开发者 Jordi Bruin 表示:“得益于我们与 Argmax 团队的协作,MacWhisper 现在支持 Parakeet 模型。为了展示这一变化的重大意义,请查看下面的 GIF,我们用不到 8 秒的时间转录并整理了一个 30 分钟的播客!

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

该媒体随后用新版 MacWhisper 应用实测,一个 3 小时的 9to5Mac Happy Hour 播客节目,转录仅用了 1 分 22 秒。

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

相关资讯

​ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。 该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。 根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。
2/27/2025 9:56:00 AM
AI在线

晚上就应该睡觉?新的机器学习技术探索昼夜节律

编辑 | 雪松昼夜节律,如睡眠-觉醒周期,是大多数生物与生俱来的,对地球上的生命至关重要。昼夜时钟在 24 小时日夜周期中协调生物的各项生理变化,会间接影响我们人类的体能水平、健康程度、生存能力。同样,将新陈代谢与日出落日同步等情况也存在于植物中,准确的生物钟有助于调节开花。了解昼夜节律,于植物而言,有助于提高植物的生长和产量;于人类而言,则有可能揭示出治疗疾病的新途径。IBM欧洲研究所与厄尔汉姆研究所的合作团队,描述了一系列基于人工智能(AI)和机器学习(ML)的方法。这些方法可以进行更具成本效益的分析并深入了解
9/22/2021 11:40:00 AM
ScienceAI

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷:会凭空生成大段虚假内容

当地时间 27 日,据美联社报道,超过十位软件工程师、开发人员和学术研究人员称,OpenAI 的语音转写工具 Whisper 存在一个重大缺陷:有时会凭空生成大段甚至整句虚假内容。 这些专家指出,这些生成的文本(AI在线注:业内通常称为“AI 幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。 专家们认为,这一问题尤其令人担忧,因为 Whisper 已被广泛应用于全球多个行业,包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。
10/28/2024 8:47:58 AM
清源
  • 1