AI在线 AI在线

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现

AI在线 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。 该系列模型以开源形式推出,可以更低价格提供领先的低错误率表现,支持真实世界的语音智能生产应用。 Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

AI在线 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出,可以更低价格提供领先的低错误率表现,支持真实世界的语音智能生产应用

Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度,可处理 30 分钟音频转录或 40 分钟音频理解,内置生成相关问题、结构化摘要的能力,支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper,而价格不到后者的一半;而在高级用例方面,Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近,价格也不到一半。

相关资讯

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。 一出手就是号称「世界上最好的 OCR 模型」! 新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。
3/7/2025 12:53:00 PM
机器之心

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

就在刚刚,那个曾经开源了首个 MoE 模型的欧洲初创公司 Mistral AI 在沉寂一段时间之后又出新活。 Mistral 团队发布了一个号称“全世界最好的 OCR”的产品 —— Mistral OCR,旨在将一些 AI 难以直接识别的粗糙且复杂的文件进行整理,便于 AI 操作识别。 帖子一经发出,评论区瞬间充满了各种夸夸言论,但在一众赞美声中,也不乏一些真正用过产品的网友的理智发言。
3/14/2025 4:25:00 PM
郑佳美

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

小模型正在变得越来越好,而且越来越便宜。 刚刚,法国 AI 创企 Mistral AI 开源了一个 24B 的多模态小模型,该模型在多个基准上击败了 Gemma 3 和 GPT-4o Mini 等同类模型,而且推理速度达到了 150 个 token / 秒,称得上是又好又快。 重要的是,它只需要一个 RTX 4090 或 32GB RAM 的 Mac 就能运行,而且开源协议是 Apache 2.0,因此既能用于研究,也能商用。
3/18/2025 3:58:00 PM
机器之心
  • 1