单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

作者：机器之心 2025-03-18 03:58

小模型正在变得越来越好，而且越来越便宜。刚刚，法国 AI 创企 Mistral AI 开源了一个 24B 的多模态小模型，该模型在多个基准上击败了 Gemma 3 和 GPT-4o Mini 等同类模型，而且推理速度达到了 150 个 token / 秒，称得上是又好又快。重要的是，它只需要一个 RTX 4090 或 32GB RAM 的 Mac 就能运行，而且开源协议是 Apache 2.0，因此既能用于研究，也能商用。

小模型正在变得越来越好，而且越来越便宜。

刚刚，法国 AI 创企 Mistral AI 开源了一个 24B 的多模态小模型，该模型在多个基准上击败了 Gemma 3 和 GPT-4o Mini 等同类模型，而且推理速度达到了 150 个 token / 秒，称得上是又好又快。

重要的是，它只需要一个 RTX 4090 或 32GB RAM 的 Mac 就能运行，而且开源协议是 Apache 2.0，因此既能用于研究，也能商用。

具体来说，Mistral Small 3.1 是基于 Mistral Small 3 构建的。与 Mistral Small 3 相比，它的上下文窗口更大，达到了 128k（Mistral Small 3 仅为 32k），文本生成能力得到了改进，还新增了视觉能力。

Mistral 官方表示，Mistral Small 3.1 是一款多功能模型，旨在处理各种生成式 AI 任务，包括指令遵循、对话辅助、图像理解和函数调用。它为企业级和消费级 AI 应用提供了坚实的基础。

目前，部分开发者已经在自己的设备上完成了部署，并晒出了体验效果：

Mistral Small 3.1 可在 huggingface 网站 Mistral Small 3.1 Base 和 Mistral Small 3.1 Instruct 上下载。

Mistral Small 3.1 Base：https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Base-2503
Mistral Small 3.1 Instruct：https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503

以下是该模型的详细信息。

核心特性

Mistral Small 3.1 具有以下特点：

轻量级：可以在单个 RTX 4090 或具有 32GB RAM 的 Mac 上运行。这使其非常适合端侧使用情况。
快速响应能力：非常适合虚拟助手和其他需要快速、准确响应的应用程序。
低延迟函数调用：能够在自动化或智能体工作流中快速执行函数。
针对专业领域进行微调：Mistral Small 3.1 可以针对特定领域进行微调，打造精准的主题专家。这在法律咨询、医疗诊断和技术支持等领域尤其有用。
高级推理的基础：开放的 Mistral 模型已经被开发者用来构建出色的推理模型，比如 Nous Research 的 DeepHermes 24B 就是基于 Mistral Small 3 构建出来的。为了鼓励这种创新，Mistral AI 发布了 Mistral Small 3.1 的基础模型和指令检查点，以便社区进一步对模型进行下游定制。

Mistral Small 3.1 可用于需要多模态理解的各种 B 端和 C 端应用程序，例如文档验证、诊断、端侧图像处理、质量检查的视觉检查、安全系统中的物体检测、基于图像的客户支持和通用协助。

性能展示

以下是 Mistral Small 3.1 在文本、多模态、多语言、长上下文等场景中的性能表现情况。

文本指令基准

多模态指令基准

多语言指令基准

预训练性能

参考链接：https://mistral.ai/news/mistral-small-3-1

开源新秀 Mistral Small 3：低延迟、高性能、Apache 2.0 许可，赋能 AI 应用

科技媒体 marktechpost 昨日（1 月 31 日）发布博文，报道称 Mistral AI 发布了 Small 3（全称为 Mistral-Small-24B-Instruct-2501）模型，共有 240 亿参数，实现了先进的推理能力、多语言支持和便捷的应用集成，并在多个基准测试中取得了令人瞩目的成绩。

2/1/2025 1:52:29 PM 故渊

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

模型参数量只有 137M，5 天就能训练好。一周前，OpenAI 给广大用户发放福利，在下场修复 GPT-4 变懒的问题后，还顺道上新了 5 个新模型，其中就包括更小且高效的 text-embedding-3-small 嵌入模型。我们知道，嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联，也更容易执行聚类或检索等任务。可见，嵌入在 NLP 领域是非常重要的。不过，OpenAI 的嵌入模型并不是免费给大家使用的，比如 text-embedding-3-small

2/4/2024 3:31:00 PM 机器之心

Deep Integration of Grok AI into X Algorithm: Small Creators Welcome Spring with Smarter Comment Interaction

X platform recently announced a major update to its recommendation algorithm, deeply integrating its self-developed Grok AI technology, with the aim of optimizing user content experience and significantly increasing the exposure opportunities for small accounts. This adjustment is considered by the industry as an important innovation in the traditional social media content distribution mechanism.Core Upgrade of the Algorithm: Quality First, Scale Makes WayThe core of the latest algorithm update lies in providing more visibility to small accounts. The platform now highlights content from lesser-known creators, creating a more equitable competitive environment.

6/16/2025 9:48:51 AM AI在线

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

相关资讯

开源新秀 Mistral Small 3：低延迟、高性能、Apache 2.0 许可，赋能 AI 应用

击败OpenAI，权重、数据、代码全开源，能完美复现的嵌入模型Nomic Embed来了

Deep Integration of Grok AI into X Algorithm: Small Creators Welcome Spring with Smarter Comment Interaction