Mistral AI
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
小模型正在变得越来越好,而且越来越便宜。 刚刚,法国 AI 创企 Mistral AI 开源了一个 24B 的多模态小模型,该模型在多个基准上击败了 Gemma 3 和 GPT-4o Mini 等同类模型,而且推理速度达到了 150 个 token / 秒,称得上是又好又快。 重要的是,它只需要一个 RTX 4090 或 32GB RAM 的 Mac 就能运行,而且开源协议是 Apache 2.0,因此既能用于研究,也能商用。
3/18/2025 3:58:00 PM
机器之心
欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版
就在刚刚,那个曾经开源了首个 MoE 模型的欧洲初创公司 Mistral AI 在沉寂一段时间之后又出新活。 Mistral 团队发布了一个号称“全世界最好的 OCR”的产品 —— Mistral OCR,旨在将一些 AI 难以直接识别的粗糙且复杂的文件进行整理,便于 AI 操作识别。 帖子一经发出,评论区瞬间充满了各种夸夸言论,但在一众赞美声中,也不乏一些真正用过产品的网友的理智发言。
3/14/2025 4:25:00 PM
郑佳美
千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。 一出手就是号称「世界上最好的 OCR 模型」! 新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。
3/7/2025 12:53:00 PM
机器之心
Mistral AI 旗下 Codestral 模型获 25.01 更新:支持超 80 种编程语言、上下文长度提至 25.6 万个 Token
Mistral AI 宣布为旗下 Codestral 编程模型推出 25.01 版本,官方强调相关版本主要在处理上下文长度和代码完成效率方面获得较大改进。
1/17/2025 10:25:30 PM
漾仔
发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型
一觉醒来,Mistral AI 又发力了。 就在今天,Mistral AI 多模态家族迎来了第二位成员:一个名为 Pixtral Large 的超大杯基础模型。 这是一个基于 Mistral Large 2 构建、124B 开放权重的多模态模型,具备顶尖的图像理解能力 —— 能够看懂文档、图表和自然图像,同时保持 Mistral Large 2 领先的纯文本理解能力。
11/19/2024 12:53:00 PM
机器之心
Mistral首个多模态模型Pixtral 12B来了!还是直接放出24GB磁力链接
训练完就直接上模型。我们都知道,Mistral 团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接,可以看到大小共 23.64 GB,其中包含 4 个文件,其中最大的文件是一个封装的多模态大模型。动作快的非官方 Mistral 社区已经将该模型上传到了 Hugging Face。磁力链接:magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910Hugging Fac
9/12/2024 2:10:00 PM
机器之心
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
AI 竞赛正以前所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大」。具体来
7/25/2024 10:20:00 AM
机器之心
小模型卷起来了:Mistral联合英伟达开源12B小模型,128k上下文
小模型,正在成为 AI 巨头的新战场。今天凌晨,OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-3.5,作为免费模型在 ChatGPT 上提供。其 API 价格也非常美丽,每百万输入 token 仅为 15 美分,每百万输出 token 60 美分, 比之前的 SOTA 模型便宜一个数量级,比 OpenAI 此前最便宜的 GPT-3.5 Turbo 还要便宜 60% 以上。OpenAI CEO 山姆・奥特曼对此的形容是:通往智能的成本已经「too che
7/19/2024 2:40:00 PM
机器之心
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽 Mistral AI 发布了一个专注于数学推理和科学发现的7B大模型「Mathstral」,来解决需要复杂、多步骤逻辑推理的高级数学问题。该
7/17/2024 2:57:00 PM
机器之心
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
开放但禁止商用用途。对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作:首个代码大模型 Codestral 诞生了。作为一个专为代码生成任务设计的开放式生成 AI 模型,Codestral 通过共享指令和补全 API 端点帮助开发人员编写并与代码交互。Codestral 精通代码和英语,因而可为软件开发人员设计高级 AI 应用。Codestral 的参数规模为 22B,遵循新的 Mistral AI Non-Production License,可以用于研究和测试目的,但禁止商用。目前,该模
5/30/2024 2:43:00 PM
机器之心
32K上下文,Mistral 7B v0.2 基模型突然开源了
刚刚,Mistral AI 的模型又更新了。这次开源一如既往地「突然」,是在一个叫做 Cerebral Valley 的黑客松活动上公布的。PPT 一翻页,全场都举起了手机拍照:这次开源的 Mistral 7B v0.2 Base Model ,是 Mistral-7B-Instruct-v0.2 背后的原始预训练模型,后者属于该公司的「Mistral Tiny」系列。此次更新主要包括三个方面:将 8K 上下文提到了 32K;Rope Theta = 1e6;取消滑动窗口。下载链接::场外观众迅速跟进。有人评价说:
3/25/2024 11:23:00 AM
机器之心
Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光
Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间,那个爆火整个开源社区的 Mixtral 8x7B MoE 模型论文放出了。此前,由于 OpenAI 团队一直对 GPT-4 的参数量和训练细节守口如瓶。Mistral 8x7B 的放出,无疑给广大开发者提供了一种「非常接近 GPT-4」的开源选项。要知道,很早之前就有人爆料,OpenAI 也是采用了「混合专家模型」(Mixture of Experts,MoE)的构架来搭建 GPT-4。随着论文的放出,一些研究
1/10/2024 5:16:00 PM
机器之心
8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理
感兴趣的小伙伴,可以跟着操作过程试一试。前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相似,很多人将其形容为 GPT-4 的「缩小版」。我们都知道,OpenAI 团队一直对 GPT-4 的参数量和训练细节守口如瓶。Mistral 8x7B 的放出,无疑给广大开发者提供了一种「非常接近 GPT-4」的开源选项。在基准测试中,Mistral 8x7B 的表现优于 Llama 2 70B,在大多数标准基准测试上与 GPT-3.5 不相上下,甚至略胜一筹。
1/2/2024 2:25:00 PM
机器之心
一条磁力链接席卷AI圈,87GB种子直接开源8x7B MoE模型
「高端」的开源,往往采用最朴素的发布方式。昨天,Mistral AI 在 X 平台甩出一条磁力链接,宣布了新的开源动作。没有长篇官方博客,没有刻意加速的 Demo,这家公司算是当下大模型领域的「一股清流」。打开一看,发现是接近 87 GB 的种子:参数配置什么样?很多人放弃了周末,第一时间下载运行起来。看上去,Mistral 8x7B 使用了与 GPT-4 非常相似的架构,但是「缩小版」: 8 个专家总数,而不是 16 名(减少一半) 每个专家为 7B 参数,而不是 166B(减少 24 倍)42B 总参数(估计)
12/11/2023 3:44:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind