24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

作者： 2025-05-22 01:43

Mistral沉默好久，果然在憋大招。刚刚发布最新开源编程模型Devstral，在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。并且参数只有24B，可以在单卡RTX4090甚至32G内存的Mac上运行。

Mistral沉默好久，果然在憋大招。

刚刚发布最新开源编程模型Devstral，在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。

并且参数只有24B，可以在单卡RTX4090甚至32G内存的Mac上运行。

Devstral专为编程智能体推出，解决传统大模型只擅长碎片化的编程任务，难以解决现实世界软件工程的问题。

它针对真实的GitHub Issue训练，重点在大型代码库中代码的上下文理解、识别不同组件间的关系，以及识别复杂函数中的细微错误。

在包含500个真实GitHub Issue问题的SWE-Bench Verified基准测试中，Devstral不仅成为开源SOTA，还优于许多同等参数规模的闭源模型。

Devstral由Mistral AI和All Hands AI合作开发，使用Apache2.0开源许可。与上一款代码模型Codestral明确禁止“员工在公司业务活动中进行任何内部使用”相比也更开放了。

这次发布没有配套论文，也没有更多详细的技术介绍，那么效果具体如何，只能看实际测试了。

与All Hands AI合作开发

合作方All Hands AI的口号是“少写代码，多做事“，他们没有开发自己的基础膜，而是专注于构建智能体框架。

Devstral可与All Hands AI的OpenHands或SWE-Agent等智能体框架配合使用。

OpenHands智能体框架可以执行人类程序员能做的任何操作，包括修改代码、运行命令、浏览网页、调用API，甚至可以从StackOverflow复制代码片段。

Devestral目前属于研究预览版状态，团队表示正在努力努力构建一个更强大的代理编码模型，预计将在未来几周内发布。

自去年4月推出以来，OpenHands在GitHub上已经积攒了5万+标星。

Devstral下载：https://huggingface.co/mistralai/Devstral-Small-2505

参考链接：[1]https://mistral.ai/news/devstral[2]https://x.com/ngxson/status/1925202510312067494

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。这两天 Trae 不是推出了国内版吗（），搭载豆包和 DeepSeek 大模型，因为之前 Trae 国际版是支持 Claude Sonnet 的，最开始是 3.5，后来 Claude 升级了 3.7，隔了一天 Trae 就跟进了，而且也是完全免费的。

3/6/2025 12:22:00 AM 风筝

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

就在今天凌晨，新版DeepSeek-R1正式开源了！ DeepSeek-R1-0528模型权重已上传到HuggingFace，不过模型卡暂未更新。图片项目地址：，DeepSeek-R1完成了超进化，编码能力强到离谱，而且思考时间更长了。

5/29/2025 9:07:37 AM 新智元

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

就在昨晚，DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k。图片本次开源的V3.1模型拥有685B参数，支持多种精度格式，从BF16到FP8。综合公开信息和国内大咖karminski3的实测，V3.1此次更新亮点有：编程能力：表现突出，根据社区使用Aider测试数据，V3.1在开源模型中霸榜。

8/20/2025 9:57:40 AM

24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

最新开源代码模型实际表现

与All Hands AI合作开发

相关资讯

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4