SWE

Mistral 重返开源阵营：发布超高效代码 AI 模型 Devstral 笔记本电脑也能跑

Mistral 重返开源阵营：发布超高效代码 AI 模型 Devstral 笔记本电脑也能跑

法国人工智能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后，迅速回归开源路线。该公司近日与开源初创公司 All Hands AI（OpenDevin 的创建者）合作，推出了全新的开源语言模型 Devstral。这款拥有2400万参数的轻量级模型，专为代理 AI 软件开发而设计，其性能甚至在特定基准测试中超越了许多参数高达数十亿的竞争对手，包括一些闭源模型。

5/22/2025 9:00:55 AM AI在线

Windsurf重磅发布SWE-1系列！首款全流程软件工程AI模型，挑战Claude 3.5，提效99%！

Windsurf重磅发布SWE-1系列！首款全流程软件工程AI模型，挑战Claude 3.5，提效99%！

Windsurf（原Codeium）正式发布其首款自主研发的AI模型家族——SWE-1系列，包括SWE-1、SWE-1-lite和SWE-1-mini。这一系列模型不仅针对代码生成进行了优化，还首次聚焦整个软件工程生命周期，覆盖从编码、调试到终端操作和多工具协作的全流程。 AIbase综合最新信息，深入解析SWE-1系列的技术突破及其对AI开发生态的深远影响。

5/16/2025 12:00:55 PM AI在线

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

奥特曼预言，2025年软件工程将迎来巨变。开年智能体大爆发，AI自动化软件工程已成为不争的事实。就在今天，纳德拉官宣，GitHub Copilot将all-in智能体，微软自主的SWE智能体首次亮相。

2/7/2025 1:26:13 PM 新智元

OpenAI 推出 SWE-bench Verified 基准，更准确评估 AI 模型代码生成表现

OpenAI 推出 SWE-bench Verified 基准，更准确评估 AI 模型代码生成表现

感谢OpenAI 公司于 8 月 13 日发布新闻稿，宣布推出 SWE-bench Verified 代码生成评估基准，解决了此前的局限性问题，能够更准确地评估人工智能模型在软件工程任务中的表现。SWE-benchAI在线注：SWE-Bench 是一个用于评估 LLM 解决 GitHub 上真实软件问题能力的基准测试数据集。它收集了来自 12 个流行的 Python 仓库的 2294 个 Issue-Pull Request 对。在测试时，LLM 会拿到一个代码库和 issue 描述，然后生成一个补丁来解决 iss

8/15/2024 2:34:33 PM 故渊

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉