AI在线 AI在线

SWE

Mistral 重返开源阵营:发布超高效代码 AI 模型 Devstral 笔记本电脑也能跑

法国人工智能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后,迅速回归开源路线。 该公司近日与开源初创公司 All Hands AI(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。 这款拥有2400万参数的轻量级模型,专为代理 AI 软件开发而设计,其性能甚至在特定基准测试中超越了许多参数高达数十亿的竞争对手,包括一些闭源模型。
5/22/2025 9:00:55 AM
AI在线

Windsurf重磅发布SWE-1系列!首款全流程软件工程AI模型,挑战Claude 3.5,提效99%!

Windsurf(原Codeium)正式发布其首款自主研发的AI模型家族——SWE-1系列,包括SWE-1、SWE-1-lite和SWE-1-mini。 这一系列模型不仅针对代码生成进行了优化,还首次聚焦整个软件工程生命周期,覆盖从编码、调试到终端操作和多工具协作的全流程。 AIbase综合最新信息,深入解析SWE-1系列的技术突破及其对AI开发生态的深远影响。
5/16/2025 12:00:55 PM
AI在线

微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变

奥特曼预言,2025年软件工程将迎来巨变。 开年智能体大爆发,AI自动化软件工程已成为不争的事实。 就在今天,纳德拉官宣,GitHub Copilot将all-in智能体,微软自主的SWE智能体首次亮相。
2/7/2025 1:26:13 PM
新智元

OpenAI 推出 SWE-bench Verified 基准,更准确评估 AI 模型代码生成表现

感谢OpenAI 公司于 8 月 13 日发布新闻稿,宣布推出 SWE-bench Verified 代码生成评估基准,解决了此前的局限性问题,能够更准确地评估人工智能模型在软件工程任务中的表现。SWE-benchAI在线注:SWE-Bench 是一个用于评估 LLM 解决 GitHub 上真实软件问题能力的基准测试数据集。它收集了来自 12 个流行的 Python 仓库的 2294 个 Issue-Pull Request 对。在测试时,LLM 会拿到一个代码库和 issue 描述,然后生成一个补丁来解决 iss
8/15/2024 2:34:33 PM
故渊
  • 1