AI在线 AI在线

从代码助手到工程伙伴:Windsurf 的 SWE-1 开启 AI 辅助开发新范式

译者 | 刘汪洋审校 | 重楼如今,在许多 Vibe Coding 平台通常会借助现有的大型语言模型 (LLMs) 来辅助编写代码。 不过,写代码仅仅是开发人员日常工作的一小部分。 要想构建一个完善的企业级生产平台,还得用上各种工具来审查代码、提交代码,并进行长期的维护。

译者 | 刘汪洋

审校 | 重楼

如今,在许多 Vibe Coding 平台通常会借助现有的大型语言模型 (LLMs) 来辅助编写代码。

不过,写代码仅仅是开发人员日常工作的一小部分。要想构建一个完善的企业级生产平台,还得用上各种工具来审查代码、提交代码,并进行长期的维护。这恰恰是 Windsurf 公司(它的前身是 Codeium)希望通过一系列新型先进 AI 模型来攻克的难题。在其 Wave 9 更新中,公司正式推出了这些模型,并将其命名为 SWE-1(可以理解为“软件工程师 1 号”)。

就在这条消息发布前后,有报道称 AI 领域的领头羊 OpenAI 公司正计划以 30 亿美元的价格收购 Windsurf。目前这笔交易还没最后敲定,Windsurf 方面也暂时不便公开置评。

SWE-1 是一系列顶尖的 AI 模型,它们的目标是给整个软件工程流程提速。和那些仅仅适配了编码任务的通用 AI 模型不同,SWE-1 力求覆盖软件工程的方方面面。

这些新模型能够通过多种交互界面,帮助开发人员处理那些未完成的工作和需要长期跟进的任务——这是真实软件开发场景的常态。目前,SWE-1 已经向 Windsurf 的用户开放,这也意味着该公司正式迈入了尖端模型研发的行列。它的性能表现不输于现有的一些基础模型,而且更加聚焦于软件工程的实际工作流程。

“我们的目标很简单:让所有软件工程的效率提升 99%。”Windsurf 的产品与战略主管 Anshul Ramachandran 这样告诉 VentureBeat。

企业开发人员需要的,远不止会写代码的模型

SWE-1 的核心创新点在于,Windsurf 团队意识到,编码其实只占软件工程师实际工作量的一小部分。

这种思路恰好解决了目前 AI 编码 LLM 所面临的一个关键瓶颈。市面上确实有不少能写应用程序代码的模型,比如 OpenAI 的 GPT-4.1、Anthropic 的 Claude 3.7,还有 Google 的 Gemini 2.5 Pro I/O 版本。

Windsurf 提供了模块化的界面,用户能够灵活切换不同的模型。Ramachandran 提到,用户的反馈显示,现有的编码模型在有人从旁指导时表现还行,可时间一长,就容易顾此失彼,漏掉一些关键信息。

这个问题其实源于任务性质的根本不同。代码生成往往是一锤子买卖,而真正的软件工程却需要在不同的工具间来回切换,处理半成品代码,并且在漫长的项目周期里时刻把握上下文。

SWE-1 系列:为不同工程任务量身打造

Windsurf 并未试图打造一个“万金油”式的解决方案,而是针对性地开发了三款专业模型:

  1. SWE-1:这是一个全尺寸模型,专为复杂的推理和工具调用而设计,所有付费用户均可使用。
  2. SWE-1-lite:这是一款更小巧但同样强大的模型,它将替代 Windsurf 目前的 Cascade Base,并向所有用户(包括免费版用户)开放。
  3. SWE-1-mini:这是一款轻量级模型,主要为 Windsurf Tab 中的代码自动补全功能提供支持,所有用户都可以无限制使用。

SWE 系列模型的炼成,得益于 Windsurf 针对软件工程任务进行了大量内部专项训练。Ramachandran透露,公司采用了一种包含训练序列步骤的新型数据模型。

性能基准:看看 SWE-1 的实力如何

尽管 SWE-1 的目标并不是取代那些顶尖实验室的基础模型,但 Windsurf 表示,在软件工程相关的任务上,SWE-1 展现出了一流的性能水准。根据公司发布的报告,它的表现显著优于中等规模的基础模型以及一些开源 AI 大模型。

不过,对于这些初步的测试结果,Windsurf 表现得相当审慎,并没有大张旗鼓地宣传。

“即便我们的基准测试结果看起来很棒,但这并不意味着它就比市面上所有其他模型都强。”Ramachandran 坦诚地说道。

实际上,他们更希望将 SWE-1 定位为迈向专用模型的第一步。这类专用模型最终有望在特定的工程任务中超越通用模型——而且,它们的成本或许还会更低。

从代码助手到工程伙伴:Windsurf 的 SWE-1 开启 AI 辅助开发新范式

Windsurf 方法在技术上的一个独特之处,在于其实现了“流感知”(Flow-Awareness) 这一概念。

其基本逻辑是这样的:企业级的软件开发过程,往往包含了一连串的步骤。“流感知”并不仅仅是针对某个特定步骤编写代码,更重要的是能够理解和把握整个流程的上下文。

“流感知”的核心,是在软件开发过程中,建立起一套人类与 AI 共享的工作时间线。它的核心理念在于,通过判断 AI 在哪些环节能最有效地提供帮助,从而逐步地将原先由人工承担的任务移交给 AI。

这种方法为模型的持续进步创造了一个良性循环。

“随着我们不断优化模型,共享时间线上的更多步骤将会从人工操作转向 AI 处理。”Ramachandran 解释说,“AI 将能够胜任更多以往必须依赖人工才能完成的工作,因为过去的 AI 可能还不够精准。”

这对技术决策者意味着什么?

对于那些正在构建或维护软件的企业而言,SWE-1 的出现代表着 AI 辅助开发领域的一大进步。这种思路不再将 AI 编码助手仅仅视为一个简单的自动补全工具,而是致力于提升整个开发生命周期的效率。

它所带来的潜在好处,远不止是写代码更快那么简单。充分认识到应用程序开发的复杂性,将有助于推动此类 AI 辅助编码范式走向成熟,使其能更好地适应稳定可靠的企业级软件开发需求。

虽然 SWE-1 目前尚处于起步阶段,但这一方向性的探索至关重要。如果 OpenAI 最终完成了对 Windsurf 的收购,这些新模型可能会扮演更重要的角色,因为它们将有机会整合更庞大的模型研究与开发资源。

技术负责人不妨思考一下,在自己的开发工作流程中,到底有多少环节能够从这种超越简单代码生成的 AI 辅助中获益。那些需要花费大量时间进行代码审查、调试以及管理技术债务的团队,相比那些主要精力放在生成新代码的团队,或许能从 SWE-1 这类工具中挖到更大的价值。

原文标题:Software engineering-native AI models have arrived: What Windsurf’s SWE-1 means for technical decision-makers,作者:Sean Michael Kerner

相关资讯

微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变

奥特曼预言,2025年软件工程将迎来巨变。 开年智能体大爆发,AI自动化软件工程已成为不争的事实。 就在今天,纳德拉官宣,GitHub Copilot将all-in智能体,微软自主的SWE智能体首次亮相。
2/7/2025 1:26:13 PM
新智元

Windsurf 发 SWE-1:以数据+智能飞轮驱动软件工程 AI 进化

大家好,我是肆〇柒。 软件开发行业正经历一场前所未有的AI变革。 AI 辅助编程从曾经的新兴尝试,迅速成长为开发领域不可或缺的关键力量。
5/23/2025 9:45:01 AM
肆零柒

被Cursor多次拒绝,OpenAI怒买Windsurf,很不划算!多少有点慌不择食

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了OpenAI的o3和谷歌的Gemini 2.5 Flash发布之后,AI圈的注意力再一次给到了编程赛道。 最近一个争议比较大的新闻,要属“OpenAI收购Cursor不成,反过来要收购AI编程初创里的老二Windsurf”。 30亿美元,特别是对于一家仅仅成立2年,且目前品牌运营时间仅约5个月的创业公司来说,可以说是非常体面和梦寐以求的退出额度。
4/21/2025 5:18:15 PM
云昭
  • 1