AI在线 AI在线

从写代码到写规则:SASE框架下,人类如何成为AI智能体的“教练”

大家好,我是肆〇柒。 今天我们要探讨的,是来自加拿大皇后大学(Queen’s University)Ahmed E. Hassan教授团队的一项前沿研究。

从写代码到写规则:SASE框架下,人类如何成为AI智能体的“教练”

大家好,我是肆〇柒。今天我们要探讨的,是来自加拿大皇后大学(Queen’s University)Ahmed E. Hassan教授团队的一项前沿研究。他们提出的SASE框架,正在定义人类在软件工程中的角色——从亲力亲为的“码农”,转变为运筹帷幄的“智能体教练”。这不仅关乎技术,更是一场深刻的人才与教育革命。

从写代码到写规则:SASE框架下,人类如何成为AI智能体的“教练”

SASE框架概览:人类与智能体的双域结构

生产力神话背后的真相

在软件工程领域,"100x"甚至"1000x工程师"的讨论正日益热烈。这些开发者通过高效指挥AI智能体,实现了令人难以置信的生产力提升。然而,行业观察显示,这些"超级开发者"的核心能力并非编码本身,而是与AI智能体协作的能力——清晰表达意图、精准提供上下文、有效进行指导和审查。

据研究数据表明,GitHub Copilot生成的Pull Request中位完成时间仅为13.2分钟,使得个人开发者能够在几天内完成相当于数年的工作量。然而,这种超高的生产力也带来了严峻挑战:超过68%的智能体生成Pull Request面临长时间延迟或未被审查,形成了一个关键瓶颈。

这一现象揭示了当前自动化与验证之间的根本矛盾——"速度vs信任"的鸿沟。大量智能体生成的代码虽然通过了测试,但往往在更严格的审查中暴露出问题:29.6%的"看似合理"的修复引入了行为回归或在严格重测中被证明不正确;GPT-4生成的补丁在详细人工审核后,真实解决率从12.47%骤降至3.97%。这些数据表明,通过测试远不足以达到"可合并"的标准。

SASE(Structured Agentic Software Engineering)框架的设计,正是为了将这种协作能力系统化、工程化、可复制化。在SE 3.0时代,软件工程的核心已从编写代码转向指导智能体,人类角色的根本性重塑成为决定未来软件工程成败的关键。

从写代码到写规则:SASE框架下,人类如何成为AI智能体的“教练”

Agentic SE工作流程:从任务指定到合并准备的完整闭环

SASE框架中的人类:从"执行者"到"战略家"

在传统软件工程中,开发者的主要职责是将想法转化为代码。而在SASE框架下,人类角色发生了根本性转变,从执行者进化为战略家和智能体教练(Agent Coach)。

这一角色转变体现在核心技能的变化上:从算法、语法、调试等编码技能,转向系统思考、架构设计、需求工程(BriefingEng)和流程编排(ALE)等战略能力。人类的核心价值不再在于实现细节,而在于提供AI无法替代的"战略意图"、"伦理判断"和"领域专家知识"。

SASE框架将这一转变结构化为几个关键维度:

  • 从"写代码"到"写BriefingScript":工程师的主要创造性产出不再是实现逻辑,而是对无歧义意图和指导的阐述。BriefingScript作为结构化、版本控制的文档,成为与源代码同等重要的工程产物。
  • 从"修复bug"到"制定MentorScript":指导不再是隐式的、短暂的活动(如代码审查中的评论),而是被转化为明确的、不断发展的、编码化的学科。MentorScript作为结构化的机器可读规则手册,使指导成为可审查、可测试、持续演进的工程实践。
  • 从"独立工作"到"管理智能体团队":单个开发者现在可以指挥多个智能体并行工作,处理复杂的任务分解和协调。这要求人类具备团队管理和任务编排的新技能。

这一转变不是对传统软件工程技能的否定,而是对其的扩展和提升。正如论文中指出的,SASE优先考虑适应性解决方案,认为能够快速融入特定团队、项目或组织上下文的AI队友,比在狭窄领域外表现不佳的天才但脆弱的专家智能体更有价值。

双向协作:当AI成为主动的"咨询者"

SASE框架中最具革命性的创新之一是Consultation Request Pack (CRP)机制。这不仅是人类干预的渠道,更是智能体成熟的标志——表明智能体能够识别自身认知边界,主动寻求人类的"部落知识"(tribal knowledge)和战略判断。

Consultation Request Pack (CRP):当智能体面临复杂权衡或模糊地带时生成的结构化请求包。CRP不是人类的失误,而是智能体成熟的标志,表明智能体能够识别自身认知边界,主动寻求人类的"部落知识"(tribal knowledge)和战略判断。在SASE框架中,CRP作为核心产物,使智能体能够将咨询请求路由到适当的人类专家,实现了"humans-as-MCP-tools"的创新理念。

CRP机制的工作原理是:当智能体面临复杂权衡或模糊地带时,它会生成结构化的CRP,Agent Command Environment (ACE)将此请求路由到适当的专家人类。这种设计实现了"humans-as-MCP-tools"(人类作为MCP工具)的创新理念,将人类视为可调用的端点。

CRP机制的价值体现在多个层面:

首先,它使人类从被动的审核者转变为按需调用的专家顾问,实现了人力资源的最优配置。智能体无法推断任务的期望或"风险",它们可能对简单请求"过度思考",或在关键任务上交付不足。CRP机制确保人类在关键时刻介入,提供智能体无法独立完成的战略判断。

其次,每一次CRP及其对应的Version Controlled Resolution (VCR)都成为组织知识库的新条目,不断丰富MentorScript。这种机制使指导过程从隐式、临时的互动转变为显式、持久的工程实践。

最后,CRP机制透明化了AI的决策过程,让管理者可以观察到智能体何时需要帮助,从而建立对系统可靠性的信心。这种双向协作模式将传统的单向"人类指导AI"转变为真正的"人类-AI伙伴关系",为软件工程带来了全新的协作范式。

SASE框架明确区分了三种协作模式,使N-to-N协作成为可能:

  • 1-to-N Human-Agent Collaboration:单个开发者指挥多个智能体并行工作,例如一位工程师通过BriefingScript触发智能体团队生成28个Pull Request(7个任务,每个任务4个候选方案)
  • 1-to-N Agent-Human Collaboration:智能体将咨询请求包(CRP)路由到适当的人类专家,例如当智能体在重构过程中遇到高圈复杂度(超过20)的函数时,根据预定义的MentorScript规则,它会生成CRP并路由给'Tech Lead'角色
  • N-to-N Hybrid Collaboration:多个人类共同监督和指导共享的智能体池,例如当智能体面临数据库架构问题时,会将CRP路由到指定的数据库架构师,而该"架构师"角色本身可能由另一个专业智能体担任

没有像CRP这样的显式、持久的产物,这些复杂的多参与者工作流将变得短暂、不可追踪且最终无法管理。SASE确保这些互动留下结构化、可审计的记录,将临时的"agentic coding"转变为严格的工程实践。

SASE的"双环境"与"双产物":赋能新角色的基石

SASE框架通过两个专门设计的工作环境和结构化产物,为人类角色的转变提供了坚实的技术基础。

Agent Command Environment (ACE):教练的驾驶舱

传统的集成开发环境(IDE)已无法满足智能体时代的协作需求。ACE作为人类"智能体教练"的指挥中心,专为人类认知优化,支持战略任务如指定意图、编排复杂工作流和审查基于证据的结果。

ACE的关键能力包括:

  • 智能体状态可视化:提供对智能体活动和相关成本的全面可观察性,使管理者能够清晰看到每个智能体的工作状态和资源消耗
  • N版本编程支持:让开发者能够轻松可视化、比较和混合来自多个智能体解决方案的组件,实现"合成最佳方案"的工作流
  • 上下文管理工具:提供专门工具来管理智能体所需的复杂上下文,这通常与人类开发者所需的内容显著不同

ACE的演进方向

随着技术发展,ACE将采用更先进的交互模式。语音有望成为主要交互方式,因为它比打字更快,减少了软件开发工作流中的上下文切换。现代基础模型ASR系统(如OpenAI的Whisper)已经能准确转录各种口音、背景噪音和技术词汇,使语音驱动的ACE工作流变得实用。这将使人类能够进行流畅、高带宽的对话来发出命令、口述规格说明并提供指导。

ACE的设计理念是让人类能够高效地"指挥"而非"执行",将认知资源集中在高价值的战略决策上。

Merge-Readiness Pack (MRP):可信交付的新标准

MRP是SASE框架中最具创新性的概念之一。它不是简单的Pull Request,而是包含五大证据维度的"证据包",确保智能体的工作达到真正的"可合并"标准:

1. 功能完整性:提供端到端测试结果,证明功能在现实场景中按规格完整工作

2. 可靠验证:不仅包含通过的测试日志,还包括智能体的测试计划和新生成的测试用例

3. 优秀工程规范:包含静态分析、linting和复杂度检查报告,证明代码干净、可读且不引入技术债务

4. 清晰理由与沟通:将低级、冗长的轨迹文件合成为清晰、人类可读的摘要,解释所采取的方法和考虑的权衡

5. 完整可审计性:提供"冻结的"审计线索,包括指向确切BriefingScript/MentorScript版本的链接、工具和使用的智能体轨迹

MRP机制解决了"速度vs信任"的核心矛盾。评审员不再需要在海量代码中"狩猎"错误,而是可以基于结构化的证据进行高效决策。通过"渐进式披露"设计,评审员可以先查看高级摘要,然后根据需要深入查看特定证据(如测试日志或执行轨迹)。例如,对于常规bug修复,评审员可能只需检查功能完整性和工程规范;而对于关键安全补丁,他们可能会深入验证测试计划和推理过程。

结构化产物:组织知识的数字化传承

SASE框架中的结构化产物不仅是任务指令,更是企业宝贵的数字资产和组织记忆。Briefing Pack必须是活文档,而非静态文档。人类和智能体之间的后续反馈和澄清必须作为版本化更新合并回Briefing Pack中。

这些产物构成了组织知识的数字化传承机制:

  • BriefingScript:记录任务的目标、范围、上下文和验证策略
  • MentorScript:编码团队规范和最佳实践,成为"AI队友的员工手册"
  • LoopScript:定义智能体工作流的标准操作程序(SOP)

随着团队的发展,这些产物不断进化,形成持续学习和改进的良性循环。它们使得新员工和新智能体能够快速学习和复用组织积累的知识,加速团队整体能力的提升。

苦涩教训的适用边界与工程原则的重构

SASE框架的提出并非否定"苦涩教训"(Bitter Lesson)的价值,而是明确了其在Agentic SE时代的适用边界。"苦涩教训"指出,随着计算和数据的扩展,通用方法通常会胜出,而非依赖人类知识的方法。然而,这一原则在数据稀缺的新任务或专业领域中存在明显局限。

在智能体时代,传统软件工程原则可能需要重新审视。例如,"Don't Repeat Yourself (DRY)"原则通常被反转——对人类开发者而言的维护债务(比如代码克隆),对智能体来说可能是一种可行策略,因为它简化了推理过程,而缺点(更新所有实例)对智能体来说微不足道。GitClear报告显示,自从GitHub Copilot出现以来,GitHub上的代码重复率急剧上升,这正是这一理论转变的行业观察证据。

同时,SE for Humans历史上关注小K值的精确度(precision@K),因为人类时间宝贵;而在以智能体为中心的世界中,如果从属智能体可以后处理结果,precision@100完全可以接受。Rust工具链提供了重要启示:其丰富的、建设性的编译器消息使智能体能够快速从失败中学习,这正是未来Agent-Native MCP服务器应追求的目标。例如,Anthropic团队已经通过优化MCP描述来适应智能体而非人类,这种自我改进的工具链循环对于使Agentic SE变得稳健、可扩展和容错至关重要。

BMAD框架:SASE理念的实践案例

BMAD(Breakthrough Method for Agile AI-Driven Development)框架作为SASE理念的实践案例,将AI智能体组织成产品负责人、架构师、开发者和测试员等角色,通过任务分解和角色专业化,以高度结构化和并行化的方式处理复杂项目。

BMAD从"Agentic Planning"阶段开始,智能体协作生成详细的产品需求文档(PRD)和架构设计;随后,Scrum Master智能体将工作"分片"为离散的"故事文件",每个文件包含开发智能体实现功能片段所需的特定上下文。这种任务分解和角色专业化是BMAD的关键优势,使其能够以高度结构化和并行化的方式处理复杂项目。

BMAD与SASE的关联在于,它不仅实现了N版本编程和编排,还将评审反馈转化为持久的MentorScript规则(即"mentorship-as-code"),并指定了环境和学科(ACE用于人类指导和协调,AEE用于智能体执行)。BMAD框架证明了SASE框架在实际项目中的可行性和价值,展示了如何将理论转化为实践。

对软件工程教育的颠覆性影响

当前的软件工程教育正面临严峻挑战:高校课程仍在大量培养"如何成为AI"的技能(写代码、创建测试、执行低级实现),而非"如何管理AI"的技能。这种脱节将导致毕业生无法适应SE 3.0时代的需求。

SASE框架为软件工程教育提供了明确的方向:必须将"人-AI协作"作为核心能力纳入课程体系。教学重点应从实现转向设计和指导。

课程体系重构

需求工程课程升级:将传统需求工程(RE)和敏捷/Scrum课程与BriefingEng相结合,教授学生如何编写机器可读的BriefingScript。这包括如何定义"目标与原因"、"什么与成功标准"、"所有所需上下文"和"实现蓝图"等关键部分,确保学生能够创建既不过度指定实现细节又能提供足够指导的简报。

DevOps课程进化:将Agentic Loop Engineering(ALE)融入DevOps教学,教授学生如何定义任务分解、并行执行策略和证据收集标准。学生应学习如何使用LoopScript语言来指定工作流策略,从为简单bug修复授予完全自主权,到为关键安全补丁强制执行严格的多阶段审查过程。

软件架构课程革新:融入AI Teammate Mentorship Engineering(ATME)内容,教授学生如何制定可测试、可版本化的MentorScript规则。课程应涵盖如何将团队规范转化为结构化规则,以及如何确保这些规则是原子的、确定性的,并能有效指导智能体行为。

实践环境模拟:创建模拟ACE环境的实验室,让学生练习处理MRP和CRP,培养作为"教练"的综合能力。这种实践环境应模拟真实世界中的挑战,如处理多个智能体生成的N版本解决方案,或在有限时间内做出战略决策。

培养"人-AI共思"能力

SASE框架与瑞士提出的"人-AI共思"(Human-AI Co-Thinking)教育战略高度一致。该战略倡导将共思作为从基础教育开始的核心能力,学生学习如何放大自己的智力,同时保持作为验证者的关键角色。

在软件工程教育中,这意味着培养学生的"第六感"——识别AI的认知失调,学会与AI进行结构化、负责任和有效的思考。未来的软件工程师不仅需要知道"如何使用AI",更需要知道"如何与AI思考",理解何时应该干预,何时应该放手让智能体自主工作。

对组织和人才战略的启示

SASE框架不仅改变了技术实践,更对组织结构和人才战略提出了全新要求。

招聘标准革命

未来最抢手的人才,是那些擅长"写BriefingScript"和"制定MentorScript"的人,而非单纯算法能力强的人。招聘应评估候选人的"意图表达能力"、"上下文提供能力"和"指导能力"。例如,可以要求候选人创建一个针对特定任务的BriefingScript,评估其清晰度、全面性和可执行性。

团队结构演进

团队将演变为"人类教练 + 专业化智能体舰队"的混合模式。管理者需要学会管理"数字员工",包括实施"评估过程"——表现不佳的智能体可能被"解雇"、"再培训"或"降级"。这种管理方式类似于管理人类团队,但需要适应智能体的特性和局限。

绩效评估转型

评估标准应从"写了多少行代码"转变为:

  • "指挥智能体团队交付了多少价值"
  • "沉淀了多少可复用的指导规则"
  • "创建了多少高质量的BriefingScript和MentorScript"
  • "如何有效处理CRP和MRP"

这种转变将绩效评估从关注个人产出转向关注团队效能和知识积累。

组织知识管理

将BriefingScript、MentorScript和VCR纳入组织知识管理体系,形成持续学习和改进的良性循环。这些结构化产物不仅支持当前项目,还成为新项目和新团队的起点,加速组织整体能力的提升。

基础设施投资

组织需要投资构建支持SASE框架的ACE和AEE环境,为团队提供必要的工具支持。这包括开发或采购支持结构化产物创作、智能体管理和证据审查的工具链。早期采用者将在生产力和质量方面获得显著优势。

从写代码到写规则:SASE框架下,人类如何成为AI智能体的“教练”

SASE框架的双域结构:工具、活动、参与者与产出物的完整映射

SE 3.0的终极挑战与机遇

SE 3.0的终极挑战不是技术,而是人。技术瓶颈会随时间解决,但人才和组织转型才是决定性因素。正如SASE框架所展示的,软件工程的未来不在于构建更强大的AI,而在于建立更有效的"人类-AI交互关系"。

SASE框架的精髓在于认识到软件工程已进入一个需要双重关注的时代:既要关注"SE for Humans"(为人类的软件工程),也要关注"SE for Agents"(为智能体的软件工程)。在这个双重领域中,人类的角色已从直接实施者转变为战略"智能体教练和指挥官"。

这一转变不仅关乎技术,更关乎思维方式的革命。正如论文中所指出的,"苦涩教训"(Bitter Lesson)在Agentic SE时代有其适用边界——虽然通用方法随着计算和数据扩展通常会胜出,但在数据稀缺的新任务或专业领域中,人类提供的总体结构和连接点仍然是不可或缺的。SASE提出的结构不是试图编码人类知识,而是认识到人类-AI伙伴关系必须围绕互补角色设计:人类提供战略和伦理护栏("为什么"),而AI处理执行细节("怎么做")。

随着AI Teammate Lifecycle Engineering(ATLE)的发展,智能体将从一次性承包商转变为终身伙伴。它们将获得持久记忆,能够在空闲计算周期中主动执行有价值的维护任务,如扫描技术债务、识别文档缺口或提出代码重构。这些提议将作为新的BriefingScript进入标准SASE工作流,最终推动SE 3.0向SE 4.0演进——在这个阶段,我们可能不再需要人类批准这些优化活动。

谁能率先完成人才和教育的转型,谁就能在智能体时代赢得未来。这不仅是技术变革,更是组织文化和人才战略的全面升级。软件工程教育必须重新思考其使命:不再培养"码农",而是培养能够指挥AI智能体舰队的"1000x教练"。

在这个新时代,最大的生产力提升将来自于那些能够将人类的战略智慧与AI的执行能力完美结合的组织。SASE框架为我们提供了实现这一愿景的路线图,而真正的挑战在于如何将这一框架转化为实际的教育和组织实践。这是软件工程领域面临的最大机遇,也是我们必须抓住的历史性时刻。

相关资讯

解读:AI智能体时代的实用指南——吴恩达与LangChain创始人的深度对话

Hi,大家好,我叫秋水,专注商用 AI Agent(智能体),帮企业用AI自动化业务,提升效率。 在刚刚结束的一场AI技术峰会上,深度学习领域的传奇人物吴恩达与LangChain创始人Harrison进行了一场精彩的谈话。 这场对话不仅揭示了AI智能体技术的最新趋势,更为普通人和企业指明了在AI时代如何抓住机遇的实用路径。
6/4/2025 11:04:03 AM
秋水

ReSum:让AI智能体学会“记笔记”,突破长程推理瓶颈

大家好,我是肆〇柒。 本文分享的这篇工作来自通义实验室(Tongyi Lab, Alibaba Group)的最新研究成果——ReSum。 他们提出了一种全新的推理范式,让大模型智能体在面对复杂问题时,能够像人类一样“停下来复盘、做笔记”,从而突破传统上下文长度限制,实现真正意义上的长程探索。
9/24/2025 9:10:24 AM
肆零柒

当敏捷团队遇见AI,新的实践由此诞生

译者 | 核子可乐审校 | 重楼自从ChatGPT问世以来,人们就一直在讨论AI技术将如何重塑我们的工作方式。 结合自身需求,我尝试让AI畅想AI驱动方法如何帮助敏捷团队获取深层洞察并提供更具创新性的方案,而它给出的结果也令人大开眼界。 下面我们就一起看看AI眼中新时代下敏捷团队的形态。
3/20/2025 8:25:24 AM
核子可乐
  • 1