大语言模型(LLMs)和智能体不断进化,已不再局限于简单的响应和输出,而是在推理与行动能力上持续成熟。随着智能体架构的进步,记忆、回忆和知识应用的方式,在系统设计和可信度方面变得愈发关键且复杂。RASA(Role-Aligned Software Architecture,角色对齐软件架构)作为一个创新性的认知框架,为构建具备强大记忆能力、能够灵活适应各种场景的智能体提供了全新的思路和方法。
一、LLMs现有记忆机制的局限与RASA的诞生背景
LLMs凭借其强大的语言处理能力,在自然语言处理领域取得了显著成果。其潜在记忆功能允许它们从训练数据中存储和检索模式,却无需显式的存储机制。然而,这种记忆存在诸多局限性:它是静态的,一旦训练完成,记忆内容就基本固定,难以实时更新;缺乏个性化,无法针对不同用户的独特需求和背景进行定制;并且很大程度上是不可见的,开发人员和用户难以了解记忆的具体存储和使用方式,这使得它在适应实时变化和贴合用户特定上下文时困难重重。
为了让智能体真正具备自适应、可靠和交互性,就需要一个外部系统来显式地管理记忆,跨越时间、角色和推理层次。RASA应运而生,它并非普通的工具或产品,而是一种思考如何构建人工智能系统的全新理念,旨在打造模块化、具备记忆感知能力且与周围世界中的角色相匹配的AI系统。
二、RASA的核心架构剖析
(一)Frames:智能体记忆的基石
Frames代表了智能体的记忆架构和“心智状态”,它涵盖了智能体当前所知道和能够回忆起的信息,是其行动的基础。RASA定义了四种类型的Frames:
- 无状态帧(Stateless frames):这类帧没有记忆功能,仅对当前输入做出响应,适用于简单的事务性任务,比如一些固定格式的信息查询,仅依据当前输入的关键词返回预设答案,不考虑之前的交互历史。
- 会话帧(Session frames):它能够捕捉对话中的近期交互信息,使智能体保持对话的流畅性,并能参考刚刚说过的内容。在客服场景中,当用户询问关于产品某一特性的更多细节时,智能体可以依据会话帧中记录的前文,理解用户所指的产品,从而更准确地回答问题。
- 短期帧(Short-Term frames):短期帧用于总结整个会话中的模式和决策,有助于保存用户偏好或近期选择。例如,在音乐推荐场景中,智能体可以通过短期帧记住用户在一次会话中多次选择的音乐风格,为后续推荐提供更符合用户当下兴趣的音乐。
- 长期帧(Long-Term frames):长期帧用于存储跨会话的持久信息,如用户偏好、历史交互记录或学习到的知识。以个人健康管理智能体为例,长期帧可以记录用户长期的健康数据和偏好的健康管理方式,为用户提供持续且个性化的健康建议。
Frames具有高度的灵活性,可根据智能体的角色和上下文进行组合。不同类型的智能体,会依据自身功能需求,选择合适的Frames组合,以此来动态塑造智能体的“心智状态”,决定其能够访问和响应的信息。而Persona则在其中发挥着关键的控制作用,它能够根据具体的使用场景、隐私级别、可信操作以及所需的认知深度,有选择地激活或调整Frames。
(二)Operators:智能体的行动执行层
如果说Frames定义了智能体所“知道”的内容,那么Operators则明确了智能体如何运用这些知识。Operators就像是智能体的认知工具,它基于当前的Frame对信息进行解释、转换或路由。常见的Operators类型包括:
- 偏好(Preferences):根据用户定义或系统定义的偏好来塑造输出内容。在电商推荐系统中,用户可以设置自己喜欢的商品品牌、价格范围等偏好,智能体通过Preferences Operator将这些偏好应用到商品推荐中,为用户提供更符合心意的商品建议。
- 规则(Rules):用于应用业务规则、进行策略检查或执行工作流逻辑。在金融领域,智能体在处理贷款申请时,会依据Rules Operator检查用户的信用记录、收入水平等是否符合贷款规则,还能在面对模糊输入时,发起LLM查询进行推理,或者进行条件评估。
- 启发式方法(Heuristics):利用轻量级推理策略或领域捷径来高效地做出决策。当需要更深入的思考时,Heuristics可以启动思维链提示;当内部逻辑处理能力不足时,还能将控制权委托给外部工具。在图像识别辅助系统中,Heuristics可以快速根据一些常见的图像特征做出初步判断,若遇到复杂图像,则借助外部专业图像分析工具进行处理。
- 工具(Tools):实现与外部系统、API或函数的交互,例如获取实时数据、进行搜索和总结等。在新闻资讯智能体中,Tools Operator可以连接到新闻API,获取最新的新闻内容,并对其进行筛选和总结,为用户提供有价值的新闻信息。同时,Tools还能支持检索增强生成(RAG)工作流程,帮助智能体获取特定领域的知识,使其回答更具时效性和针对性。
Operators与Frames紧密协作,从Frames中提取信息并进行相应操作。它们具有模块化和可组合性的特点,能够根据任务需求或智能体的Persona进行排序、组合或选择性激活。部分Operators是无状态的,而另一些则依赖更深入的上下文信息。此外,Operator层是人机协作(Human-in-the-Loop,HITL)系统最自然的集成点。当规则或启发式方法遇到模糊条件或低置信度输出时,人类可以介入进行验证、批准或推翻决策,这在关键工作流程、高风险操作或需要可追溯性和监督的企业系统中尤为重要。
(三)Persona:智能体的身份与协调层
Persona赋予智能体身份、角色和行为意图。它不仅决定了智能体的行动方式,还控制着哪些Frames和Operators处于激活状态,以及如何针对特定用户、任务或上下文对它们进行配置。 一个Persona可以定义以下关键内容:
- 智能体的角色:例如“热情的音乐推荐者”或“成本节约分析师”,明确了智能体在特定场景中的功能定位。
- 语气或风格:决定智能体是以正式、叙事还是诙谐的方式与用户交流,这有助于塑造智能体独特的个性,增强用户体验。
- 记忆范围:确定智能体是无状态运行,还是需要纳入长期上下文信息,以此来灵活调整智能体对信息的处理方式。
- 偏好工具和推理模式:选择是优先使用规则、启发式方法还是人类审核,从而使智能体的决策过程更符合其角色和任务需求。
通过封装身份和协调功能,Persona使得设计出一致且上下文感知的智能体成为可能,并且能够将它们与现实世界中的角色相匹配,避免了为每种场景都进行硬编码的繁琐工作。
三、RASA在不同角色中的应用价值
(一)为架构师提供模块化设计蓝图
对于架构师而言,RASA提供了一个模块化的设计蓝图,用于构建具备记忆感知能力且与角色对齐的智能体系统。它将状态、行为和身份解耦,使得AI组件更易于测试、管理和适应企业的多样化需求。架构师可以基于RASA的框架,灵活地组合Frames、Operators和Persona,设计出满足不同业务场景的智能体架构,提高系统的可维护性和扩展性。
(二)助力开发者高效实现功能集成
开发者在使用RASA时,能够获得一种结构化的方式来插入记忆层、工具和推理步骤,无需每次都重新构建协调逻辑。Frames和Operators为开发者提供了清晰的功能入口点,他们可以专注于实现具体的功能模块,提高开发效率。在开发智能客服系统时,开发者可以利用RASA已有的框架,快速集成会话帧和规则Operators,实现智能客服对常见问题的快速响应和处理。
(三)帮助产品所有者转化业务需求
产品所有者可以借助RASA将业务需求转化为模块化的智能体行为。通过调整智能体的语气、规则和偏好,使其与产品的角色设定、品牌形象和客户工作流程相契合。在设计一款面向年轻用户群体的社交APP智能助手时,产品所有者可以利用RASA设定智能体活泼、幽默的语气风格,并制定符合社交场景的规则和偏好,提升产品的用户体验和市场竞争力。
(四)为企业领导者提供治理思路
RASA为企业领导者提供了一个可扩展的思维模型,帮助他们理解和管理AI与客户、员工或其他系统的交互方式。通过RASA,企业领导者可以清晰地把握AI系统的控制要点、个性化设置和人为监督的切入点,更好地引导AI系统为企业创造价值,同时确保其符合企业的战略方向和风险管控要求。
(五)推动企业实现AI的规模化应用
对于企业和组织来说,RASA提供了一种将智能体系统与组织结构相匹配的有效途径。智能体的角色、功能、决策策略甚至企业文化都可以在其行为、记忆和决策过程中得到体现,从而实现AI的规模化应用,使其能够与现有的工作流程无缝集成,而不是对其造成干扰。在大型企业的供应链管理中,利用RASA构建的智能体可以根据不同部门的角色和职责,如采购、物流、库存管理等,进行有针对性的记忆和决策,优化整个供应链流程,提高企业运营效率。
四、RASA蕴含的设计理念与发展展望
RASA不仅仅是一个技术架构,更是一种融合了目的、责任和透明度的设计理念。在智能体时代,我们不仅要关注AI能做什么,更要思考它应该做什么。RASA鼓励设计者和组织在每个架构层中融入目的、伦理和可观测性。
智能体的目的确保其行动具有明确的意图,与角色、责任和组织目标保持一致。伦理和安全并非事后考虑的因素,而是由Persona塑造,并通过Operators和人机协作检查点进行管理。可观测性和透明度则源于架构的模块化,能够追踪决策的制定过程、所使用的记忆以及采取的行动。
目前,RASA仍处于早期探索阶段,它源于人们希望利用LLMs和工具增强现实世界流程的愿望,试图模拟人类的思维、决策和协作方式。尽管它并非革命性的突破,但它以新颖的方式组合了已有的概念,尤其是在构建记忆和决策机制方面,为创建智能、自适应的智能体奠定了坚实的基础。在未来,随着AI技术的不断发展,RASA有望在更多领域得到应用和完善,进一步推动智能体与现实世界的深度融合,助力企业和社会实现智能化转型。
code:https://github.com/vedanta/rasa