RASA：LLM系统中实现智能体记忆的认知框架(含代码)

大语言模型（LLMs）和智能体不断进化，已不再局限于简单的响应和输出，而是在推理与行动能力上持续成熟。随着智能体架构的进步，记忆、回忆和知识应用的方式，在系统设计和可信度方面变得愈发关键且复杂。 RASA（Role-Aligned Software Architecture，角色对齐软件架构）作为一个创新性的认知框架，为构建具备强大记忆能力、能够灵活适应各种场景的智能体提供了全新的思路和方法。

大语言模型（LLMs）和智能体不断进化，已不再局限于简单的响应和输出，而是在推理与行动能力上持续成熟。随着智能体架构的进步，记忆、回忆和知识应用的方式，在系统设计和可信度方面变得愈发关键且复杂。RASA（Role-Aligned Software Architecture，角色对齐软件架构）作为一个创新性的认知框架，为构建具备强大记忆能力、能够灵活适应各种场景的智能体提供了全新的思路和方法。

一、LLMs现有记忆机制的局限与RASA的诞生背景

LLMs凭借其强大的语言处理能力，在自然语言处理领域取得了显著成果。其潜在记忆功能允许它们从训练数据中存储和检索模式，却无需显式的存储机制。然而，这种记忆存在诸多局限性：它是静态的，一旦训练完成，记忆内容就基本固定，难以实时更新；缺乏个性化，无法针对不同用户的独特需求和背景进行定制；并且很大程度上是不可见的，开发人员和用户难以了解记忆的具体存储和使用方式，这使得它在适应实时变化和贴合用户特定上下文时困难重重。

为了让智能体真正具备自适应、可靠和交互性，就需要一个外部系统来显式地管理记忆，跨越时间、角色和推理层次。RASA应运而生，它并非普通的工具或产品，而是一种思考如何构建人工智能系统的全新理念，旨在打造模块化、具备记忆感知能力且与周围世界中的角色相匹配的AI系统。

二、RASA的核心架构剖析

（一）Frames：智能体记忆的基石

Frames代表了智能体的记忆架构和“心智状态”，它涵盖了智能体当前所知道和能够回忆起的信息，是其行动的基础。RASA定义了四种类型的Frames：

无状态帧（Stateless frames）：这类帧没有记忆功能，仅对当前输入做出响应，适用于简单的事务性任务，比如一些固定格式的信息查询，仅依据当前输入的关键词返回预设答案，不考虑之前的交互历史。
会话帧（Session frames）：它能够捕捉对话中的近期交互信息，使智能体保持对话的流畅性，并能参考刚刚说过的内容。在客服场景中，当用户询问关于产品某一特性的更多细节时，智能体可以依据会话帧中记录的前文，理解用户所指的产品，从而更准确地回答问题。
短期帧（Short-Term frames）：短期帧用于总结整个会话中的模式和决策，有助于保存用户偏好或近期选择。例如，在音乐推荐场景中，智能体可以通过短期帧记住用户在一次会话中多次选择的音乐风格，为后续推荐提供更符合用户当下兴趣的音乐。
长期帧（Long-Term frames）：长期帧用于存储跨会话的持久信息，如用户偏好、历史交互记录或学习到的知识。以个人健康管理智能体为例，长期帧可以记录用户长期的健康数据和偏好的健康管理方式，为用户提供持续且个性化的健康建议。

Frames具有高度的灵活性，可根据智能体的角色和上下文进行组合。不同类型的智能体，会依据自身功能需求，选择合适的Frames组合，以此来动态塑造智能体的“心智状态”，决定其能够访问和响应的信息。而Persona则在其中发挥着关键的控制作用，它能够根据具体的使用场景、隐私级别、可信操作以及所需的认知深度，有选择地激活或调整Frames。

（二）Operators：智能体的行动执行层

如果说Frames定义了智能体所“知道”的内容，那么Operators则明确了智能体如何运用这些知识。Operators就像是智能体的认知工具，它基于当前的Frame对信息进行解释、转换或路由。常见的Operators类型包括：

偏好（Preferences）：根据用户定义或系统定义的偏好来塑造输出内容。在电商推荐系统中，用户可以设置自己喜欢的商品品牌、价格范围等偏好，智能体通过Preferences Operator将这些偏好应用到商品推荐中，为用户提供更符合心意的商品建议。
规则（Rules）：用于应用业务规则、进行策略检查或执行工作流逻辑。在金融领域，智能体在处理贷款申请时，会依据Rules Operator检查用户的信用记录、收入水平等是否符合贷款规则，还能在面对模糊输入时，发起LLM查询进行推理，或者进行条件评估。
启发式方法（Heuristics）：利用轻量级推理策略或领域捷径来高效地做出决策。当需要更深入的思考时，Heuristics可以启动思维链提示；当内部逻辑处理能力不足时，还能将控制权委托给外部工具。在图像识别辅助系统中，Heuristics可以快速根据一些常见的图像特征做出初步判断，若遇到复杂图像，则借助外部专业图像分析工具进行处理。
工具（Tools）：实现与外部系统、API或函数的交互，例如获取实时数据、进行搜索和总结等。在新闻资讯智能体中，Tools Operator可以连接到新闻API，获取最新的新闻内容，并对其进行筛选和总结，为用户提供有价值的新闻信息。同时，Tools还能支持检索增强生成（RAG）工作流程，帮助智能体获取特定领域的知识，使其回答更具时效性和针对性。

Operators与Frames紧密协作，从Frames中提取信息并进行相应操作。它们具有模块化和可组合性的特点，能够根据任务需求或智能体的Persona进行排序、组合或选择性激活。部分Operators是无状态的，而另一些则依赖更深入的上下文信息。此外，Operator层是人机协作（Human-in-the-Loop，HITL）系统最自然的集成点。当规则或启发式方法遇到模糊条件或低置信度输出时，人类可以介入进行验证、批准或推翻决策，这在关键工作流程、高风险操作或需要可追溯性和监督的企业系统中尤为重要。

（三）Persona：智能体的身份与协调层

Persona赋予智能体身份、角色和行为意图。它不仅决定了智能体的行动方式，还控制着哪些Frames和Operators处于激活状态，以及如何针对特定用户、任务或上下文对它们进行配置。一个Persona可以定义以下关键内容：

智能体的角色：例如“热情的音乐推荐者”或“成本节约分析师”，明确了智能体在特定场景中的功能定位。
语气或风格：决定智能体是以正式、叙事还是诙谐的方式与用户交流，这有助于塑造智能体独特的个性，增强用户体验。
记忆范围：确定智能体是无状态运行，还是需要纳入长期上下文信息，以此来灵活调整智能体对信息的处理方式。
偏好工具和推理模式：选择是优先使用规则、启发式方法还是人类审核，从而使智能体的决策过程更符合其角色和任务需求。

通过封装身份和协调功能，Persona使得设计出一致且上下文感知的智能体成为可能，并且能够将它们与现实世界中的角色相匹配，避免了为每种场景都进行硬编码的繁琐工作。

三、RASA在不同角色中的应用价值

（一）为架构师提供模块化设计蓝图

对于架构师而言，RASA提供了一个模块化的设计蓝图，用于构建具备记忆感知能力且与角色对齐的智能体系统。它将状态、行为和身份解耦，使得AI组件更易于测试、管理和适应企业的多样化需求。架构师可以基于RASA的框架，灵活地组合Frames、Operators和Persona，设计出满足不同业务场景的智能体架构，提高系统的可维护性和扩展性。

（二）助力开发者高效实现功能集成

开发者在使用RASA时，能够获得一种结构化的方式来插入记忆层、工具和推理步骤，无需每次都重新构建协调逻辑。Frames和Operators为开发者提供了清晰的功能入口点，他们可以专注于实现具体的功能模块，提高开发效率。在开发智能客服系统时，开发者可以利用RASA已有的框架，快速集成会话帧和规则Operators，实现智能客服对常见问题的快速响应和处理。

（三）帮助产品所有者转化业务需求

产品所有者可以借助RASA将业务需求转化为模块化的智能体行为。通过调整智能体的语气、规则和偏好，使其与产品的角色设定、品牌形象和客户工作流程相契合。在设计一款面向年轻用户群体的社交APP智能助手时，产品所有者可以利用RASA设定智能体活泼、幽默的语气风格，并制定符合社交场景的规则和偏好，提升产品的用户体验和市场竞争力。

（四）为企业领导者提供治理思路

RASA为企业领导者提供了一个可扩展的思维模型，帮助他们理解和管理AI与客户、员工或其他系统的交互方式。通过RASA，企业领导者可以清晰地把握AI系统的控制要点、个性化设置和人为监督的切入点，更好地引导AI系统为企业创造价值，同时确保其符合企业的战略方向和风险管控要求。

（五）推动企业实现AI的规模化应用

对于企业和组织来说，RASA提供了一种将智能体系统与组织结构相匹配的有效途径。智能体的角色、功能、决策策略甚至企业文化都可以在其行为、记忆和决策过程中得到体现，从而实现AI的规模化应用，使其能够与现有的工作流程无缝集成，而不是对其造成干扰。在大型企业的供应链管理中，利用RASA构建的智能体可以根据不同部门的角色和职责，如采购、物流、库存管理等，进行有针对性的记忆和决策，优化整个供应链流程，提高企业运营效率。

四、RASA蕴含的设计理念与发展展望

RASA不仅仅是一个技术架构，更是一种融合了目的、责任和透明度的设计理念。在智能体时代，我们不仅要关注AI能做什么，更要思考它应该做什么。RASA鼓励设计者和组织在每个架构层中融入目的、伦理和可观测性。

智能体的目的确保其行动具有明确的意图，与角色、责任和组织目标保持一致。伦理和安全并非事后考虑的因素，而是由Persona塑造，并通过Operators和人机协作检查点进行管理。可观测性和透明度则源于架构的模块化，能够追踪决策的制定过程、所使用的记忆以及采取的行动。

目前，RASA仍处于早期探索阶段，它源于人们希望利用LLMs和工具增强现实世界流程的愿望，试图模拟人类的思维、决策和协作方式。尽管它并非革命性的突破，但它以新颖的方式组合了已有的概念，尤其是在构建记忆和决策机制方面，为创建智能、自适应的智能体奠定了坚实的基础。在未来，随着AI技术的不断发展，RASA有望在更多领域得到应用和完善，进一步推动智能体与现实世界的深度融合，助力企业和社会实现智能化转型。

code:https://github.com/vedanta/rasa