RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

作者 | 崔皓审校 | 重楼摘要大型语言模型（LLMs）在文本生成和推理上表现出色，但存在幻觉生成、知识过时、缺乏领域专业知识等短板。检索增强生成（RAG）虽能通过外部文档检索增强 LLMs 以减少幻觉、获取最新信息，却面临掺杂误导信息、缺少逻辑连接的问题。为此，检索增强结构化（RAS）技术应运而生，它整合知识结构化技术（如分类法和知识图谱），将非结构化文本转化为结构化知识，提升推理和验证能力。

作者 | 崔皓

审校 | 重楼

摘要

大型语言模型（LLMs）在文本生成和推理上表现出色，但存在幻觉生成、知识过时、缺乏领域专业知识等短板。检索增强生成（RAG）虽能通过外部文档检索增强 LLMs 以减少幻觉、获取最新信息，却面临掺杂误导信息、缺少逻辑连接的问题。为此，检索增强结构化（RAS）技术应运而生，它整合知识结构化技术（如分类法和知识图谱），将非结构化文本转化为结构化知识，提升推理和验证能力。

RAS 包含信息检索、结构化知识表示、大型语言模型三大组件，通过行动规划、主题范围检索、动态知识结构化、知识增强生成四个阶段实现 “检索 - 结构化 - 生成” 的迭代闭环，在多任务场景下各项指标显著优于 RAG。其中分类法是 RAS 实现 “结构增强检索” 的关键，通过 HiExpan、CoRel 等技术从 “种子” 结构出发扩展宽度与深度，为检索划定主题范围，提升效率与精度，助力 RAS 解决传统 RAG 的痛点，实现更准确的复杂推理与答案生成。

LLM 的短板

大型语言模型（LLMs）的出现彻底改变了自然语言处理领域，它们在文本生成和复杂推理方面展现出卓越的能力，这些模型通过对海量文本数据进行预训练，建立了对语言结构的深层理解。

然而，当 LLMs 被部署到现实世界的应用中时，它们的局限性也随之凸显。主要挑战包括：

1. 幻觉生成（Hallucination）：LLMs 有时会生成听起来合理但事实错误的信息。

2. 知识过时：LLMs 依赖其训练数据中可能过时或不完整的知识。

3. 缺乏领域专业知识：在科学研究、医疗保健或技术领域等知识密集型应用中，LLMs 往往缺乏所需的精确且详细的知识。

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

RAG 的出现

为了弥补 LLMs 的这些缺陷，检索增强生成（Retrieval-Augmented Generation, RAG）范式被引入。

RAG 的核心机制是通过从外部文档中检索相关信息来增强 LLMs，从而使模型的响应具有事实基础。RAG 通过将 LLMs 的响应建立在检索到的文档之上，极大地减少了幻觉，并使其能够访问最新的信息。

传统的 RAG 虽然能够弥补 LLMs 的短板，但也会带来一些问题：

•掺杂误导信息：RAG 在做文本切割时，会保存大量的非结构化文本，这些文本在表达含义时会给人含糊不清的感觉。从而误导 LLMs，导致搜索的结果偏离结果。同时，非结构化文本通常还包含无关的细节，可能导致模型失准。例如当查询：“鲁迅的代表作品是什么？”的时候，RAG 检索到的文本段落： “鲁迅，原名周树人，是中国现代文学的奠基人之一。近年来，以他生平为蓝本的电视剧《觉醒年代》获得了巨大的成功，引发了年轻人的热烈讨论。” RAG 在回答的同时，在答案中还混入了大量关于电视剧的无关细节。这导致输出的冗余或不准确，我们需要通过提示词或者其他手段针对回答内容进行二次处理。

•缺少逻辑连接：当需要逻辑推理才能得到结果时，非结构化文本明显显得力不从心，因为段落缺乏的明确逻辑连接，所以得到的结果往往不尽如人意，从而导致幻觉。例如，当我们查询：“中国最大的电商平台‘淘宝’的创始人马云，他毕业于哪所大学？”的时候，RAG 会分别搜索 2 个不同的文本块：

文本块 A： “淘宝网由马云于2003年创立，是中国最大的在线购物平台。

文本块 B： “马云毕业于杭州师范学院的外语系。”

然后 LLM 需要通过 RAG 提供的两个文本块进行推理，得到“淘宝”“马云”“杭州师范学院”的关系。这也是 RAG 在处理复杂、多跳推理过程中的存在的问题。

RAS 的出现

面对传统 RAG 的诸多困境，一种更具创新性和适应性的解决方案：检索增强结构化（Retrieval-Augmented Structuring，RAS）应运而生。RAS 的特点是将非结构化文本转化为结构化知识，并且适合复杂问题的推理。

与传统 RAG 相比，RAS 具有显著的优势。它能够有效减少无关细节和误导信息对模型的干扰，因为在结构化过程中，数据已经经过筛选和整理，模型能够专注于关键信息进行处理，从而大大提高了回答的准确性和可靠性。同时，RAS 构建的结构化知识图谱，能够清晰展现事实之间的逻辑联系，为模型提供了更丰富的语义理解，使其在处理复杂问题和多步推理任务时表现更为出色。

RAS通过结构化的处理方式，从源头上对数据进行梳理和筛选。以 “鲁迅的代表作品是什么？” 这一查询为例，RAG 检索到的文本可能会混入如 “鲁迅生平为蓝本的电视剧《觉醒年代》获得成功” 等无关细节，使得答案冗余且不准确。但 RAS 在面对同样的问题时，会运用实体识别和关系提取技术，会链接 “鲁迅” 与 “代表作品” 两个实体，并从文本中提取出如《狂人日记》《阿 Q 正传》等真正相关的信息，排除一切无关干扰。

当涉及到复杂的逻辑推理问题时，特别是在处理多跳推理任务时，RAG 往往难以让 LLM 准确把握信息之间的关联，从而导致幻觉和错误的答案。例如，对于 “中国最大的电商平台‘淘宝’的创始人马云，他毕业于哪所大学？” 这样的问题，RAG 需要分别搜索关于 “淘宝创始人” 和 “马云毕业院校” 的文本块，再让 LLM 进行推理关联，这一过程容易出现偏差。

与之形成鲜明对比的是，RAS 构建的知识图谱能够清晰地展现实体之间的逻辑关系。在处理上述问题时，RAS 所构建的知识图谱中已经包含了 “淘宝 - 创始人 - 马云” 以及 “马云 - 毕业院校 - 杭州师范学院” 这样的关系路径。当接收到查询时，RAS 可以迅速通过知识图谱找到相关信息，并依据图谱中的逻辑连接进行准确的推理，直接给出 “马云毕业于杭州师范学院” 这一正确答案。

如下图所示，相较于 RAG 相关模型，RAS 系列模型在短文本任务（如 TQA、2WQA、PopQA）、闭集任务（如 Pub、ARC）以及长文本生成任务（如 ASQA、ELIS）的各项关键指标上均展现出显著优势，无论是准确率、综合指标 F1，还是文本生成质量评估指标 rouge、mauve，RAS 都更为出色，充分彰显出其在多任务场景下相较于 RAG 的性能优越性。

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

什么是 RAS？

好！通过上面的介绍，我们大致了解 RAS 比 RAG 要厉害，具体如何厉害，我们再好好掰扯掰扯！RAS 的关键技术是通过整合知识结构化技术（如分类法和知识图谱），将非结构化文本转化为有组织的知识，从而增强推理和验证能力。

这句话说起来容易，理解起来有点抽象，再往下看，RAS 通过三个组件实现上述能力：

信息检索组件：负责从外部知识源高效精准查找与查询相关的文本。采用主题范围检索机制，结合主题分类和语义相关性，先确定子查询主题分布，再映射到文档主题分布，从而检索出主题特定子语料库，大幅缩小搜索空间，提升检索效率与精度。
结构化知识表示组件：是 RAS 区别于传统 RAG 的核心，将检索到的非结构化文本转化为知识图谱、分类法等有组织的知识形式。通过动态知识结构化，利用 “文本到三元组” 模型把文本段落转换为知识三元组，再迭代合并到特定查询的知识图谱中。
结构化知识表示组件：是 RAS 区别于传统 RAG 的核心，将检索到的非结构化文本转化为知识图谱、分类法等有组织的知识形式。通过动态知识结构化，利用 “文本到三元组” 模型把文本段落转换为知识三元组，再迭代合并到特定查询的知识图谱中。
大型语言模型组件：是 RAS 的智能核心，承担行动规划者和回答者角色。行动规划者依据当前知识状态，决策是否直接回答、终止检索或生成子查询，引导检索与推理过程；回答者在知识充足时，利用结构化知识生成最终答案，减少幻觉，提升事实一致性与复杂推理能力。

好！到这里，大概知道 RAS 之所以这么牛，是因为有三大组件，为了方便知道他们是如何工作的。通过如下一张图来深入了解，RAS通过检索获取相关信息，再将其结构化融入知识图谱，最终借助 LLM 生成更准确的内容。体现了 “检索 - 结构化 - 生成” 的执行过程。

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

可以将上述过程进行拆解如下：

输入与检索阶段：看图的上半部分，以 “分类体系（Taxonomy）、检索器（Retriever）、查询（Query）” 为输入，通过 “Retrieval（检索）” 步骤，获取 “主题和语义相关的文本（Thematically & Semantically Relevant Text）”。这里的分类体系为检索划定主题范围，检索器结合查询精准找到相关文本，确保检索内容的针对性。
结构化阶段：图的左下角，对检索到的文本进行 “Structuring（结构化）” 处理，将其转化为 “子图（Subgraph）”。这一步是 RAS 的关键创新之一，把非结构化的文本信息转化为更有条理、更易被模型利用的图结构知识单元。
知识图谱与生成阶段：右下角，生成的 “子图（Subgraph）” 会 “Update（更新）” 到 “知识图谱（KG）” 中。随后，“知识图谱（KG）” 与 “大语言模型（LLM）” 结合，一方面 LLM 利用知识图谱中的结构化知识进行 “Generation（生成）”，产出最终内容；另一方面，生成过程中还会产生 “反馈与子查询（Feedback & Subquery）”，回传到最初的检索环节，形成迭代闭环。

通过对三个关键组件的了解，RAS不仅解决了搜索信息的问题，还解决了如何正确组织信息并通过推理得到答案的问题。

RAS 的四个阶段

在了解了 RAS 的三个组件之后，再来看看它在执行搜索任务时，要经历的四个阶段。如下图所示：

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

这里通过一个表格对每个阶段进行描述：

阶段	主要作用
阶段 1：行动规划	战略性地确定知识需求，并决定下一步是检索、继续检索还是回答。
阶段 2：主题范围检索	高效地在庞大的语料库中找到主题和语义都最相关的原始文本。
阶段 3：动态知识结构化	将检索到的非结构化文本转化为可供推理的、不断演进的知识图谱。
阶段 4：知识增强生成	利用积累的结构化知识和推理链，生成最终的、准确的答案。

上面表格的方式还是有点概念了，这里我们还是使用之前的例子，假设要搜索：“中国最大的电商平台‘淘宝’的创始人马云，他毕业于哪所大学？”。看看要经历如下哪几个阶段：

阶段	动作与输出	RAS 机制的作用
阶段 1：行动规划（迭代 0）	规划者评估知识不足，生成子查询：“马云毕业于哪所大学？”	LLM 作为规划者，识别多跳问题需外部信息，指导检索方向
阶段 2：主题范围检索（迭代 0）	经主题定界（如 “名人传记”）缩小范围，检索到文本：含 “马云毕业于杭州师范学院的外语系。”	主题范围检索高效聚焦，避免全语料库低效搜索
阶段 3：动态知识结构化（迭代 0）	文本到三元组模型将文本转换为事实，添加到知识图谱 (马云，毕业于，杭州师范学院外语系)	把非结构化文本转化为结构化知识，构建可推理的知识图谱
阶段 1：行动规划（迭代 1）	规划者评估知识充足，输出结果	LLM 利用结构化知识自我评估，避免不必要的检索迭代
阶段 4：知识增强生成	回答者模型利用编码后的内容，生成最终答案：“马云毕业于杭州师范学院。”	基于结构化知识图谱生成，确保答案准确、事实一致，支持复杂推理

细心的你可能已经注意到了， RAS 框架并非按 “1-2-3-4” 线性执行，而是在阶段 3 结束后回到阶段 1，这一循环设计需要展开进行说明：

RAS 多跳推理

传统 RAG 采用 “单次检索 + 生成” 的线性架构，面对多跳推理（如 “淘宝创始人马云的毕业院校” 需先关联 “淘宝 - 马云” 再查 “马云 - 院校”）或需多信息片段的复杂任务时，常因信息不全导致推理失败。RAS 的循环流程通过 “多次检索 - 结构化 - 评估” 的迭代，能持续补充知识缺口，避免单次检索的局限性。

LLM 双重角色

RAS 中 LLM 承担 “行动规划者” 与 “回答者” 两种角色，这是阶段 3 需返回阶段 1 的关键前提：

行动规划者（阶段 1）：负责 “评估知识状态”，判断当前是否需要检索、是否生成子查询，是流程的 “决策者”；
回答者（阶段 4）：仅在规划者判定知识充足后启动，负责 “利用结构化知识生成答案”，是流程的 “输出者”。阶段 3 结束后回到阶段 1，本质是让 “决策者” 重新评估新增结构化知识，而非直接让 “输出者” 盲目生成，确保答案基于完整信息。

动态自我完善

阶段 3 的核心输出是 “迭代增强后的知识图谱”，而回到阶段 1 的本质是基于这一输出进行 “知识完整性再评估”，具体流程如下：

阶段 3 的关键反馈：阶段 3 通过 “文本到三元组” 模型，将检索到的非结构化文本转化为知识三元组（如 “马云 - 毕业于 - 杭州师范学院”），并合并到查询特定的知识图谱中，完成知识的 “结构化补充”；
阶段 1 的重新评估：增强后的知识会反馈给阶段 1 的规划者，规划者结合主查询 Q、历史子查询链及当前知识，判断知识是否足够：

若知识仍有缺口（如多跳推理中仅完成第一跳），则生成新子查询，重新进入阶段 2 检索，开启下一轮迭代；
若知识已完整覆盖主查询需求，则输出结果，终止迭代并进入阶段 4 生成答案。也就是说，阶段 3→阶段 1 的循环，是 RAS 实现 “动态自我完善” 的核心：通过持续评估知识缺口、针对性补充结构化知识，确保最终生成的答案基于完整、精准的信息。

RAS 分类法作用

前面通过介绍 RAS 处理查询请求的四个阶段，大致知道它的工作原理。如果留心的话，在第二阶段提到了 RAS 的“分类法”。分类法是 RAS 框架实现 “结构增强检索” 的关键。

1. 破解传统 RAG 的核心痛点

传统 RAG 将外部信息视为非结构化文本段落，易因信息混乱（如无关细节、非原子化事实）误导 LLM，且难以处理多跳推理等复杂任务。而分类法通过 “主题结构化引导”，从根源上解决这两个问题：既过滤无关信息，又为复杂查询提供清晰的知识检索路径。

2. 在 RAS 第二阶段的关键价值

分类法通过 “主题引导” 实现 “精准检索 + 效率提升” 双重目标：

智能定位知识方向：RAS 的检索并非依赖单纯的关键词或语义匹配，而是以领域特定分类为指引，锁定查询所属主题。以 “马云的毕业大学” 为例：当系统接收子查询 “马云毕业于哪所大学？” 时，分类法可直接将其归类到 “人物传记”主题，避免检索范围扩散到无关领域（如 “商业”“科技” 等非核心主题）。
显著提升计算效率： “主题预过滤” 能大幅减少计算资源消耗。据消融研究显示，相比仅依赖密集检索的传统 RAG，基于分类法的主题范围检索可减少约 60% 的处理时间，因它先通过轻量级主题分类（仅 298 个类维度）完成初步筛选，再对缩小后的语料库进行高精度语义匹配。

RAS 分类法定义

在了解分类法的作用之后，再来看看它是如何实现的。RAS 中的分类法是一种 “树状层级结构”，遵循 “从宽泛到具体” 的逻辑组织概念：顶部为父节点（如 “人物传记”“教育”），下方延伸出子节点（如 “人物传记→企业家→中国互联网人物”“教育→高等教育→师范院校”），形成清晰的主题分类体系。

在文本挖掘中，这种结构可作为 “标签空间结构化工具”，帮助系统快速识别文本所属主题，为检索提供明确指引。

分类法的构建始于一个 “种子”即最基础的主题层级框架。后续通过不同技术（如实体扩展、关系转移）在宽度（增加同级主题）和深度（延伸子主题）上优化，最终形成适配 RAS 需求的领域分类体系。

RAS 分类法实现

分类法在 RAS 中的核心应用场景是第二阶段的 “主题定界”，通过 “主题分类→分布转换→子语料库检索” 三步流程，将子查询映射到目标语料，为后续密集检索铺路。

分类法的构建需提前完成，换句话说就是在创建知识库的时候就需要将原始信息按照一定结构进行保存，核心技术包括：

HiExpan 技术

通过 “实体扩展 + 词类比细化”，从领域文本语料中生成任务特定分类法，确保主题与业务场景适配；如下图所示，展示了分类法（Taxonomy）的构建流程，核心是从 “种子分类法” 出发，结合文本语料库中的术语列表，生成 “任务导向的分类法”，以实现更精准的知识组织与检索。

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

这里对图中内容进行详细讲解：

文本语料库（Text Corpora）与术语列表（Term List）：左上角的文本语料库是信息来源，从中提取出各类术语，形成术语列表。这些术语涵盖地理（如 U.S、Canada、Texas）、生物分类（如 Species、Genus、Family）、人物（如 M Zuckerberg、D Trump）、领域分类（如 Application、Material）等多个维度，为分类法构建提供丰富的词汇基础。
用户输入 “种子” 分类法（Input “Seed” Taxonomy）：左下角，用户基于特定任务（如图中是 “地理位置分类”），先定义一个初始的 “种子” 分类法。例如，用户围绕 “地理位置” 构思出以 “Root” 为根，包含 “U.S”“China” 等父节点，以及 “California”“Illinois” 等子节点的基础结构。
生成任务导向的分类法（Output Task-guided Taxonomy）：系统结合术语列表和种子分类法，对分类结构进行扩展与细化。在图中，原本的 “U.S” 节点下新增了 “Texas”“Arizona”，“China” 节点下新增了 “Beijing”“Shanghai”，“Canada” 节点下新增了 “Ontario”“Quebec” 等子节点，形成了分类体系。

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

CoRel 技术

利用预训练语言模型（PLMs）的关系转移能力，扩展分类法的宽度（增加新主题）和深度（细化子主题）。

ColRel 使用两个主要模块：

关系转移：该模块关注“关系”，可以将“关系”在分类法的不同路径之间转移，扩展其宽度和深度。
概念学习：加强了每个节点的含义。它通过嵌入分类法和文本语料库来实现，因此每个概念都由一组连贯、相关的术语表示。

依旧通过如下图片加深理解。

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

从 “种子分类法” 到 “主题分类法”：对应分类法构建的流程：

图片左侧的 “Input 1: Seed Taxonomy” 是一个简单的 “种子” 分类结构，根节点下仅包含Dessert（甜点）和Seafood（海鲜）两个一级节点，Dessert下又只有Cake（蛋糕）和Ice-cream（冰淇淋）两个子节点 —— 这与文字中 “分类法构建通常始于一个基本的‘种子’结构” 完全对应。
图片右侧的 “Output: Topical Taxonomy” 则是扩展后的完整分类体系：

a.宽度扩展：根节点下新增了Food、Menu、Course、Dinner、Salad等新主题（对应文字中 “扩展分类法的宽度（增加新主题）”）；

b.深度扩展：原有节点的子层级被大幅细化（如Cake下新增Crème Brûlée、Tiramisu等子主题；Seafood下细分出Oysters、Crabs等子类别，且每个子类别又有更细的划分）—— 这对应文字中 “扩展分类法的深度（细化子主题）”。

CoRel 技术的核心机制在图片中的体现

前文提到 CoRel 的关系转移模块能 “泛化种子的父子关系，推导出更广泛的概念层级联系”，而图片的扩展过程正是这一机制的直观体现：

种子分类法中 “Dessert是Cake的父节点”“Seafood是Crab类的父节点” 这些初始父子关系，被模型学习并 “转移” 到新的概念上（如新增的Salad与其子节点Dressing、Menu Items的层级关系，Oysters与其子节点Fresh Oysters、Raw Oysters的层级关系），从而实现分类法的自动化扩展。
文字中 “概念学习模块通过嵌入分类法和文本语料库（Input 2: Corpus），让每个概念由连贯的术语表示”，也解释了图片中每个节点下为何会有一组具体、相关的术语（如Cake下的Crème Brûlée、Chocolate Cake等，都是对 “蛋糕” 这一概念的连贯术语扩展）。

总结

本文先阐述 LLMs 的短板，引出 RAG 范式，又指出其在信息误导和逻辑连接上的不足，进而介绍 RAS 技术。RAS 通过将非结构化文本转化为结构化知识（如知识图谱、分类法），结合三大组件和四阶段迭代流程，有效解决了传统 RAG 的问题，在多任务中性能更优。分类法作为 RAS 的关键，借助 HiExpan 和 CoRel 技术从 “种子” 分类法扩展而来，为检索精准定界，提升效率。RAS 的创新在于 “结构化” 处理，使 LLMs 能基于完整、精准的结构化知识生成答案，尤其在复杂推理任务中表现突出，为 LLMs 在现实应用中克服短板提供了有效方案，展现出在知识密集型领域的广阔应用前景。

作者介绍

崔皓，51CTO社区编辑，资深架构师，拥有18年的软件开发和架构经验，10年分布式架构经验。

参考论文

https://arxiv.org/pdf/2509.10697

https://arxiv.org/pdf/2502.10996v1

RAS 革命：从 RAG 到结构化知识增强，破解 LLM 短板的新范式

摘要

LLM 的短板

RAG 的出现

RAS 的出现

什么是 RAS？

RAS 的四个阶段

RAS 多跳推理

LLM 双重角色

动态自我完善

RAS 分类法作用

1. 破解传统 RAG 的核心痛点

2. 在 RAS 第二阶段的关键价值

RAS 分类法定义

RAS 分类法实现

HiExpan 技术

CoRel 技术

CoRel 技术的核心机制在图片中的体现

总结

作者介绍

参考论文

相关资讯

中科院新突破：Auto-RAG开启Agentic RAG落地新篇章

从RAG到QA-RAG：整合生成式AI以用于药品监管合规流程

推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目