AI在线 AI在线

深入 GraphRAG:构建更强大的知识增强问答系统的六大开源项目

前几天我分享了一篇文章知识图谱 向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。 然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。 Microsoft GraphRAG微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。

深入 GraphRAG:构建更强大的知识增强问答系统的六大开源项目

前几天我分享了一篇文章知识图谱+向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。

Microsoft GraphRAG

微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。它能够从私有文档中自动构建知识图谱,在查询时借助图结构进行多跳推理,提升复杂问答表现。

它支持图结构推理和链式多轮查询,提供完整的端到端数据管道,并兼容 Azure 等企业级部署。该项目通过 GitHub 地址(microsoft/graphrag)提供,适用于企业内部文档问答、复杂信息抽取以及语义搜索等场景,帮助用户高效处理和分析海量数据。

Nano-GraphRAG

Nano-GraphRAG 是一个专注于简化的 GraphRAG 实现,代码量仅约 1100 行,却保留了核心能力,并兼容多种本地/云模型。

Nano-GraphRAG架构精简,支持异步处理,同时默认集成向量库Faiss,图数据库Neo4j以及大模型调用工具Ollama。有全局和局部两种查询方式,支持增量更新、定制模板。

相对来说,因为Nano-GraphRAG代码更少,部署简单,因此更适合本地知识图构建以及用于轻量级语义问答服务。

DIGIMON

由 JayLZhou 等人开发的 DIGIMON(又名 GraphRAG)是一个用于研究 GraphRAG 多种算法效果的平台,特别适合学术研究者和算法团队。

DIGIMON支持实现多种变种(如 LGraphRAG、HippoRAG 等),通过 YAML 配置实现快速策略切换,并附带评估脚本与数据集,同时兼容本地及 OpenAI 模型。该项目更适用于图谱问答算法研究以及多跳 QA 效果评估等场景。

图片

Fast GraphRAG

Fast GraphRAG 由 CircleMind AI 发布,主打高性能和高可解释性,在保持查询准确度的同时,显著降低计算开销。

fast-graphrag 项目支持 PageRank 式图遍历搜索、增量更新与自动图精炼、异步推理以及类型安全等亮点特性,在官方文档说明中,表示其可节省约 6 倍推理成本。该项目更适用于需要高性价比和低延迟知识问答系统的企业部署。

LightRAG

LightRAG 由香港大学开发,是一个带有图谱可视化界面的 RAG 系统,支持多种文件类型的解析,适合教学、演示及快速开发。

LightRAG 项目支持文档上传、实体识别、图谱构建、可视化查询路径、多格式导出,并集成 Ollama、本地模型与图数据库,提供 Web 前端和 RAG 对话接口。该项目更适用于教育、知识展示以及通用 RAG 服务化部署等场景。

图片

HuixiangDou2

由华师大团队推出的 HuixiangDou2(又名 ROGRAG)专注于多轮问答场景中的知识增强,支持双层检索策略,强调中文能力与鲁棒性。

HuixiangDou2 项目支持 Group Chat 场景、文档层与图谱层双重检索增强,默认支持中文 (zh_cn) 接口,并适配客服和技术支持类问答系统。该项目更适用于中文环境下的客服系统和智能助手等场景。

最后再总结一波,对于工业级企业部署,建议使用Microsoft GraphRAG和Fast GraphRAG;对于轻量级或本地测试,推荐Nano-GraphRAG 和LightRAG;针对图谱问答研究,选择DIGIMON;对于中文多轮问答,推荐HuixiangDou2(ROGRAG)。这些项目可根据具体场景进行选择,以优化知识图谱和问答系统的性能。

写在最后

2025年的今天,AI创新已经喷井,几乎每天都有新的技术出现。作为亲历三次AI浪潮的技术人,我坚信AI不是替代人类,而是让我们从重复工作中解放出来,专注于更有创造性的事情,关注我们公众号口袋大数据,一起探索大模型落地的无限可能!

相关资讯

RAG(三)GraphRAG进阶:GraphReader-- 基于图的Agent,让大模型“读懂”长文本

上一篇论文介绍了GraphRAG,今天来看一篇算是其进阶版的方法--GraphReader。 对于其研究动机,简单来说,LLMs具有强大的规划和反思能力,但在解决复杂任务时,如函数调用或知识图谱问答(KGQA),以及面对需要多次推理步骤的问题时,仍然面临困难。 特别是当涉及到长文本或多文档的处理时,现有的方法往往难以充分利用这些模型的能力来捕捉全局信息,并有效地进行决策。
3/13/2025 12:24:34 PM
Glodma

什么时候GraphRAG超越传统RAG:突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架

核心速览研究背景研究问题:这篇文章要解决的问题是如何在检索增强生成(RAG)系统中有效利用图结构来提升大型语言模型(LLMs)的性能,特别是在知识密集型任务中。 研究难点:该问题的研究难点包括:现有基准测试(如HotpotQA、MultiHopRAG和UltraDomain)未能充分评估图结构在RAG系统中的有效性;现有数据集缺乏领域特定知识和明确的逻辑连接;现有基准测试的任务复杂度划分不细致,无法全面评估模型的复杂推理能力。 相关工作:该问题的研究相关工作有:传统的RAG系统通过将文本分块进行索引和检索,但这种方法会牺牲上下文信息;GraphRAG系统通过构建外部结构化图来改进LLMs的上下文理解能力,但其在实际任务中的表现不一致。
6/11/2025 2:55:00 AM
知识图谱科技

GraphRAG太慢LightRAG延迟高?华东师大新方法一招破解双重难题

GraphRAG的索引速度慢,LightRAG的查询延迟高? 这些影响效率的难题,现在终于迎来改进——由华东师范大学李翔老师带领的的Planing Lab团队推出高效解决方法E²GraphRAG。 该方法在大部分测试中接近了最优的GraphRAG方法。
6/13/2025 1:33:00 AM
  • 1