AI在线 AI在线

深入 GraphRAG:构建更强大的知识增强问答系统的六大开源项目

前几天我分享了一篇文章知识图谱 向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。 然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。 Microsoft GraphRAG微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。

深入 GraphRAG:构建更强大的知识增强问答系统的六大开源项目

前几天我分享了一篇文章知识图谱+向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。

Microsoft GraphRAG

微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。它能够从私有文档中自动构建知识图谱,在查询时借助图结构进行多跳推理,提升复杂问答表现。

它支持图结构推理和链式多轮查询,提供完整的端到端数据管道,并兼容 Azure 等企业级部署。该项目通过 GitHub 地址(microsoft/graphrag)提供,适用于企业内部文档问答、复杂信息抽取以及语义搜索等场景,帮助用户高效处理和分析海量数据。

Nano-GraphRAG

Nano-GraphRAG 是一个专注于简化的 GraphRAG 实现,代码量仅约 1100 行,却保留了核心能力,并兼容多种本地/云模型。

Nano-GraphRAG架构精简,支持异步处理,同时默认集成向量库Faiss,图数据库Neo4j以及大模型调用工具Ollama。有全局和局部两种查询方式,支持增量更新、定制模板。

相对来说,因为Nano-GraphRAG代码更少,部署简单,因此更适合本地知识图构建以及用于轻量级语义问答服务。

DIGIMON

由 JayLZhou 等人开发的 DIGIMON(又名 GraphRAG)是一个用于研究 GraphRAG 多种算法效果的平台,特别适合学术研究者和算法团队。

DIGIMON支持实现多种变种(如 LGraphRAG、HippoRAG 等),通过 YAML 配置实现快速策略切换,并附带评估脚本与数据集,同时兼容本地及 OpenAI 模型。该项目更适用于图谱问答算法研究以及多跳 QA 效果评估等场景。

图片

Fast GraphRAG

Fast GraphRAG 由 CircleMind AI 发布,主打高性能和高可解释性,在保持查询准确度的同时,显著降低计算开销。

fast-graphrag 项目支持 PageRank 式图遍历搜索、增量更新与自动图精炼、异步推理以及类型安全等亮点特性,在官方文档说明中,表示其可节省约 6 倍推理成本。该项目更适用于需要高性价比和低延迟知识问答系统的企业部署。

LightRAG

LightRAG 由香港大学开发,是一个带有图谱可视化界面的 RAG 系统,支持多种文件类型的解析,适合教学、演示及快速开发。

LightRAG 项目支持文档上传、实体识别、图谱构建、可视化查询路径、多格式导出,并集成 Ollama、本地模型与图数据库,提供 Web 前端和 RAG 对话接口。该项目更适用于教育、知识展示以及通用 RAG 服务化部署等场景。

图片

HuixiangDou2

由华师大团队推出的 HuixiangDou2(又名 ROGRAG)专注于多轮问答场景中的知识增强,支持双层检索策略,强调中文能力与鲁棒性。

HuixiangDou2 项目支持 Group Chat 场景、文档层与图谱层双重检索增强,默认支持中文 (zh_cn) 接口,并适配客服和技术支持类问答系统。该项目更适用于中文环境下的客服系统和智能助手等场景。

最后再总结一波,对于工业级企业部署,建议使用Microsoft GraphRAG和Fast GraphRAG;对于轻量级或本地测试,推荐Nano-GraphRAG 和LightRAG;针对图谱问答研究,选择DIGIMON;对于中文多轮问答,推荐HuixiangDou2(ROGRAG)。这些项目可根据具体场景进行选择,以优化知识图谱和问答系统的性能。

写在最后

2025年的今天,AI创新已经喷井,几乎每天都有新的技术出现。作为亲历三次AI浪潮的技术人,我坚信AI不是替代人类,而是让我们从重复工作中解放出来,专注于更有创造性的事情,关注我们公众号口袋大数据,一起探索大模型落地的无限可能!

相关资讯

RAG(三)GraphRAG进阶:GraphReader-- 基于图的Agent,让大模型“读懂”长文本

上一篇论文介绍了GraphRAG,今天来看一篇算是其进阶版的方法--GraphReader。 对于其研究动机,简单来说,LLMs具有强大的规划和反思能力,但在解决复杂任务时,如函数调用或知识图谱问答(KGQA),以及面对需要多次推理步骤的问题时,仍然面临困难。 特别是当涉及到长文本或多文档的处理时,现有的方法往往难以充分利用这些模型的能力来捕捉全局信息,并有效地进行决策。
3/13/2025 12:24:34 PM
Glodma

微软开源的GraphRAG爆火,Github Star量破万,生成式AI进入知识图谱时代?

知识图谱从不退环境!LLM 很强大,但也存在一些明显缺点,比如幻觉问题、可解释性差、抓不住问题重点、隐私和安全问题等。检索增强式生成(RAG)可大幅提升 LLM 的生成质量和结果有用性。本月初,微软发布最强 RAG 知识库开源方案 GraphRAG,项目上线即爆火,现在星标量已经达到 10.5 k。项目地址::,它比普通的 RAG 更强大:GraphRAG 使用 LLM 生成知识图谱,在对复杂信息进行文档分析时可显著提高问答性能,尤其是在处理私有数据时。                               
7/15/2024 2:57:00 PM
机器之心

解读GraphRAG

RAG 结合了大型语言模型和信息检索模型的力量,允许它们用从大量文本数据中提取的相关事实和细节来补充生成的响应。 事实证明,这种方法在提高模型输出的实际准确性和总体质量方面是有效的。 图片然而,随着 RAG 系统得到更广泛的采用,它们的局限性开始浮出水面,具体而言:平面检索: RAG 将每个文档作为一个独立的信息。
11/26/2024 7:20:25 AM
曹洪伟
  • 1