RAG
RAG系列:切分优化 - 基于句子余弦距离的语义切分
引言传统的文档切分方法通常采用基于特定字符和固定长度的切分策略,这种方法虽然实现简单,但在实际应用中容易割裂完整的语义单元,导致后续的信息检索与理解受到影响。 相比之下,一种更智能的切分方法是基于句子余弦距离的语义切分。 它不再依据特定字符和固定长度进行机械切分,而是对每个句子进行 embedding,以此来计算相邻句子的余弦距离,再通过算法算出一个相对合理的切分点(某个距离值),最后将不大于该阈值的相邻句子聚合在一起作为一个文档块,从而实现文档语义切分。
6/24/2025 9:51:10 AM
燃哥讲AI
RAG系列:解析优化 - 使用 Doc2X 将 PDF 高效转换为 Markdown
引言在构建高质量的企业级的智能问答系统的过程中,如何高效精准地处理企业已有的海量文档是大部分开发者亟待解决的核心痛点。 有了高效精准的文档解析能力,才能够构建高质量的知识库和高效的信息检索系统,这样 LLM 才能给用户更准确更全面的回答。 在RAG系列(七):解析优化 - 不同文件类型统一转换成Markdown中我们介绍了一款开源的文档解析工具 - MinerU,今天再给大家介绍一款优秀强大的文档解析产品 - Doc2X[1]。
6/23/2025 9:21:53 AM
燃哥讲AI
百度飞桨发布文档解析利器PP-StructureV3:PDF秒变Markdown文件
近日,随着大模型与RAG技术的迅猛发展,结构化数据在智能系统中的价值愈发凸显。 在此背景下,如何将文档图像、PDF等非结构化数据精准转换为结构化数据,成为行业亟待攻克的关键难题。 针对此现状,飞桨团队凭借深厚的技术积累和对用户需求的深刻洞察,推出新一代文档解析工具——PP-StructureV3,为解决复杂文档解析难题提供了创新方案。
6/18/2025 9:01:24 AM
AI在线
鹅厂实习生血泪贴:Agent/RAG 黑科技,真相竟是这样!
作者 | 33号实验室/knnwang被Agent/RAG吊打? 你缺的不是智商,是这篇文章! 亲历鹅厂IEG/WXG项目实战,大三菜鸟用血泪debug记录, 撕开AI基石真面目 → 黑科技本质 = ______!
6/17/2025 9:15:07 AM
腾讯技术工程
基于Dify构建客服智能体全流程实战,揭秘提升RAG效果关键
前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify的知识库功能将RAG管线上的各环节可视化,提供了一套简单易用的用户界面来方便应用构建者管理个人或者团队的知识库,并能够快速集成至 AI 应用中。 为了达到最好的RAG检索效果,需要选择正确的分段设置。
6/17/2025 1:00:00 AM
AI大模型应用开发
RAG:2025年检索增强生成前沿技术完全指南
一、RAG技术的核心突破与行业影响在生成式人工智能爆发的今天,检索增强生成(Retrieval-Augmented Generation, RAG)正以其独特的技术架构,成为连接静态知识库与动态生成能力的桥梁。 这项诞生于2020年的创新技术,通过将信息检索(Retrieval)与文本生成(Generation)解耦又融合的设计,突破了传统语言模型“幻觉”问题的桎梏,为构建可信、可控、可扩展的AI系统奠定了基础。 根据Gartner最新报告,2024年全球已有45%的企业在智能客服、数据分析等场景中部署RAG系统,预计到2025年这一比例将突破68%。
6/13/2025 2:25:00 AM
大模型之路
从 LangChain 到企业级应用:RAG 中 Fixed-Size Chunking 的最佳实践揭秘
众所周知,在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,文档切块策略往往决定了模型检索质量的上限。 切得好,信息命中更精准,生成回答更有上下文逻辑;切得差,模型则容易“答非所问”。 在众多策略中,Fixed-Size Chunking(固定切块)可谓最简单直接,却也是最常被忽视的一种。
6/11/2025 8:40:00 AM
Luga Lee
OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?
检索增强生成(RAG)已成为连接大语言模型与企业数据的标准范式,但该方法存在一个鲜少被讨论的致命缺陷:当前生产环境中的 RAG 系统几乎全部依赖光学字符识别(OCR)技术处理 PDF、扫描件、演示文稿等文档,并默认假设识别结果足以支撑下游 AI 任务。 我们的深度分析表明,这一假设存在根本性缺陷。 OCR 的识别质量形成了一个隐形的天花板,甚至限制了最先进 RAG 系统的性能。
6/11/2025 3:10:00 AM
Baihai IDP
什么时候GraphRAG超越传统RAG:突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架
核心速览研究背景研究问题:这篇文章要解决的问题是如何在检索增强生成(RAG)系统中有效利用图结构来提升大型语言模型(LLMs)的性能,特别是在知识密集型任务中。 研究难点:该问题的研究难点包括:现有基准测试(如HotpotQA、MultiHopRAG和UltraDomain)未能充分评估图结构在RAG系统中的有效性;现有数据集缺乏领域特定知识和明确的逻辑连接;现有基准测试的任务复杂度划分不细致,无法全面评估模型的复杂推理能力。 相关工作:该问题的研究相关工作有:传统的RAG系统通过将文本分块进行索引和检索,但这种方法会牺牲上下文信息;GraphRAG系统通过构建外部结构化图来改进LLMs的上下文理解能力,但其在实际任务中的表现不一致。
6/11/2025 2:55:00 AM
知识图谱科技
RAG系列:切分优化 - 基于 Markdown 语法的文档切分
引言在RAG系列:解析优化 - 不同文件类型统一转换成Markdown一文中我们介绍了将不同文件类型统一解析转换成 Markdown 文件的好处。 本文我们接着这篇文章解析转换后的 Markdown 文件,介绍下基于 Markdown 语法的文档切分方法。 关于指标在RAG系列:系统评估 - 五个主流评估指标详解一文中我们介绍了评估 RAG 系统的五个主流指标,从本文开始,我会根据不同优化阶段来选择要重点关注的指标,不必要每次都关注五个指标的表现,这样可以让我们的优化更聚焦,通过优化每个阶段的重点指标,从而逐步优化系统的各个环节。
6/10/2025 4:30:00 AM
燃哥讲AI
盘点RAG中最容易犯的五个错误
我大部分时间都在构建和改进 Retrieval-Augmented Generation (RAG) 应用。 我相信 RAG 可能是最受欢迎的 AI 应用之一。 它无处不在,从聊天机器人到文档摘要。
6/10/2025 3:00:00 AM
AI研究生
告别 RAG 还太早?听听 Anthropic 怎么说
你有没有向你的RAG系统问过一个具体问题,却得到一个令人沮丧的模糊答案? 你并不孤单。 以下是一个巧妙的改进方法如何改变游戏规则。
6/10/2025 2:44:00 AM
AI研究生
RAG、向量数据库和LLM搜索:人工智能驱动商业智能的未来
译者 | 李睿审校 | 重楼本文对RAG、向量数据库和LLM搜索如何塑造人工智能驱动的商业智能未来进行探讨。 RAG通过集成知识检索提升LLM性能,解决其无法及时纳入最新或专有信息的问题,尤其在客户服务领域影响显著。 向量数据库则支持快速相似性搜索,理解查询语义。
6/6/2025 8:39:15 AM
李睿
结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践
一、引言:混合RAG技术的发展与挑战在人工智能领域,检索增强生成(RAG)技术正成为构建智能问答系统的核心方案。 传统RAG通过向量数据库存储文档嵌入并检索相关内容,结合大语言模型(LLM)生成回答,有效缓解了LLM的“幻觉”问题。 然而,单一的稠密向量检索(如基于Transformer的嵌入模型)在处理关键词匹配和多义词歧义时存在局限性,而稀疏向量检索(如BM25)虽擅长精确关键词匹配,却缺乏语义理解能力。
6/6/2025 3:11:00 AM
大模型之路
“一代更比一代强”:现代 RAG 架构的演进之路
基于 RAG(检索增强生成)的 AI 系统,过去是,现在仍然是企业利用大语言模型(LLM)的最有价值的应用之一。 我记得差不多两年前我写了第一篇关于 RAG 的文章,那时候这个术语还未被广泛采用。 我当时描述的是一个以最基础方式实现的 RAG 系统。
6/6/2025 1:15:00 AM
Baihai IDP
实用指南:构建基于RAG的聊天机器人
译者 | 布加迪审校 | 重楼“你能为我们开发一个聊天机器人吗? ” 如果你的IT团队还没有收到这个请求,相信我,很快就会收到。 随着大语言模型(LLM)的兴起,聊天机器人已成为新的必备功能——无论你是交付SaaS服务、管理内部工具,还是仅仅试图解读庞大的文档。
6/4/2025 8:21:28 AM
布加迪
一文让你搞懂什么是 RAG
鸡哥是一个优秀且苦逼的程序员,每天都被领导无情地摧残着,就在他感觉身体即将被掏空时,领导又让他充当交际花,利用美色从某个女老板手里拿到投资。 正所谓工欲善其事,必先利其器,领导给鸡哥一份文档,是从女老板秘书手里买来的,里面记录了女老板近一年的生活轨迹等,让鸡哥在脑海中构建女老板的画像。 没过多久,女老板要求在饭桌上洽谈合作的事情,那么鸡哥自然要打扮一番,可是该穿什么样的衣服呢?
6/4/2025 3:21:00 AM
古明地觉
RAG系列:解析优化 - 不同文件类型统一转换成Markdown
引言在 RAG 系统中,文件解析是构建知识库和实现高效信息检索的关键环节。 随着系统需要处理的文件类型日益增多(如PDF、Word、Excel、PPT、HTML等),如何高效解析并利用这些异构数据成为核心挑战。 由于每种文件类型的数据结构和内容(如PDF的复杂排版、Excel的表格结构、PPT的多媒体元素)都不一致,在实际的应用场景中,我们需要对不同文件类型实现不同的解析器,解析之后还需要根据不同文件的结构实现对应的文档分块方法。
6/3/2025 8:50:24 AM
燃哥讲AI
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
工具
华为
RAG
AI设计
大语言模型
搜索
字节跳动
具身智能
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
神器推荐
亚马逊
Copilot
特斯拉
应用
DeepMind