AI在线 AI在线

理论

RAG系列:问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中,知识库不会只有单一领域的知识,可能会存在多个领域的知识,如果对用户问题不提前做领域区分,在对基于距离的向量数据库进行检索时,可能会检索出很多与用户问题不属于同一个领域的文档片段,这样的上下文会存在较多的噪音或者不准确的信息,从而影响最终的回答效果。 另一方面知识库中涵盖的知识表达形式也是有限的,但用户的提问方式却是千人千面的,用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异,这就可能导致用户问题和知识库之间不能很好匹配,从而降低检索效果。 为了解决此问题,我们可以对用户问题进行查询增强,比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文,通过这几个查询增强方式来更好地匹配知识库中的文档片段,提升检索效果和回答效果。
5/27/2025 12:40:00 AM
燃哥讲AI

社区造数服务接入MCP

一、背景今年 MCP 的概念非常火,市面上也涌现出了一大批 MCP 相关工具。 作为技术一线者,都会按捺不住地去实操一下,很早的时候就有个设想,如果把我们的测试工具都改造为符合 MCP 服务协议标准,然后全部接入 AI Agent,打造一个集万千工具于一体的智能管家来帮助我们提效,是不是一个很完美的设想。 很多宏伟或者天马行空的想法想要真正的落地,必然需要不断向下,拆解成可落地的任务模块,这里我们先从造数开始。
5/27/2025 12:15:07 AM
阿凯

基于图的 RAG 方法总结(GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG)

在自然语言处理领域,检索增强生成(RAG)技术通过结合外部知识库与语言模型,显著提升了模型在知识密集型任务中的表现。 近年来,基于图结构的 RAG 方法成为研究热点,通过引入知识图谱的实体关系建模能力,有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。 本文详细分析五种代表性方法:GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ,从实现细节、优缺点及适用场景展开对比。
5/27/2025 12:15:00 AM
Goldma

国际劳工组织报告:全球25%就业岗位或受生成式人工智能影响

近日,国际劳工组织(ILO)与波兰国家研究院发布联合研究报告《生成式人工智能与就业:全球职业受影响程度精编指数》,对生成式人工智能如何重塑劳动世界进行了迄今最详尽的评估。 报告指出,全球 25% 的就业岗位可能受到生成式人工智能影响,高收入国家这一比例更高,达 34%。 该指数通过整合近3 .
5/27/2025 12:10:00 AM

高手做决策的认知公式:贝叶斯定理及其三重境界

“顶级的成功不是因为他们是谁,而是因为他们以什么方式思考,以什么逻辑行动。 ”爱因斯坦有个著名的问题:“你所经历过的最大的挑战是什么? ”埃隆·马斯克对此足足思考了30秒,给出了一个非常精彩的回答:“确保你有一个可纠错的反馈闭环(making sure you have a corrective feedback loop)”。
5/27/2025 12:00:25 AM

智能体常用策略FunctionCalling和ReAct有什么区别?

Dify 内置了两种 Agent 策略:Function Calling 和 ReAct,但二者有什么区别呢? 在使用时又该如何选择呢? 接下来我们一起来看。
5/27/2025 12:00:00 AM
磊哥

要有野心!创始人揭秘Claude4诞生:有点玄学,很快接入测谎仪!26年出现单人独角兽!做AI像登上太空飞船,MCP快行业标准了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周五 Claude 4 的发布会上,Anthropic 的 CEO Dario Amodei 与Instagram联合创始人、Anthropic 首席产品官 Mike Krieger 在 KeyNote 最后进行了一场围炉对话。 两个人都是创业公司的创始人,又都参与了同一款 AI 产品的打磨与迭代。 对于AI 编程,Anthropic 的产品路线图将是什么样子?
5/26/2025 6:40:00 PM
云昭

字节跳动 AdaCoT:基于强化学习的自适应推理触发方法(万字)

大家好,我是肆〇柒。 在当下,大型语言模型(LLM)凭借其强大的语言理解和生成能力,在众多领域展现出了巨大的潜力。 然而,尽管 LLM 在处理常规任务时表现出色,但在面对复杂推理任务时,却常常暴露出明显的短板。
5/26/2025 5:16:51 PM
肆零柒

字节开源Dolphin,高精度文档图像解析大模型,创新先分析后解析新范式

在数字时代,从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息,是人工智能领域长期面临的挑战。 无论是复杂的表格、交织的文本段落,还是难以识别的数学公式,都对文档解析技术提出了严苛要求。 传统的解决方案往往依赖于多个专业模型的串联,不仅集成成本高昂,还容易在处理过程中累积误差 。
5/26/2025 4:46:38 PM
贝塔街的万事屋

我们成了“真·搬砖工”!亚马逊“编码文化”巨变开始了,程序员正在“仓库工人化”:快乐消失了,为保饭碗纷纷加入正义联盟

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)AI 的到来,也许会让程序员告别重复劳动,走向创意巅峰。 但在亚马逊,代码的世界,似乎也正步入流水线时代。 一些开发者却感受到另一种“穿越回18世纪机器工厂”般的现实:节奏更快、思考更少、压力更重。
5/26/2025 1:50:15 PM
云昭

金蝶范式:从工具到生态,解码企业管理 AI 新时代

如今,大模型技术已经成为企业数智化的必修课。 然而,如何用上大模型,怎么用好大模型,却让很多企业陷入两难境地。 高昂的落地成本、复杂的场景适配需求,以及盲目跟风导致的投入产出失衡,企业最终陷入了“为 AI 而 AI”的困境。
5/26/2025 11:06:01 AM
鸢玮

谈谈如何利用代理系统构建自演化知识图谱

如今的数据领导者如同走钢丝。 一方面,他们面临着现代化、创新和跟上未来发展的压力。 想想看,技术的发展速度远超我们的预期。
5/26/2025 10:11:32 AM
晓晓

Microsoft 推出 Magentic-UI:网页多智能体,革新式人机协作

大家好,我是肆〇柒。 在当下,现代生产力与网页活动深度交织。 从信息检索、表单填写,到精准导航各类仪表盘,网页任务贯穿工作流程始终。
5/26/2025 10:03:42 AM
肆零柒

RAG系列:系统评估 - 基于LLM-as-judge实现评估系统

引言在 系统评估 - 五个主流评估指标详解 中,我们了解了 RAG 系统评估的 5 个主流指标,它们分别是 上下文召回率(Context Recall)、上下文相关性(Context Relevance)、答案忠实度(Faithfulness)、答案相关性(Answer Relevance)以及答案正确性(Answer Correctness),也简单了解了一些 RAG 系统的评估方法以及主流的评估系统。 今天我们将基于 LLM-as-judge 自己实现一套 RAG 系统评估系统,然后通过该评估系统评估我们在 基于 DeepSeek Chroma LangChain 开发一个简单 RAG 系统 中搭建好的基础版 RAG 系统,以基础版 RAG 系统这 5 个评估指标值作为基准,通过学习不同的优化方法来提升这 5 个指标。 因为是通过 LLM 来评估,所以评估 LLM 的能力越强,理论上评估就会越准确,因此在实际的业务场景中,尽可能选用能力更强的 LLM。
5/26/2025 9:57:46 AM
燃哥讲AI

多模态混合检索与多智能体RAG的破局之道

AI的感知困境:一只眼睛的世界我们习惯了AI能够处理文字、分析数据,但在处理复杂信息时,传统AI面临着三大感知困境:文字与图像割裂好比戴着眼罩工作的设计师,AI只能读懂文字,却看不懂图表中的趋势线、饼图中的占比关系。 OCR技术让AI能提取图像中的文字,却无法理解一张财务图表所传达的"销售额正在快速增长"这类视觉信息。 这就像让一个人只通过摸索来理解一幅画,注定失之偏颇。
5/26/2025 9:49:59 AM
大数据AI智能圈

生成式人工智能永远不会取代人类的创造力

我记得第一次听说ChatGPT的时候;我错误地以为这只是又一股潮流,会随着时间的流逝而消逝。 也许我太天真了。 计算机怎么可能取代真正的创造力呢?
5/26/2025 9:47:34 AM
晓晓

硅谷顶级AI天才成「团宠」:布林请吃饭,奥特曼约打牌

硅谷巨头们,正掀起一场前所未有的人才争夺战。 如今,OpenAI、谷歌、xAI等公司不惜重金,争夺那些能够改变游戏规则的「超级明星研究员」。 路透爆料称,顶级AI研究人员的年薪已突破天际。
5/26/2025 9:46:08 AM

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型,如今堪称AI界的「吞金巨兽」。 从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。 以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!
5/26/2025 9:41:26 AM