LLMs

从 “一刀切” 到 “精准筛”：DeepSieve 用四步流水线重构 RAG，告别检索噪声！

在大语言模型（LLMs）主导的AI时代，知识密集型任务始终面临一个核心矛盾：LLM擅长复杂推理，但受限于固定参数无法动态获取最新或领域专属知识；检索增强生成（RAG）虽能链接外部知识，却常因“一刀切”的检索逻辑陷入噪声冗余、推理浅薄的困境。来自罗格斯大学、西北大学与NEC实验室的团队提出的DeepSieve，创新性地将LLM作为“知识路由器”，通过多阶段信息筛选机制，为异构知识源与复杂查询的精准匹配提供了新解法。本文将带您深入拆解这一方案的设计思路与实验效果。

11/4/2025 9:31:03 AM

Goldma

Agentic AI：构建长期记忆

如果你用过大型语言模型（LLMs），你就会知道它们是无状态的。如果没用过，可以把它们想象成没有短期记忆的东西。举个例子，就像电影《记忆碎片》（Memento）里的主角，他总是需要靠便利贴上的信息来提醒自己发生了什么，拼凑出下一步该做什么。

10/15/2025 2:00:00 AM

AI研究生

长文本检索新突破！斯坦福RAPTOR：用递归树结构兼顾语义深度与细节，刷新多数据集SOTA

在大语言模型（LLMs）主导的AI时代，“检索增强”早已成为提升模型事实准确性、降低幻觉的核心技术。然而，当前主流的检索方法仍面临一个关键瓶颈：无论是传统的BM25、基于深度学习的DPR，还是新兴的LLM检索器，大多依赖“文本分块单一维度匹配”的模式，难以捕捉长文本（如学术论文、书籍章节）中的层次化语义结构——要么因只取片段丢失上下文，要么因过度抽象遗漏关键细节。斯坦福大学团队在2024年ICLR提出RAPTOR（Recursive Abstractive Processing for Tree-Organized Retrieval），用“递归树状检索”的新思路打破了这一困境。

9/15/2025 9:25:26 AM

Goldma

OpenAI最新研究揭秘大模型为什么会有幻觉！

引言：语言模型的“幻觉”难题在人工智能飞速发展的今天，大语言模型（LLMs）如ChatGPT、DeepSeek等已经成为我们日常生活与工作的得力助手。然而，这些模型有时会“信口开河”，生成看似合理却完全错误的回答，这种现象被学界称为“幻觉”（hallucination）。例如，当被问及“亚当·卡莱的生日是哪天？

9/10/2025 4:00:00 AM

机智流科技

DeepMind 推出 Crome:提升大型语言模型对人类反馈的对齐能力

在人工智能领域，奖励模型是对齐大型语言模型（LLMs）与人类反馈的关键组成部分，但现有模型面临着 “奖励黑客” 问题。这些模型往往关注表面的特征，例如回复的长度或格式，而不是识别真正的质量指标，如事实准确性和相关性。问题的根源在于，标准训练目标无法区分训练数据中存在的虚假关联和真实的因果驱动因素。

7/5/2025 7:46:41 AM

AI在线

IT技术人必知的八大专业AI模型

译者 | 涂承烨审校 | 重楼不到十年前，能与计算机进行有意义的对话的想法还只是科幻小说。但今天，数以百万计的人与AI助手聊天，根据文本描述创作令人惊叹的艺术作品，并每天使用这些AI工具/系统来理解图像和执行高级任务。这一进步由许多专业AI模型驱动，每个模型都有其独特的功能和应用。

6/4/2025 8:31:48 AM

涂承烨

Mistral Launches New Agents API: Empowering Developers to Build Intelligent AI Agents

Mistral recently released its new Agents API, a framework designed specifically for developers to simplify the creation of AI agents that can perform various tasks such as running Python code, generating images, and conducting retrieval-augmented generation (RAG).The introduction of this API aims to provide a unified environment for large language models (LLMs) to interact with multiple tools and data sources in a structured and persistent manner.The Agents API is built on top of Mistral's language model and integrates multiple built-in connectors. These connectors enable agents to run Python code in a controlled environment, generate images through dedicated models, access real-time web searches, and utilize user-provided document libraries. One highlight is its persistent memory feature, which allows agents to maintain context across multiple interactions, supporting coherent and stateful conversations..

5/28/2025 11:01:20 AM

AI在线

Mistral 推出全新 Agents API：助力开发者构建智能 AI 代理

Mistral 公司近日发布了其全新的 Agents API，这是一个专为开发者设计的框架，旨在简化 AI 代理的创建，代理可以执行多种任务，例如运行 Python 代码、生成图像以及进行检索增强生成（RAG）。这一 API 的推出，旨在为大型语言模型（LLMs）提供一个统一的环境，使其能够与多个工具和数据源以结构化且持久的方式进行交互。 Agents API 建立在 Mistral 的语言模型基础上，集成了多个内置连接器。

5/28/2025 10:01:01 AM

AI在线

知识图谱、大模型与幻觉：自然语言处理的视角

摘要大型语言模型（LLMs）已经彻底改变了基于自然语言处理（NLP）的应用，包括自动化文本生成、问答系统、聊天机器人等。然而，它们面临一个重大挑战：产生幻觉，即模型生成听起来合理但实际上错误的内容。这削弱了信任，并限制了LLMs在不同领域的适用性。

5/28/2025 1:50:00 AM

KGGPT

HippoRAG：基于海马体记忆索引理论的知识密集型任务新突破

在自然语言处理领域，大语言模型（LLMs）已经取得了令人瞩目的成就。然而，当面对知识密集型任务时，例如科学文献综述、法律案件简报或医疗诊断，这些模型往往显得力不从心。它们难以有效地整合新的或特定领域的知识，而现有的检索增强生成（RAG）方法也因无法满足复杂的跨段落或文档的知识整合需求而受到限制。

5/13/2025 1:00:00 AM

Goldma

谷歌DeepMind：大模型明知到最优解，但还是故意绕了一圈

现在的大模型（LLMs）已经非常智能。写文章、编代码、当医生、当老师，样样精通。于是乎，有人就想了:既然它们这么聪明，能不能让它们自己做决定，当个“智能体”呢?比如，在复杂的环境里自己探索、自己解决问题。

5/6/2025 11:00:51 AM

AI在线

LLMs 防御升级：借函数调用机制打造无缝防御层

大语言模型（LLMs）展现出了令人惊叹的能力，其中函数调用功能更是让其如虎添翼。然而，这一强大功能也伴随着风险，恶意用户可能利用巧妙设计的提示进行隐秘操纵。本文将深入探讨如何将函数调用机制转化为一道无缝的防御层，有效检测和防范这些潜在威胁。

4/29/2025 8:18:48 AM

大模型之路

开发者注意!AI 推荐软件包五分之一是假的，“Slopsquatting”威胁来袭

网络安全研究人员发出警告，一种名为“Slopsquatting”的新型软件供应链攻击正浮出水面。该攻击利用生成式 AI（如 LLMs）在代码编写时可能产生的“包幻觉”——即推荐不存在的软件包名称——的漏洞。攻击者可以抢先注册这些虚构的名称，并植入恶意代码。

4/27/2025 11:00:49 AM

AI在线

MCP vs Function Calling，该如何选？

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景落地 - 如何为 LLM 集成选择合适的策略？众所周知，大型语言模型（LLMs）已经彻底改变了企业自动化、客户交互以及决策制定的方式，其强大的语言生成能力为各行业带来了前所未有的机遇。然而，要充分发挥 LLMs 的潜力，仅仅部署一个预训练模型是远远不够的。

4/22/2025 9:17:41 AM

Luga Lee

小型推理模型的崛起：紧凑型人工智能能否匹敌GPT级推理能力？

译者 | 涂承烨审校 | 重楼近年来，人工智能领域一直沉迷于大型语言模型（LLMs）的成功。这些模型最初设计用于自然语言处理，如今已演变为强大的推理工具，能够通过类人类的逐步思考过程解决复杂问题。然而，尽管LLMs具备卓越的推理能力，它们仍存在显著缺陷，包括高昂的计算成本和缓慢的部署速度，这使得它们在移动设备或边缘计算等资源受限的实际场景中难以应用。

4/10/2025 8:23:11 AM

涂承烨

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

视觉Token可以与LLMs词表无缝对齐了！ V²Flow，基于LLMs可以实现高保真自回归图像生成。随着ChatGPT掀起自回归建模革命后，近年来研究者们开始探索自回归建模在视觉生成任务的应用，将视觉和文本数据统一在“next-token prediction”框架下。

4/3/2025 10:17:23 AM

LLM中的分块技术：原理、应用与展望

在大语言模型（LLM）飞速发展的当下，分块技术（Chunking）（RAG 中的分块策略：从基础到前沿的全面剖析）作为提升模型性能的关键手段，受到了广泛关注。它在优化信息处理、提高检索效率、增强模型理解能力等方面发挥着不可或缺的作用。深入探究 LLMs 中的分块技术，对于推动自然语言处理（NLP）领域的发展具有重要意义。

3/27/2025 2:50:00 AM

大模型之路

关于LLMs 复读机问题

今天来看一个关于LLMs复读机问题的详细介绍，主要从定义、出现复读机问题的原因和怎么解决三个方面来介绍：1、什么是 LLMs 复读机问题？ LLMs 复读机问题：字符级别重复：指大模型针对一个字或一个词重复不断生成。例如在电商翻译场景上，会出现“steckdose steckdose steckdose steckdose steckdose steckdose steckdose steckdose...”；语句级别重复：大模型针对一句话重复不断生成。

3/24/2025 11:01:41 AM

Goldma

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型特斯拉场景深度学习亚马逊架构 Transformer MCP Copilot 编程视觉

LLMs

从 “一刀切” 到 “精准筛”：DeepSieve 用四步流水线重构 RAG，告别检索噪声！

Agentic AI：构建长期记忆

长文本检索新突破！斯坦福RAPTOR：用递归树结构兼顾语义深度与细节，刷新多数据集SOTA

OpenAI最新研究揭秘大模型为什么会有幻觉！

DeepMind 推出 Crome:提升大型语言模型对人类反馈的对齐能力

IT技术人必知的八大专业AI模型

Mistral Launches New Agents API: Empowering Developers to Build Intelligent AI Agents

​Mistral 推出全新 Agents API：助力开发者构建智能 AI 代理

知识图谱、大模型与幻觉：自然语言处理的视角

HippoRAG：基于海马体记忆索引理论的知识密集型任务新突破

谷歌DeepMind：大模型明知到最优解，但还是故意绕了一圈

LLMs 防御升级：借函数调用机制打造无缝防御层

开发者注意!AI 推荐软件包五分之一是假的，“Slopsquatting”威胁来袭

MCP vs Function Calling，该如何选？

小型推理模型的崛起：紧凑型人工智能能否匹敌GPT级推理能力？

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

LLM中的分块技术：原理、应用与展望

关于LLMs 复读机问题

Mistral 推出全新 Agents API：助力开发者构建智能 AI 代理