AI在线 AI在线

系统

多智能体系统大多只是表演!做了25+个Agent的开发老鸟警告:成本爆炸,延迟增加,Agent不是越多越好!

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)今年以来,多智能体(Multi-Agents)频频成为AI领域的热点话题。 但现在,越来越多开发者发现,“多智能体协作”的酷炫演示,很多只是AI 的一场秀,并非切实可靠。 这两天,Reddit、X平台上关于多智能体的讨论再次甚嚣尘上。
10/28/2025 4:52:05 PM
听雨

为什么你的 RAG 系统在复杂问题上失灵?

本文通过 Retrieval and Structuring (RAS) 范式理解精准推理与领域专长,并附实现示例Large Language Models(LLM,大型语言模型)在文本生成和复杂推理方面展现了卓越能力。 但它们并不完美。 当 LLM 用于真实世界场景时,会面临多种挑战:有时会出现“幻觉”,有时会给出过时的答案。
10/28/2025 1:10:00 AM
AI研究生

系统提示词稳住AI

为什么你问同一个问题,AI 每次回答的风格都不一样? 很大概率是因为没有写“系统提示词”。 • 它是对 AI 的行为规则与角色定位的隐藏指令。
10/27/2025 2:25:00 AM
红绿灯灯灯灯

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

大模型在强化学习过程中,终于知道什么经验更宝贵了! 来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队,最近提出了一套经验管理和学习框架ExGRPO——通过科学地识别、存储、筛选和学习有价值的经验,让大模型在优化推理能力的道路上,走得更稳、更快、更远。 实验结果显示,与传统的在线策略RLVR(基于可验证奖励的强化学习)方法相比,ExGRPO在不同基准上均带来了一定程度的性能提升。
10/23/2025 2:05:35 PM

长生不老成真?哈佛AI数周破解「衰老密码」,人类寿命或迎重写

几千年来,人类都在追问:如何才能长生不老? 从炼丹术到现代实验室,答案始终模糊。 即便有了基因测序和大数据,研究者往往也要花上数年,才能在庞杂信号里筛出一丝线索。
10/22/2025 2:00:00 AM
新智元

lya震撼发声!OpenAI前主管亲证:AGI已觉醒,人类还在装睡

「这真正史上最棒的一天」! Ilya的一句话,又引爆了全网。 图片一时间,网友们纷纷猜测,难道AGI真的在内部实现了吗?
10/15/2025 9:36:52 AM
新智元

Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

在 AI 辅助编程领域,Anthropic 推出的 Claude Code 命令行工具已成为开发者常用的助手。 它允许从终端直接调用 Claude Sonnet 等模型,处理脚本编写、代码调试和系统命令执行等任务。 然而,一项近期研究指出,该工具在连接 Model Context Protocol (MCP) 服务器时,可能存在 Tool Invocation Prompt (TIP) 被劫持的风险,导致远程代码执行 (RCE),且无需用户额外交互。
9/23/2025 9:09:49 AM

比思维链准43%!逻辑脑+大模型直觉,推理可靠性大幅提升

大语言模型(LLMs)已在文本生成、代码编写乃至多模态任务中展现出惊人的能力,但在涉及严谨逻辑与物理的空间推理任务上,它们仍显得力不从心。 比如,当模型需要理解多个物体之间的相对位置关系,并在复杂语境下进行多步骤推理时,往往容易出现「逻辑断裂」:可能在中间步骤中虚构错误事实,或偏离目标,最终导致答案不可靠。 这一问题在空间推理任务中尤为突出。
9/23/2025 9:06:00 AM

AI 正在让初级开发人员消失

——两年招人带人后的冷水与警钟你不会在技术大会上听到这一幕,更不会在 LinkedIn 的“AI 赋能人类创造力”帖里读到它。 可在招募与培养工程师十余年、近两年持续招聘与导师制实践之后,几乎笃定:传统意义上的“初级开发者”岗位,正被系统性地撤掉。 这并不意味着编程工作会在一夜之间蒸发。
9/15/2025 2:22:00 AM
dev

DeepDiver-V2来了,华为最新开源原生多智能体系统,“团战”深度研究效果惊人

让智能体组团搞深度研究,效果爆表! 华为最新发布DeepDiver-V2原生多智能体系统。 采用了“团队作战”模式:一个Planner负责任务分解,任务分发,进度审视和成果验收,多个专业Executor并行处理子任务,通过共享文件系统高效交换信息。
9/12/2025 9:01:00 AM

K8s中明明配置了HPA,但是没扩容

Kubernetes 的 Horizontal Pod Autoscaler(HPA)是一种根据观察到的 CPU 利用率或其他自定义指标自动扩展 Pod 副本数的控制器。 它在业务繁忙的时候可以有效的对 Pod 进行横线扩展,但是最近发现明明使用率已经超过了定义的目标值,但是为何没有扩容呢? 9906771bea31d64adb2a89a2f2b88207 MD5为了搞清楚原由,我们从源码层面来找找原因。
9/5/2025 1:22:00 AM

系统梳理 RAG 系统的 21 种分块策略

检索增强生成(RAG)是许多 AI 工程师又爱又恨的技术(包括我)。 没错,因为从理论上看,它简单极了:“从你的定制数据中检索正确的上下文,然后让大语言模型基于此生成回答”。 但在实践中,你不得不面对海量杂乱无章的数据 —— 这些数据以你见过的最混乱随机的格式存储,接着就是数日绞尽脑汁的试错:调整文本块(tweaking chunks)切换嵌入模型(switching embedding models)替换检索器(swapping out retrievers)微调排序器(fine-tuning rankers)重写提示词(rewriting prompts)而模型依然回复:“我找不到足够的信息来回答你的问题”。
9/3/2025 4:00:45 AM
Baihai IDP

构建检索增强生成(RAG):从基础版到多智能体系统的演进之路

在企业人工智能领域,检索增强生成(RAG)无疑是一个令人向往的目标。 只需让大型语言模型(LLM)接入企业私有数据,就能瞬间拥有一位精通业务的“天才专家”。 然而,残酷的现实是,众多RAG项目纷纷折戟沉沙。
9/1/2025 8:53:57 AM
大模型之路

AI 智能体:零基础入门完全指南

从 Siri 提醒你观看球赛,到 Alexa 调节家中灯光,再到客服机器人即时解答疑问,AI 智能体已悄然成为我们生活中的隐形助手。 这些能感知环境、自主决策并采取行动的数字工具,其实并非遥不可及的高科技。 本文将带你快速掌握 AI 智能体的核心知识,并用开源工具从零构建一个实用的智能体,无需专业背景,人人都能上手。
8/27/2025 3:22:00 AM
大模型之路

RAG 文档解析工具选型指南

对于 RAG 系统而言,从文档中提取信息是一个不可避免的情况。 最终系统输出的质量很大程度上取决于从源内容中提取信息的效果。 过去,我曾从不同角度探讨过文档解析问题[1]。
8/26/2025 3:32:33 PM
Baihai IDP

全网首发:安全性问题,使MCP成为AI应用的双刃剑,如何化险为夷呢?

人工智能正在重塑现代工作流程的核心架构,但这种强大能力也伴随着重大责任。 当大模型通过MCP与企业实时数据、执行工具进行交互时,安全性必须成为系统设计的基石。 MCP 可视为连接人工智能与组织敏感数据、API 和关键系统的桥梁——这座桥梁若存在任何漏洞,都可能导致数据泄露、业务中断甚至企业级灾难。
8/26/2025 9:30:52 AM
曹洪伟

多智能体系统不是银弹

一、背景介绍可以了解到多智能体系统,正是通过独特的架构设计,让 AI 突破单智能体的能力边界,实现更复杂的任务协作。 多智能体组成虚拟团队,模拟人类专业协作模式,以解决超越单智能体能力边界的复杂问题。 image.png在众多多智能体框架中,LangGraph 的多智能体架构设计极具代表性,堪称实践典范。
8/26/2025 9:14:26 AM
架构精进之路

RAG(检索增强)当前主要的问题以及评估方法

RAG(检索增强生成)虽然极大地提升了大型模型(LLM)回答问题的准确性和时效性,但在实际落地过程中,它远非一个完美的解决方案。 下面,我们将详细梳理当前 RAG 系统遇到的主要问题,以及业界为解决这些问题而探索出的先进解决实践和涌现出的优秀开源产品。 一、 当前 RAG 系统面临的核心问题RAG 的问题可以归结为一句话:“垃圾进,垃圾出”(Garbage In, Garbage Out)。
8/26/2025 1:45:00 AM
朱洁