系统
RAG系统文本分块实用指南:借助ChunckerFlow突破分块困境
检索增强生成(RAG)已成为现代AI应用的核心,从问答系统到智能文档检索均有广泛应用。 但一个常被忽视的关键问题正悄然破坏RAG性能:文本分块质量低下。 分块决策会贯穿整个RAG流水线——分块过大导致检索精度下降,过小则丢失关键上下文,边界不当则割裂完整语义。
11/4/2025 4:15:00 AM
大模型之路
构建企业级多智能体系统:精通LangChain中间件框架与深度智能体架构
做AI智能体开发久了,每个开发者都会遇到一个转折点:一开始,你搭建的简单智能体能调用工具、处理响应,循环往复,应对几个查询时顺风顺水。 可一旦面向真实业务场景,问题就会集中爆发——要分析一整年的数据该怎么办? 合规要求严禁特定查询通过该怎么拦截?
11/4/2025 1:55:00 AM
大模型之路
71.2%的惊人解决率,伦敦大学开源顶级AI代码修复智能体系统
伦敦大学,瑞典皇家理工学院等发布了一个名为Prometheus的AI系统。 它通过将代码库变成一张巨大的知识图谱,解决了跨越9种编程语言的真实GitHub问题。 它不再局限于特定语言或预设的测试环境,而是像一个经验丰富的软件工程师团队,直接面对真实、复杂且多语言的开源项目。
11/3/2025 5:25:38 PM
多智能体系统大多只是表演!做了25+个Agent的开发老鸟警告:成本爆炸,延迟增加,Agent不是越多越好!
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)今年以来,多智能体(Multi-Agents)频频成为AI领域的热点话题。 但现在,越来越多开发者发现,“多智能体协作”的酷炫演示,很多只是AI 的一场秀,并非切实可靠。 这两天,Reddit、X平台上关于多智能体的讨论再次甚嚣尘上。
10/28/2025 4:52:05 PM
听雨
为什么你的 RAG 系统在复杂问题上失灵?
本文通过 Retrieval and Structuring (RAS) 范式理解精准推理与领域专长,并附实现示例Large Language Models(LLM,大型语言模型)在文本生成和复杂推理方面展现了卓越能力。 但它们并不完美。 当 LLM 用于真实世界场景时,会面临多种挑战:有时会出现“幻觉”,有时会给出过时的答案。
10/28/2025 1:10:00 AM
AI研究生
系统提示词稳住AI
为什么你问同一个问题,AI 每次回答的风格都不一样? 很大概率是因为没有写“系统提示词”。 • 它是对 AI 的行为规则与角色定位的隐藏指令。
10/27/2025 2:25:00 AM
红绿灯灯灯灯
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
大模型在强化学习过程中,终于知道什么经验更宝贵了! 来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队,最近提出了一套经验管理和学习框架ExGRPO——通过科学地识别、存储、筛选和学习有价值的经验,让大模型在优化推理能力的道路上,走得更稳、更快、更远。 实验结果显示,与传统的在线策略RLVR(基于可验证奖励的强化学习)方法相比,ExGRPO在不同基准上均带来了一定程度的性能提升。
10/23/2025 2:05:35 PM
长生不老成真?哈佛AI数周破解「衰老密码」,人类寿命或迎重写
几千年来,人类都在追问:如何才能长生不老? 从炼丹术到现代实验室,答案始终模糊。 即便有了基因测序和大数据,研究者往往也要花上数年,才能在庞杂信号里筛出一丝线索。
10/22/2025 2:00:00 AM
新智元
lya震撼发声!OpenAI前主管亲证:AGI已觉醒,人类还在装睡
「这真正史上最棒的一天」! Ilya的一句话,又引爆了全网。 图片一时间,网友们纷纷猜测,难道AGI真的在内部实现了吗?
10/15/2025 9:36:52 AM
新智元
Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞
在 AI 辅助编程领域,Anthropic 推出的 Claude Code 命令行工具已成为开发者常用的助手。 它允许从终端直接调用 Claude Sonnet 等模型,处理脚本编写、代码调试和系统命令执行等任务。 然而,一项近期研究指出,该工具在连接 Model Context Protocol (MCP) 服务器时,可能存在 Tool Invocation Prompt (TIP) 被劫持的风险,导致远程代码执行 (RCE),且无需用户额外交互。
9/23/2025 9:09:49 AM
比思维链准43%!逻辑脑+大模型直觉,推理可靠性大幅提升
大语言模型(LLMs)已在文本生成、代码编写乃至多模态任务中展现出惊人的能力,但在涉及严谨逻辑与物理的空间推理任务上,它们仍显得力不从心。 比如,当模型需要理解多个物体之间的相对位置关系,并在复杂语境下进行多步骤推理时,往往容易出现「逻辑断裂」:可能在中间步骤中虚构错误事实,或偏离目标,最终导致答案不可靠。 这一问题在空间推理任务中尤为突出。
9/23/2025 9:06:00 AM
AI 正在让初级开发人员消失
——两年招人带人后的冷水与警钟你不会在技术大会上听到这一幕,更不会在 LinkedIn 的“AI 赋能人类创造力”帖里读到它。 可在招募与培养工程师十余年、近两年持续招聘与导师制实践之后,几乎笃定:传统意义上的“初级开发者”岗位,正被系统性地撤掉。 这并不意味着编程工作会在一夜之间蒸发。
9/15/2025 2:22:00 AM
dev
DeepDiver-V2来了,华为最新开源原生多智能体系统,“团战”深度研究效果惊人
让智能体组团搞深度研究,效果爆表! 华为最新发布DeepDiver-V2原生多智能体系统。 采用了“团队作战”模式:一个Planner负责任务分解,任务分发,进度审视和成果验收,多个专业Executor并行处理子任务,通过共享文件系统高效交换信息。
9/12/2025 9:01:00 AM
K8s中明明配置了HPA,但是没扩容
Kubernetes 的 Horizontal Pod Autoscaler(HPA)是一种根据观察到的 CPU 利用率或其他自定义指标自动扩展 Pod 副本数的控制器。 它在业务繁忙的时候可以有效的对 Pod 进行横线扩展,但是最近发现明明使用率已经超过了定义的目标值,但是为何没有扩容呢? 9906771bea31d64adb2a89a2f2b88207 MD5为了搞清楚原由,我们从源码层面来找找原因。
9/5/2025 1:22:00 AM
系统梳理 RAG 系统的 21 种分块策略
检索增强生成(RAG)是许多 AI 工程师又爱又恨的技术(包括我)。 没错,因为从理论上看,它简单极了:“从你的定制数据中检索正确的上下文,然后让大语言模型基于此生成回答”。 但在实践中,你不得不面对海量杂乱无章的数据 —— 这些数据以你见过的最混乱随机的格式存储,接着就是数日绞尽脑汁的试错:调整文本块(tweaking chunks)切换嵌入模型(switching embedding models)替换检索器(swapping out retrievers)微调排序器(fine-tuning rankers)重写提示词(rewriting prompts)而模型依然回复:“我找不到足够的信息来回答你的问题”。
9/3/2025 4:00:45 AM
Baihai IDP
构建检索增强生成(RAG):从基础版到多智能体系统的演进之路
在企业人工智能领域,检索增强生成(RAG)无疑是一个令人向往的目标。 只需让大型语言模型(LLM)接入企业私有数据,就能瞬间拥有一位精通业务的“天才专家”。 然而,残酷的现实是,众多RAG项目纷纷折戟沉沙。
9/1/2025 8:53:57 AM
大模型之路
AI 智能体:零基础入门完全指南
从 Siri 提醒你观看球赛,到 Alexa 调节家中灯光,再到客服机器人即时解答疑问,AI 智能体已悄然成为我们生活中的隐形助手。 这些能感知环境、自主决策并采取行动的数字工具,其实并非遥不可及的高科技。 本文将带你快速掌握 AI 智能体的核心知识,并用开源工具从零构建一个实用的智能体,无需专业背景,人人都能上手。
8/27/2025 3:22:00 AM
大模型之路
RAG 文档解析工具选型指南
对于 RAG 系统而言,从文档中提取信息是一个不可避免的情况。 最终系统输出的质量很大程度上取决于从源内容中提取信息的效果。 过去,我曾从不同角度探讨过文档解析问题[1]。
8/26/2025 3:32:33 PM
Baihai IDP
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉