架构

循环语言模型：提升参数效率的潜在推理新范式

现代大型语言模型(LLM)主要通过显式文本生成方式进行"思考"，例如思维链(Chain-of-Thought, CoT)，这种方法将推理延迟到训练后阶段，未能充分利用预训练数据。本文介绍了一种名为Ouro的开源预训练循环语言模型(LoopLM)家族，其命名灵感来自递归的衔尾蛇(Ouroboros)，通过三种关键创新将推理能力直接构建到预训练阶段：(1)潜在空间中的迭代计算，(2)用于学习深度分配的熵正则化目标函数，以及(3)扩展到7.7万亿token的训练规模。核心创新与技术亮点Ouro模型展现了卓越的参数效率，其1.4B和2.6B参数规模的模型性能可以匹配甚至超越12B参数的SOTA模型。

11/4/2025 1:43:00 AM

可可

LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

LangChain V1.0 简介终于，万众瞩目的 LangChain V1.0 版本正式发布了！那对于最新的 V1.0 版本而言，其最显著的代码层面变化集中在 create_agent() 方法。如果你之前没有用过旧版本的LangChain，那么以下关于更新内容的介绍可以跳过不看。

10/29/2025 4:22:00 AM

剑锋777

长上下文窗口、Agent崛起，RAG已死？

在技术飞速更新迭代的今天，每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散，如今矛头又直指 RAG。向量数据库 Chroma 创始人兼 CEO Jeff Huber 在播客与访谈中抛出「RAG 已死，上下文工程当立」的表述，主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。

10/20/2025 9:06:00 AM

NeurIPS 25 | 中大&UC Merced等开源RAPID Hand，重新定义多指灵巧手数据采集

在最近的一篇 NeurIPS 25 中稿论文中，来自中山大学、加州大学 Merced 分校、中科院自动化研究所、诚橙动力的研究者联合提出了一个全新开源的高自由度灵巧手平台 — RAPID Hand (Robust, Affordable, Perception-Integrated, Dexterous Hand)。论文标题：RAPID Hand: A Robust, Affordable, Perception-Integrated, Dexterous Manipulation Platform for Generalist Robot Autonomy论文地址：：地址：。无论是日常的家庭整理、物品归置，还是辅助类服务任务，若缺乏灵巧的操作能力，机器人便难以真正完成复杂交互。

10/15/2025 8:55:43 AM

谷歌揭秘：Multi-Agent 推理时扩展才是未来

这里是一个专注于前沿AI和智能体的频道~谷歌 DeepMind 和 MIT 联合发了一篇论文，名叫 TUMIX（Tool-Use Mixture）。大概就是说，Multi-Agent 才是 test-time- scaling的终极打开方式，可以以一半的成本，在HLE上，准确率从 21.6% 飙升到 34.1%，超越 Gemini-2.5-Pro Deep Research。除此之外，他们还做了一个彩蛋，让Agent设计Agent，效果比人工设计的更牛~图片一个反常识Agent多样性疯狂采样目前主流的推理时扩展方法是什么？

10/15/2025 2:11:00 AM

猕猴桃

拒绝小扎15亿美元offer的大佬，还是加入Meta了

那个拒绝了小扎15亿美元薪酬包的机器学习大神，还是加入Meta了。 OpenAI前CTO Mira Murati创业公司Thinking Machines Lab证实，联创、首席架构师Andrew Tulloch已经离职去了Meta。按照公司发言人的说法，Tulloch离职的理由是“出于个人原因决定走一条不同的道路”，其本人则未给出回应。

10/13/2025 9:00:00 AM

苹果掀桌！扔掉AlphaFold核心模块，开启蛋白折叠「生成式AI」时代

蛋白质折叠，一直是计算生物学中的一个核心难题，并对药物研发等领域产生着深远影响。若把蛋白质折叠类比为视觉领域的生成模型，氨基酸序列相当于「提示词」，模型输出则是原子的三维坐标。受此思维启发，研究人员构建了一个基于标准Transformer模块与自适应层的通用且强大的架构——SimpleFold。

9/28/2025 9:12:00 AM

万字长文详解腾讯优图RAG技术的架构设计与创新实践

导语在信息爆炸的时代，如何从海量数据中精准获取知识并生成智能回答，已成为AI落地的核心挑战。腾讯优图实验室凭借前沿的RAG体系，突破传统检索与生成的局限，打造了一套覆盖语义检索、结构化表检索、图检索的全栈解决方案。本文将为你深度解析优图实验室RAG技术的架构设计与创新实践：从多阶段训练的2B级Embedding模型、Reranker分层蒸馏，到结构化表的智能解析与查询，再到自研GraphRAG框架在构图效率与复杂推理上的突破。

9/12/2025 3:50:54 PM

优图RAG技术

生产级AI智能体架构指南：从Demo惊艳到落地可靠

在AI领域，单提示词演示（Single-prompt demos）总是令人眼前一亮，但真正的生产落地却充满挑战。坦白而言，即便最出色的大型语言模型（LLM）能在演示中大放异彩，现实世界对AI系统的要求远比这更高——用户需要足以支撑业务决策的精准结果，管理者要求清晰可追溯的审计记录，运维团队则需要能有效控制成本与延迟的调节手段。问题的核心在于那种“大包大揽”的单提示词模式：它就像一个黑箱，将规划、执行与质量控制揉合成一团模糊的整体，不仅脆弱易故障、难以审计，更无法突破概念验证（PoC）阶段实现规模化应用。

9/9/2025 2:11:00 AM

大模型之路

准确率达90%，用户却疯狂弃用，一遇问题转人工，AI客服竟比电话语音还糟！大牛发文痛斥：能力≠采纳!四层架构让Agent无AI感

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上周，我和一位最近刚上线 AI Agent 的 PM 聊天。指标看上去非常亮眼：89% 的准确率、毫秒级的响应、用户调研反馈积极。但实际情况却很打脸，上线没多久，用户纷纷弃用了。

9/5/2025 1:06:00 PM

云昭

理论到实战，高可用架构踩坑说明书

在构建高可用系统时，开发者常常面临应用、数据库、缓存、消息队列等多维度的挑战。本文结合京东真实技术场景，系统梳理高可用架构实践中常见的技术陷阱与解决方案，深入剖析每个技术组件的可用性保障要点。旨在为工程师提供一套踩坑说明书，帮助团队在系统设计阶段规避潜在风险，提升线上系统的稳定性和容错能力。

9/5/2025 1:25:00 AM

揭秘Mem0的卓越架构：打造真正拥有记忆的AI系统

在人工智能应用迅猛发展的当下，聊天机器人已成为企业服务用户、个人提升效率的重要工具。然而，许多开发者都遭遇过这样的尴尬场景：花费数周精心打造的聊天机器人在演示时表现出色，能流利回答问题、提供帮助，看似智能十足。但当用户次日再次访问时，机器人却仿佛患上了“失忆症”，只会机械地问“今天我能为您提供什么帮助？

8/28/2025 7:52:17 AM

大模型之路

何明路

资讯热榜

LangChain V1.0 深度解析：手把手带你跑通全新智能体架构 DeepSeek-OCR：OCR 的新突破 Soul App开源播客语音合成模型，可流畅自然多轮语音对话，支持川粤豫等多方言与副语言风格微软与OpenAI重塑联盟：2500亿美元Azure订单背后，OpenAI获“云自由”！最具争议性研究：大模型中间层输出可 100% 反推原始输入 OpenAI推出两款全新的开源安全推理模型 Cursor发布首个编程大模型！代码生成250tokens/秒，强化学习+MoE架构如何理解：高效的异构算力调度是业界目前面临的一大难题？

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能 AI新词用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果腾讯 Claude Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人研究 AI视频大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer 预测 AI模型 MCP 伟达亚马逊

架构

循环语言模型：提升参数效率的潜在推理新范式

LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

长上下文窗口、Agent崛起，RAG已死？

NeurIPS 25 | 中大&UC Merced等开源RAPID Hand，重新定义多指灵巧手数据采集

谷歌揭秘：Multi-Agent 推理时扩展才是未来

拒绝小扎15亿美元offer的大佬，还是加入Meta了

苹果掀桌！扔掉AlphaFold核心模块，开启蛋白折叠「生成式AI」时代

万字长文详解腾讯优图RAG技术的架构设计与创新实践

生产级AI智能体架构指南：从Demo惊艳到落地可靠

准确率达90%，用户却疯狂弃用，一遇问题转人工，AI客服竟比电话语音还糟！大牛发文痛斥：能力≠采纳!四层架构让Agent无AI感

理论到实战，高可用架构踩坑说明书

揭秘Mem0的卓越架构：打造真正拥有记忆的AI系统

刚刚，英伟达新模型上线！4B推理狂飙53倍，全新注意力架构超越Mamba 2

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

字节&MAP重塑大模型推理算法优化重点，强化学习重在高效探索助力LLM提升上限

AI Agent的工作原理和架构

架构

循环语言模型：提升参数效率的潜在推理新范式

LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

长上下文窗口、Agent崛起，RAG已死？

NeurIPS 25 | 中大&amp;UC Merced等开源RAPID Hand，重新定义多指灵巧手数据采集

谷歌揭秘：Multi-Agent 推理时扩展才是未来

拒绝小扎15亿美元offer的大佬，还是加入Meta了

苹果掀桌！扔掉AlphaFold核心模块，开启蛋白折叠「生成式AI」时代

万字长文详解腾讯优图RAG技术的架构设计与创新实践

生产级AI智能体架构指南：从Demo惊艳到落地可靠

准确率达90%，用户却疯狂弃用，一遇问题转人工，AI客服竟比电话语音还糟！大牛发文痛斥：能力≠采纳!四层架构让Agent无AI感

理论到实战，高可用架构踩坑说明书

揭秘Mem0的卓越架构：打造真正拥有记忆的AI系统

刚刚，英伟达新模型上线！4B推理狂飙53倍，全新注意力架构超越Mamba 2

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

字节&amp;MAP重塑大模型推理算法优化重点，强化学习重在高效探索助力LLM提升上限

AI Agent的工作原理和架构

NeurIPS 25 | 中大&UC Merced等开源RAPID Hand，重新定义多指灵巧手数据采集

字节&MAP重塑大模型推理算法优化重点，强化学习重在高效探索助力LLM提升上限