AI在线 AI在线

架构

循环语言模型:提升参数效率的潜在推理新范式

现代大型语言模型(LLM)主要通过显式文本生成方式进行"思考",例如思维链(Chain-of-Thought, CoT),这种方法将推理延迟到训练后阶段,未能充分利用预训练数据。 本文介绍了一种名为Ouro的开源预训练循环语言模型(LoopLM)家族,其命名灵感来自递归的衔尾蛇(Ouroboros),通过三种关键创新将推理能力直接构建到预训练阶段:(1)潜在空间中的迭代计算,(2)用于学习深度分配的熵正则化目标函数,以及(3)扩展到7.7万亿token的训练规模。 核心创新与技术亮点Ouro模型展现了卓越的参数效率,其1.4B和2.6B参数规模的模型性能可以匹配甚至超越12B参数的SOTA模型。
11/4/2025 1:43:00 AM
可可

LangChain V1.0 深度解析:手把手带你跑通全新智能体架构

LangChain V1.0 简介终于,万众瞩目的 LangChain V1.0 版本正式发布了! 那对于最新的 V1.0 版本而言,其最显著的代码层面变化集中在 create_agent() 方法。 如果你之前没有用过旧版本的LangChain,那么以下关于更新内容的介绍可以跳过不看。
10/29/2025 4:22:00 AM
剑锋777

长上下文窗口、Agent崛起,RAG已死?

在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。 「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。 向量数据库 Chroma 创始人兼 CEO Jeff Huber 在播客与访谈中抛出「RAG 已死,上下文工程当立」的表述,主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。
10/20/2025 9:06:00 AM

NeurIPS 25 | 中大&UC Merced等开源RAPID Hand,重新定义多指灵巧手数据采集

在最近的一篇 NeurIPS 25 中稿论文中,来自中山大学、加州大学 Merced 分校、中科院自动化研究所、诚橙动力的研究者联合提出了一个全新开源的高自由度灵巧手平台 — RAPID Hand (Robust, Affordable, Perception-Integrated, Dexterous Hand)。 论文标题:RAPID Hand: A Robust, Affordable, Perception-Integrated, Dexterous Manipulation Platform for Generalist Robot Autonomy论文地址:: 地址:。 无论是日常的家庭整理、物品归置,还是辅助类服务任务,若缺乏灵巧的操作能力,机器人便难以真正完成复杂交互。
10/15/2025 8:55:43 AM

谷歌揭秘:Multi-Agent 推理时扩展才是未来

这里是一个专注于前沿AI和智能体的频道~谷歌 DeepMind 和 MIT 联合发了一篇论文,名叫 TUMIX(Tool-Use Mixture)。 大概就是说,Multi-Agent 才是 test-time- scaling的终极打开方式,可以以一半的成本,在HLE上,准确率从 21.6% 飙升到 34.1%,超越 Gemini-2.5-Pro Deep Research。 除此之外,他们还做了一个彩蛋,让Agent设计Agent,效果比人工设计的更牛~图片一个反常识Agent多样性 疯狂采样目前主流的推理时扩展方法是什么?
10/15/2025 2:11:00 AM
猕猴桃

拒绝小扎15亿美元offer的大佬,还是加入Meta了

那个拒绝了小扎15亿美元薪酬包的机器学习大神,还是加入Meta了。 OpenAI前CTO Mira Murati创业公司Thinking Machines Lab证实,联创、首席架构师Andrew Tulloch已经离职去了Meta。 按照公司发言人的说法,Tulloch离职的理由是“出于个人原因决定走一条不同的道路”,其本人则未给出回应。
10/13/2025 9:00:00 AM

苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代

蛋白质折叠,一直是计算生物学中的一个核心难题,并对药物研发等领域产生着深远影响。 若把蛋白质折叠类比为视觉领域的生成模型,氨基酸序列相当于「提示词」,模型输出则是原子的三维坐标。 受此思维启发,研究人员构建了一个基于标准Transformer模块与自适应层的通用且强大的架构——SimpleFold。
9/28/2025 9:12:00 AM

万字长文详解腾讯优图RAG技术的架构设计与创新实践

导语在信息爆炸的时代,如何从海量数据中精准获取知识并生成智能回答,已成为AI落地的核心挑战。 腾讯优图实验室凭借前沿的RAG体系,突破传统检索与生成的局限,打造了一套覆盖语义检索、结构化表检索、图检索的全栈解决方案。 本文将为你深度解析优图实验室RAG技术的架构设计与创新实践:从多阶段训练的2B级Embedding模型、Reranker分层蒸馏,到结构化表的智能解析与查询,再到自研GraphRAG框架在构图效率与复杂推理上的突破。
9/12/2025 3:50:54 PM
优图RAG技术

生产级AI智能体架构指南:从Demo惊艳到落地可靠

在AI领域,单提示词演示(Single-prompt demos)总是令人眼前一亮,但真正的生产落地却充满挑战。 坦白而言,即便最出色的大型语言模型(LLM)能在演示中大放异彩,现实世界对AI系统的要求远比这更高——用户需要足以支撑业务决策的精准结果,管理者要求清晰可追溯的审计记录,运维团队则需要能有效控制成本与延迟的调节手段。 问题的核心在于那种“大包大揽”的单提示词模式:它就像一个黑箱,将规划、执行与质量控制揉合成一团模糊的整体,不仅脆弱易故障、难以审计,更无法突破概念验证(PoC)阶段实现规模化应用。
9/9/2025 2:11:00 AM
大模型之路

准确率达90%,用户却疯狂弃用,一遇问题转人工,AI客服竟比电话语音还糟!大牛发文痛斥:能力≠采纳!四层架构让Agent无AI感

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,我和一位最近刚上线 AI Agent 的 PM 聊天。 指标看上去非常亮眼:89% 的准确率、毫秒级的响应、用户调研反馈积极。 但实际情况却很打脸,上线没多久,用户纷纷弃用了。
9/5/2025 1:06:00 PM
云昭

理论到实战,高可用架构踩坑说明书

在构建高可用系统时,开发者常常面临应用、数据库、缓存、消息队列等多维度的挑战。 本文结合京东真实技术场景,系统梳理高可用架构实践中常见的技术陷阱与解决方案,深入剖析每个技术组件的可用性保障要点。 旨在为工程师提供一套踩坑说明书,帮助团队在系统设计阶段规避潜在风险,提升线上系统的稳定性和容错能力。
9/5/2025 1:25:00 AM

揭秘Mem0的卓越架构:打造真正拥有记忆的AI系统

在人工智能应用迅猛发展的当下,聊天机器人已成为企业服务用户、个人提升效率的重要工具。 然而,许多开发者都遭遇过这样的尴尬场景:花费数周精心打造的聊天机器人在演示时表现出色,能流利回答问题、提供帮助,看似智能十足。 但当用户次日再次访问时,机器人却仿佛患上了“失忆症”,只会机械地问“今天我能为您提供什么帮助?
8/28/2025 7:52:17 AM
大模型之路

刚刚,英伟达新模型上线!4B推理狂飙53倍,全新注意力架构超越Mamba 2

英伟达最近真的痴迷上「小模型」了。 刚刚,英伟达发布了一个全新的混合架构语言模型系列,Jet-Nemotron。 论文地址::。
8/26/2025 3:31:35 PM

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了:新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。 国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近14%,总市值跃居科创板头名。 半导体ETF,同样也是在半天的时间里大涨5.89%。
8/22/2025 3:51:22 PM

GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网

刚刚,OpenAI又离职一名华人大佬。 前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布,并参与o*-mini、o3等模型工作。
8/19/2025 3:58:59 PM

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM

字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限

强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。 一个普遍存在的现象是:在训练过程中,模型的熵值迅速下降,推理路径趋于固化,导致“利用(exploitation)”远超“探索(exploration)”,严重失衡。 这种过早收敛不仅削弱了模型的多样性生成能力,也限制了其性能上限的进一步突破。
8/8/2025 9:02:00 AM

AI Agent的工作原理和架构

大家好,我是人月聊 IT。 今天聊AI智能体的工作原理,既然谈AI工作原理,刚好就让AI自己来做回答。 参考提示词:如果要描述一个事物或一个系统的工作原理,我的核心思路就是要打开事物内部,看事物内部由哪些组件组成,这些组件之间是如何交互和协同的,最终对我展示了某种输出或行为特征。
8/4/2025 2:55:00 AM
何明路