AI在线 AI在线

智能体

2025 年多款 Deep Research 智能体框架全面对比

作者:fangzlong随着模型的范式和工程方式发展,网络上涌现出了一大批模仿人类研究者对问题进行深入研究的智能体应用。 本文将从 OpenAI 关于 DeepResearch 的指南开始,通过几个开源框架的架构解构与功能映射,揭示不同框架在研究自动化领域的差异。 为各位使用者、开发者选择合适工具和框架提供系统化参考。
8/12/2025 8:58:03 AM
腾讯技术工程

第一波!2025年8月精选实用设计干货合集

大家好,这是 2025 年 8 月第一波干货合集! 这期干货合集几乎全都是 AI 工具,有基于 AI 的着陆页生成工具,有给 Blender 做的 AI 助手,有免费生成粉色壁纸的 AI 网站,有免费且具备 AI 功能的在线设计平台,有基于 AI 的 Github Readme 文档生成工具,还有一键生成可交互页面的 AI 平台。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:.
8/11/2025 7:35:54 AM
陈子木

告别上下文溢出:MemTool如何优化LLM智能体的工具记忆管理

大家好,我是肆〇柒。 近期,普华永道(PricewaterhouseCoopers)商业技术与创新办公室的研究团队在LLM智能体技术领域取得了一些成果,他们提出的MemTool框架为解决多轮对话中动态工具调用的短期记忆管理问题提供了系统性解决方案。 关键发现包括:推理型LLM在自主代理模式下可实现90-94%的工具移除效率工作流和混合模式实现了跨模型一致的高移除效率(90% )工具移除效率与任务完成率存在解耦特性,需根据场景权衡选择系统提示工程和模型选择对MemTool性能有决定性影响在构建智能对话系统时,你是否遇到过这样的困扰:当LLM 智能体与用户进行多轮对话时,随着对话轮次增加,系统不断加载新工具却无法有效清理旧工具,导致上下文窗口迅速饱和,最终影响对话质量和系统稳定性?
8/8/2025 2:06:48 PM
肆零柒

GPT-5,AI的「登月时刻」来了!奥特曼现场发布,三位一体博士级智能体

刚刚,万众期待的GPT-5正式发布! 发布会仅仅20分钟后,我们断定,这就是「AI的登月时刻」。 GPT-5不仅仅是GPT-4的版本迭代,GPT-5是一场真正的智能范式跃迁!
8/8/2025 9:29:29 AM

AI 智能体记忆机制详解

是否总感觉你在和 AI 助手重复着同样的对话? 你告诉它一些重要的事情,五分钟后,它就忘了。 很长一段时间以来,这就是和大多数 AI 进行对话的现实情况。
8/8/2025 2:15:00 AM
Baihai IDP

GPT-5 的可读性革命,从博弈到智能体的跃迁

GPT-5 发布在即,根据奥特曼在内部演示中首次披露的 GPT-5 实测数据,这一代模型不仅具备高达 256K 的上下文窗口,还展现出惊人的数学与编程能力。 更令人瞩目的是其“智能模式切换”能力——在深度推理与快速响应之间自由切换,仿佛具备了某种“元认知”能力。 这种表现并非偶然,而是源于其底层架构中引入了新的验证机制,被称为“Universal Verifier”,其灵感正是来自一项前沿研究:Prover-Verifier Game(PVG)。
8/7/2025 2:55:00 AM
波动智能

智能体将吞噬SaaS市场?专家意见两极分化

随着对智能体的炒作达到新高度,一种新兴理论认为,突破性的AI工具将终结长期存在的SaaS模式。 这一观点并非特别新颖,但一直不断被提及,微软CEO萨蒂亚·纳德拉(Satya Nadella)等人士就持此观点。 今年早些时候,纳德拉在BG2播客中表示,智能体将具备“多存储库增删查改”(创建、读取、更新和删除)功能,这将使底层SaaS工具变得过时。
8/4/2025 7:00:00 AM
Grant Gross

一键自动化做图!教你用Coze搭建Lovart智能体

大家好,我是叁石。 继上篇文章之后,大家对 Lovart 的有了一定的了解,也对什么是智能体有了些体会。 所以,我突然有了个想法,能不能通过 coze 来模拟 Lovart 的智能体逻辑,我们自己给自己搭建个智能体来给自己工作,听起来还蛮有意思的,所以我花了 1 周的时间,在工作之余摸索了 coze 的搭建逻辑,发现还真的可以。
8/4/2025 6:59:30 AM
体验设计

四维解析:智能体如何实现自我进化

大家好,我是肆〇柒。 当下,智能体正从“工具使用者”到“工具制造者”转变,这是从依赖预定义静态工具集,到使智能体能够自主扩展和精炼自身技能的关键飞跃。 这是实现认知自给(cognitive self-sufficiency)的核心。
7/31/2025 2:00:00 AM
肆零柒

AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择

专为智能体设计云基础设施的初创公司E2B,已完成由Insight Partners领投的2100万美元A轮融资,借势企业对AI自动化工具需求的激增。 据该公司透露,目前已有88%的《财富》100强企业签约使用E2B平台,这凸显了企业对智能体技术的迅速采纳。 本轮融资吸引了现有投资者Decibel、Sunflower Capital和Kaya的参与,以及包括Docker的前CEO Scott Johnston在内的知名天使投资人的加入。
7/30/2025 7:20:00 AM
Michael

领导者的认知跃迁:MLPO如何通过多智能体训练实现能力突破

大家好,我是肆〇柒。 大语言模型(LLM)在翻译、问答等任务中展现了卓越能力,但其在事实准确性与复杂推理上仍存在显著缺陷。 为弥补这一短板,多智能体(Multi-Agent)范式被研究者提出:通过多个LLM协同工作(如辩论、验证、纠错),利用集体智慧超越单一模型的局限。
7/30/2025 1:00:00 AM
肆零柒

掌控 AI 智能体自主性:五级框架下的人机协作之道

大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
7/29/2025 9:24:21 AM
肆零柒

AI智能问答背后的工程,从一句问题到精准回答的全流程揭秘

周末晚上,我对着家里的智能音箱说:"小爱,明天深圳的天气怎么样? " 小爱立刻回答:"明天深圳台风天,气温25到28度,建议您带件薄外套。 " 这个过程看似简单,实则暗藏玄机。
7/29/2025 9:12:38 AM

万亿美元新大陆!谁将主宰「人机共生」智能体经济时代?

人机共生、生态自治的未来经济形态人类社会正站在智能革命的临界点。 当通用人工智能(AGI)的曙光尚未普照大地之时,一场由垂直领域智能体(Agent)驱动的经济变革已悄然席卷产业腹地。 这场变革的必然性深植于技术演进与商业逻辑的双重土壤:基础大模型在算力、算法与数据的能效博弈中渐趋平稳,而真正的价值创造正从基础设施层向应用层猛烈迁移。
7/28/2025 9:10:00 AM

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。 它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。 为了打破这一瓶颈,来自佐治亚理工学院和斯坦福大学的研究团队正式推出了 MLE-Dojo,一个专为训练和评测大模型智能体(LLM Agents)设计的“交互式武馆”。
7/28/2025 8:45:00 AM

Dify 1.7.0重磅更新:基于支持OAuth认证功能的插件开发GitHub智能体

前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 通过接入Dify的RESTful API,可以将Dify智能体集成到你的业务系统。 全新版本Dify v1.7.0 已正式发布,为插件系统带来了两个关键更新: OAuth认证支持与插件自动升级策略增强,进一步释放Dify的灵活性与稳定性。
7/25/2025 1:46:47 PM
AI大模型应用开发

智能体协作的力量:Anthropic 的「Research」多智能体实践

大家好,我是肆〇柒。 在 AI 领域,多智能体系统正逐渐成为解决复杂任务的关键技术之一。 昨天,我看到一篇出自 Anthropic 官网 Engineering 板块的博文,主要分享了Anthropic 在 Research 这个功能对于多智能体的工程实践。
7/25/2025 10:31:52 AM
肆零柒

AgentRM 奖励建模:智能体泛化能力的“导航仪”与“加速器”

大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)基础智能体正逐渐成为解决复杂交互任务的关键力量。 然而,一个不容忽视的问题是:尽管它们在训练中见过的任务上表现出色,但面对未见过的新任务时,泛化能力却往往不尽人意。
7/25/2025 10:06:41 AM
肆零柒