AI在线 AI在线

智能体

AI已学会改自己代码,性能提升100%,还会「改绩效」!程序员,还不慌?

编程智能体杀疯了! 不仅能协助写代码,如今编程智能体甚至能实现自我「进化」! 最近,Transformer作者初创Sakana AI和加拿大UBC的Jeff Clune实验室合作,推出了自我改进的智能体——「达尔文-哥德尔机」(Darwin Gödel Machine,简称DGM)。
6/3/2025 9:10:00 AM

AI竟会「自己认错」?破解多智能体协作「罗生门」,斩获ICML 2025 Spotlight

你打造了一支「超级AI战队」——战队里每个AI都各司其职:有的收集信息、有的负责判断,还有的协调执行,一起协作攻克复杂任务。 这个愿望看似天衣无缝,结果却往往以失败告终。 问题就出在:当「问题」出现的时候,如何知道是哪个AI干的?
6/3/2025 9:08:00 AM

ICML 2025 Spotlight | 谁导致了多智能体系统的失败?首个「自动化失败归因」研究出炉

想象这样一个场景:你开发了一个由多个大型语言模型 Agent 组成的智能团队,它们协作完成复杂任务,比如一个 Agent 负责检索,一个负责决策。 然而任务失败了,结果不对。 问题来了:到底是哪个 Agent 出了错?
6/3/2025 8:26:00 AM

全球首个AI智能体「自进化」开源框架来了!一次部署,终生可用

在大语言模型技术迅猛发展的今天,各类AI智能体已广泛应用于科研和工业场景。 然而,在实际应用中,构建一个高效、稳定的多智能体系统仍面临诸多挑战:从智能体选型、提示词调试到工作流设计,流程复杂,成本高昂。 更重要的是,当前多智能体系统通常「部署即固化」,缺乏自我演化机制。
6/3/2025 8:09:00 AM

MARFT:多智能体协作与强化学习微调的协同进化

大家好,我是肆〇柒。 今天,继续 RL 相关话题,我们来探讨一个在人工智能领域极具应用潜力的话题 —— Multi-Agent Reinforcement Fine-Tuning(MARFT)。 这个概念融合了大型语言模型(LLM)、多智能体系统(LaMAS)和强化学习(RL)的精华,为解决复杂任务提供了全新的视角和方法论。
6/3/2025 6:12:03 AM
肆零柒

谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?

出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风

大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI

本文第一作者为上海交通大学计算机学院副教授刘卫文,研究方向为大模型智能体,大语言模型,个性化算法等。 近年来,随着大语言模型的快速发展,基于其构建的大模型智能体(LLM Agents)正逐步从技术演示走向实际应用部署。 然而,真正实现规模化应用仍面临诸多瓶颈。
5/30/2025 3:53:27 PM

中国信通院、vivo、荣耀、OPPO、小米、华为联合倡议:共建终端智能体生态

中国信息通信研究院携vivo、荣耀、OPPO、小米、华为等产业界,于 5 月 27 日发布《关于共建终端智能体生态的倡议》,共同制定了终端智能体生态的统一技术标准,为用户提供懂你、能干、可信、安全的终端智能体服务。
5/29/2025 4:48:26 PM
汪淼

单人公司能否纯凭AI智能体发育成独角兽?有戏!

译者 | 核子可乐审校 | 重楼如果你正在寻找一种替代打工生活的选择,那么自营职业——也被称为“个体创业”(solopreneuring)——可能是个好思路。 你可以凭借自己的软件开发、设计或商业技能作为独立承包商谋求发展。 或者,大家甚至可以独立创办一家公司以获得更大的回报。
5/29/2025 8:13:35 AM
核子可乐

一文读懂: AI 智能体的架构原则、三高架构、 存储架构的核心方案

一、为啥 AI 架构设计这么关键? 如今,AI 应用那可是雨后春笋般地冒出来。 ‘从 ChatGPT  、到AI智能体应用,到每天服务上千万人的智能客服,再到处理亿级数据的推荐系统,要想让这些 AI 玩意儿在实际场景里落地生根,高可用、高性能、灵活扩展的系统架构是关键。
5/29/2025 1:10:00 AM
尼恩架构团队

硬核分享!构建单智能体已经Out了!大佬分享:架构设计如何推动可靠的多智能体编排

作者 | Nikhil Gupta,Atlassian AI产品管理负责人编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)时至今日,如果再提如何构建一个Agent,肯定已经过时了。 打造一个超级智能的单一模型已经不再是2025年的主旋律。 而真正的力量和令人兴奋的新领域,是让多个专业化的AI智能体协同运转起来。
5/28/2025 6:04:20 PM
云昭

全靠Claude4!30年FAANG老工程师:AI帮我解决了四年老bug

AI 就像一头野驴,跑起来就不停。 人类花了几百万年才走上食物链顶端,而大模型只用了不到十年时间,已经能把你和刘亦菲 P 进一张自拍了。 奥!
5/28/2025 11:49:52 AM

什么是 AI 智能体?一个例子说清楚

很多人知道,AI 可以用来聊天,帮你生成文本,比如写总结、改文案、润邮件。 但你有没有想过:这些事情,其实都可以交给一个AI 智能体自动完成? 比如这件事:你输入一些工作数据,让 AI 帮你写一篇工作总结,再稍作修改发给主管。
5/28/2025 2:00:00 AM
大征哥

从无人问津到大厂簇拥,MCP到底是个啥?

在当今快速发展的AI领域,技术的迭代和创新不断涌现,而一种名为MCP的协议,正在悄然改变着AI模型与外部世界交互的方式。 近年来,随着AI技术的蓬勃发展,智能体(Agent)逐渐成为驱动AI应用的核心力量。 而MCP作为智能体的关键支撑技术,凭借其高效、可靠且灵活的任务执行能力和资源管理机制,为智能体在复杂多变的环境中提供了强大的保障,确保其能够高效运作。
5/28/2025 12:30:00 AM
Yu

微软开源浏览器Agent,可实时跟踪、控制智能体,超4000颗星

微软在官网开源了一个专用于浏览器网络任务的Agent——Magentic-UI。 Magentic-UI是基于微软曾经开源的 Magentic-One基础之上开发而成,并支持人机协同的控制方法来提升智能体的执行效率和准确率。 根据GAIA测试数据显示,当配备拥有辅助信息的模拟用户时,Magentic-UI 的任务完成率从自主模式下的30.3%提升至51.9%,准确率提高了71%。
5/27/2025 3:52:09 PM

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。 具体来说,就是让模型能够调用外部工具(如网页浏览器)进行搜索,或编写/执行代码以操控图像,从而实现「图像中的思考」。 尽管开源研究社区在纯文本的智能体能力方面(比如函数调用和工具集成)已取得显著进展,但涉及图像理解与操作的多模态智能体能力及其对应的评估体系仍处于起步阶段。
5/27/2025 3:23:05 PM

百度心响 iOS 版正式上线,智能体应用实现全面覆盖

最近,百度心响 iOS 版正式上线,这款多智能体协作应用的发布,标志着智能体应用的普及进入了一个全新阶段。 用户只需在苹果的 APP Store 中搜索 “心响” 即可免费下载,安卓用户也能自由使用,让所有人都可以轻松体验到这款应用的便捷。 心响 APP 的使用门槛非常低,无需邀请码且每日使用次数不限,这一点在智能体应用中相对少见。
5/27/2025 3:01:00 PM
AI在线

我国首个软件开发 AI 智能体标准发布,20 余家巨头联手参编

中国信息通信研究院联合中国工商银行、百度、腾讯、阿里、华为等二十余家头部企业,正式发布《面向软件工程智能体的技术和应用要求第 1 部分:开发智能体》(标准编号 AIIA / T 0219-2025)。
5/27/2025 1:44:54 PM
故渊