AI在线 AI在线

智能体

谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?

出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风

大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI

本文第一作者为上海交通大学计算机学院副教授刘卫文,研究方向为大模型智能体,大语言模型,个性化算法等。 近年来,随着大语言模型的快速发展,基于其构建的大模型智能体(LLM Agents)正逐步从技术演示走向实际应用部署。 然而,真正实现规模化应用仍面临诸多瓶颈。
5/30/2025 3:53:27 PM

中国信通院、vivo、荣耀、OPPO、小米、华为联合倡议:共建终端智能体生态

中国信息通信研究院携vivo、荣耀、OPPO、小米、华为等产业界,于 5 月 27 日发布《关于共建终端智能体生态的倡议》,共同制定了终端智能体生态的统一技术标准,为用户提供懂你、能干、可信、安全的终端智能体服务。
5/29/2025 4:48:26 PM
汪淼

单人公司能否纯凭AI智能体发育成独角兽?有戏!

译者 | 核子可乐审校 | 重楼如果你正在寻找一种替代打工生活的选择,那么自营职业——也被称为“个体创业”(solopreneuring)——可能是个好思路。 你可以凭借自己的软件开发、设计或商业技能作为独立承包商谋求发展。 或者,大家甚至可以独立创办一家公司以获得更大的回报。
5/29/2025 8:13:35 AM
核子可乐

一文读懂: AI 智能体的架构原则、三高架构、 存储架构的核心方案

一、为啥 AI 架构设计这么关键? 如今,AI 应用那可是雨后春笋般地冒出来。 ‘从 ChatGPT  、到AI智能体应用,到每天服务上千万人的智能客服,再到处理亿级数据的推荐系统,要想让这些 AI 玩意儿在实际场景里落地生根,高可用、高性能、灵活扩展的系统架构是关键。
5/29/2025 1:10:00 AM
尼恩架构团队

硬核分享!构建单智能体已经Out了!大佬分享:架构设计如何推动可靠的多智能体编排

作者 | Nikhil Gupta,Atlassian AI产品管理负责人编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)时至今日,如果再提如何构建一个Agent,肯定已经过时了。 打造一个超级智能的单一模型已经不再是2025年的主旋律。 而真正的力量和令人兴奋的新领域,是让多个专业化的AI智能体协同运转起来。
5/28/2025 6:04:20 PM
云昭

全靠Claude4!30年FAANG老工程师:AI帮我解决了四年老bug

AI 就像一头野驴,跑起来就不停。 人类花了几百万年才走上食物链顶端,而大模型只用了不到十年时间,已经能把你和刘亦菲 P 进一张自拍了。 奥!
5/28/2025 11:49:52 AM

什么是 AI 智能体?一个例子说清楚

很多人知道,AI 可以用来聊天,帮你生成文本,比如写总结、改文案、润邮件。 但你有没有想过:这些事情,其实都可以交给一个AI 智能体自动完成? 比如这件事:你输入一些工作数据,让 AI 帮你写一篇工作总结,再稍作修改发给主管。
5/28/2025 2:00:00 AM
大征哥

从无人问津到大厂簇拥,MCP到底是个啥?

在当今快速发展的AI领域,技术的迭代和创新不断涌现,而一种名为MCP的协议,正在悄然改变着AI模型与外部世界交互的方式。 近年来,随着AI技术的蓬勃发展,智能体(Agent)逐渐成为驱动AI应用的核心力量。 而MCP作为智能体的关键支撑技术,凭借其高效、可靠且灵活的任务执行能力和资源管理机制,为智能体在复杂多变的环境中提供了强大的保障,确保其能够高效运作。
5/28/2025 12:30:00 AM
Yu

微软开源浏览器Agent,可实时跟踪、控制智能体,超4000颗星

微软在官网开源了一个专用于浏览器网络任务的Agent——Magentic-UI。 Magentic-UI是基于微软曾经开源的 Magentic-One基础之上开发而成,并支持人机协同的控制方法来提升智能体的执行效率和准确率。 根据GAIA测试数据显示,当配备拥有辅助信息的模拟用户时,Magentic-UI 的任务完成率从自主模式下的30.3%提升至51.9%,准确率提高了71%。
5/27/2025 3:52:09 PM

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。 具体来说,就是让模型能够调用外部工具(如网页浏览器)进行搜索,或编写/执行代码以操控图像,从而实现「图像中的思考」。 尽管开源研究社区在纯文本的智能体能力方面(比如函数调用和工具集成)已取得显著进展,但涉及图像理解与操作的多模态智能体能力及其对应的评估体系仍处于起步阶段。
5/27/2025 3:23:05 PM

百度心响 iOS 版正式上线,智能体应用实现全面覆盖

最近,百度心响 iOS 版正式上线,这款多智能体协作应用的发布,标志着智能体应用的普及进入了一个全新阶段。 用户只需在苹果的 APP Store 中搜索 “心响” 即可免费下载,安卓用户也能自由使用,让所有人都可以轻松体验到这款应用的便捷。 心响 APP 的使用门槛非常低,无需邀请码且每日使用次数不限,这一点在智能体应用中相对少见。
5/27/2025 3:01:00 PM
AI在线

我国首个软件开发 AI 智能体标准发布,20 余家巨头联手参编

中国信息通信研究院联合中国工商银行、百度、腾讯、阿里、华为等二十余家头部企业,正式发布《面向软件工程智能体的技术和应用要求第 1 部分:开发智能体》(标准编号 AIIA / T 0219-2025)。
5/27/2025 1:44:54 PM
故渊

如何访问和使用 OpenAI Codex?

译者 | 布加迪审校 | 重楼“软件工程正在发生变革;到 2025 年底,它将焕然一新。 ”Greg Brockman在OpenAI 发布会上的开场白为接下来的活动定下了基调。 OpenAI随后发布了Codex,这是一款旨在与开发者协同工作的云原生软件智能体。
5/27/2025 8:14:29 AM
布加迪

智能体「Agent」技术全景:挑战、机遇与未来

大家好,我是肆〇柒。 这篇论文的研究来自 MetaGPT、Montréal & Mila人工智能研究所、南洋理工大学、美国阿贡国家实验室、悉尼大学、宾夕法尼亚州立大学、微软亚洲研究院、伊利诺伊大学厄巴纳-香槟分校、香港科技大学、南加州大学、耶鲁大学、斯坦福大学、佐治亚大学、俄亥俄州立大学、阿卜杜拉国王科技大学、杜克大学、香港理工大学、谷歌 DeepMind 以及加拿大高等研究院(CIFAR)等众多研究者的集体智慧与前瞻思考,历时半年创作而成。 这篇论文的质量很高,为我们综述了 AI Agent 领域的全景现状,能看的出来是花了大心思的。
5/27/2025 2:00:00 AM
肆零柒

智能体常用策略FunctionCalling和ReAct有什么区别?

Dify 内置了两种 Agent 策略:Function Calling 和 ReAct,但二者有什么区别呢? 在使用时又该如何选择呢? 接下来我们一起来看。
5/27/2025 12:00:00 AM
磊哥

金蝶范式:从工具到生态,解码企业管理 AI 新时代

如今,大模型技术已经成为企业数智化的必修课。 然而,如何用上大模型,怎么用好大模型,却让很多企业陷入两难境地。 高昂的落地成本、复杂的场景适配需求,以及盲目跟风导致的投入产出失衡,企业最终陷入了“为 AI 而 AI”的困境。
5/26/2025 11:06:01 AM
鸢玮

Microsoft 推出 Magentic-UI:网页多智能体,革新式人机协作

大家好,我是肆〇柒。 在当下,现代生产力与网页活动深度交织。 从信息检索、表单填写,到精准导航各类仪表盘,网页任务贯穿工作流程始终。
5/26/2025 10:03:42 AM
肆零柒