AI在线 AI在线

智能体

临交工两周,智能体演示全盘血崩!大牛顿悟:我只是做了个花式提示词链!血泪重构血泪总结:AI智能体的五个进阶等级(附完整代码实现)

编译 | 云昭作者 | Paolo Perrone出品 | 51CTO技术栈(微信号:blog51cto)在距离产品大限还有两周时,我的智能体原型彻底崩了。 表面上看,它没什么问题:能抓取数据、调用工具、还能解释它的执行步骤。 但其实全是装的。
7/11/2025 3:36:29 PM
云昭

消息称亚马逊 AWS 将于 7 月 15 日推出 AI 智能体市场,Anthropic 参与

AI在线 7 月 11 日消息,外媒 TechCrunch 当地时间昨日援引消息人士的话称,亚马逊 AWS 将于 7 月 15 日在美国纽约市举行的 AWS 峰会上发布一个 AI 智能体 / 代理市场。 这一市场允许 AI 初创公司直接向 AWS 客户提供 AI 代理服务,允许企业客户按需浏览、安装和查找各类 AI 智能体。 与其它在线市场类似,AI 初创公司可通过这一平台上向用户收取智能体使用费,AWS 则将从中抽成。
7/11/2025 2:44:37 PM
溯波(实习)

AI 15分钟"逆向工程"桌面软件:79美元/月的"专有技术"竟然是这样...

用了Claude Code几天之后,我决定测试一下它的逆向工程能力。 结果让我彻底震惊了。 一个收费79美元/月的"专有"桌面软件,Claude Code用15分钟就完全拆解了。
7/11/2025 9:16:49 AM
阿丸笔记

WebSailor 突破边界:助力开源智能体跨越复杂推理 “天花板”

大家好,我是肆〇柒,自从互联网时代开启以来,人类社会经历了多次信息技术变革,而互联网犹如一把双刃剑。 一方面,它以每两年数据量翻一番的惊人速度,为人类打开了通往海量知识的大门;另一方面,也向我们的认知能力发起了前所未有的挑战。 当我们面对无边无际的信息数据时,人类有限的记忆容量、脆弱的注意力稳定性,以及线性单一的探索路径,无疑成为了制约我们高效获取精准信息的瓶颈。
7/10/2025 10:21:19 AM
肆零柒

DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌

西风 发自 凹非寺. 量子位 | 公众号 QbitAI“人类最后的考试”首次突破30分,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过10分。
7/9/2025 1:28:00 PM
西风

Agent RL和智能体自我进化的关键一步:TaskCraft实现复杂智能体任务的自动生成

近年来,基于智能体的强化学习(Agent RL)与智能体优化(Agent Optimization)在学术界引发了广泛关注。 然而,实现具备工具调用能力的端到端智能体训练,首要瓶颈在于高质量任务数据的极度稀缺。 当前如 GAIA 与 BrowserComp 等主流数据集在构建过程中高度依赖人工标注,因而在规模与任务复杂性方面均存在明显限制——BrowserComp 仅涵盖约 1300 个搜索任务,GAIA 则仅提供约 500 条多工具协同任务样本。
7/4/2025 4:46:57 PM

ChatGPT 应用新特性:类 Operator 智能体,AI 实现点击、拖拽等操作

科技媒体 bleepingcomputer 昨日(7 月 3 日)发布博文,报道称在网页版和安卓版 ChatGPT 应用中,发现了新的测试代码,暗示其将引入类似 Operator 的工具。
7/4/2025 2:28:04 PM
故渊

2025年软件开发者必备的十大AI智能体框架全解析

人工智能智能体(AI Agent)技术正在彻底改变软件开发的范式,从简单的聊天机器人进化到具备多步推理、工具调用和协作解决问题能力的复杂系统。 对于希望构建智能应用的开发者而言,选择合适的AI智能体框架成为项目成功的关键。 本文将深入解析2025年最值得关注的11大AI智能体框架,从技术特性、适用场景到代码示例进行全方位对比,帮助开发者做出明智选择。
7/4/2025 4:22:00 AM
大模型之路

震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了

Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水

深度解析 MEM1:开启智能体长时序高效交互之门

大家好,我是肆〇柒。 相信大家在落地AI应用的时候,对长上下文的处理时所遇到的挑战,都深有感触。 大型语言模型(LLM)于单轮任务中表现卓越,然而现实应用场景日益复杂,多轮交互需求剧增。
7/2/2025 9:33:54 AM
肆零柒

超越微软,全球第一!上交AI智能体炼成「Kaggle特级大师」,登顶OpenAI MLE-bench

就在刚刚,一支来自中国高校的团队成功刷榜了OpenAI发布的权威基准测试MLE-bench! 这一次,荣耀属于上海交通大学人工智能学院Agents团队。 他们提出的AI专家智能体「ML-Master」,凭借着29.3%的平均奖牌率,拿下第一!
7/2/2025 8:50:00 AM

伯克利&Meta面向具身智能的世界模型:让AI通过全身动作「看见」未来

本文基于 Yutong Bai、Danny Tran、Amir Bar、Yann LeCun、Trevor Darrell 和 Jitendra Malik 等人的研究工作。 论文标题:Whole-Body Conditioned Egocentric Video Prediction论文地址:::,人工智能领域一直在思考一个看似简单但非常根本的问题:如果一个智能体要在真实世界中行动、规划,并且和环境互动,它需要一个怎样的「世界模型」? 在很多早期研究中,世界模型就是一个预测引擎:只要给它一个抽象的控制指令,比如「向前走一米」或者「向左转 30 度」,它就能模拟出未来的图像。
7/2/2025 8:40:00 AM

从聊天机器人到协作伙伴:智能体如何重塑企业工作模式

Scott White仍然对AI从一种新奇事物迅速转变为真正的工作伙伴感到惊叹。 就在一年多前,Anthropic公司的Claude AI产品负责人White还见证着早期的AI编码工具几乎无法完成一行代码,而如今,尽管他并非专业程序员,却也在亲自构建可用于生产的软件功能。 “我不再将自己的工作视为编写产品需求文档(PRD)并试图说服他人去做某事,”White表示,“我首先做的是,能否在我们的预发布服务器上构建一个可行的原型,然后分享一个它实际工作的演示。
7/2/2025 7:00:00 AM
Michael

AI 智能体通信:潜力与挑战并存的未来

大家好,我是肆〇柒,大型语言模型(LLM)进步,以其卓越的自然语言理解和生成能力,催生了 LLM 驱动的 AI 智能体这一创新技术。 这些 AI 智能体,作为 LLM 的进阶应用形态,不仅具备传统 LLM 的语言处理能力,更集成了感知、推理、决策与行动执行等多元化功能,实现了从单纯的信息处理向自主任务操作的跨越。 其应用范围横跨科学研究、工业生产、社会服务等多个关键领域,展现出改变世界运行模式的巨大潜力,市场预计将以年均 40% 的速度增长,至 2035 年市场规模有望突破 2168 亿美元。
7/1/2025 5:00:00 AM
肆零柒

AI Agent 体如何改变我们与网页的互动方式

AI 智能体(像 OpenAI Operator 这样的)能帮你自动完成网上找产品、管理浏览器标签等任务,简直是解放双手! 但要让这些智能体真正派上用场,挑战可不小。 这篇文章会聊聊 AI 智能体在网页互动中的现状、痛点,以及一个叫 Agentic Web Interfaces (AWIs) 的新解决方案。
7/1/2025 2:10:00 AM
AI研究生

AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体

作者简介:本文第一作者牛润良是吉林大学人工智能学院博士研究生,研究方向包括大模型智能体、强化学习,专注于 GUI Agent。 通讯作者王琪为吉林大学人工智能学院研究员,研究方向包括数据挖掘、大模型、强化学习。 迈向通用人工智能(AGI)的核心目标之一就是打造能在开放世界中自主探索并持续交互的智能体。
6/30/2025 8:25:00 AM

智能体规模化部署的隐形悬崖:如何避免部署崩盘?

想要构建并扩展智能体的企业还需要接受另一个现实:智能体的构建方式与其他软件截然不同。 根据Writer公司的CEO兼联合创始人May Habib的说法,智能体在构建方式、运行方式以及改进方式上都“有着根本的不同”,这意味着在处理自适应系统时,需要摒弃传统的软件开发生命周期(SDLC)。 “智能体并不总是可靠地遵循规则,”Habib在周三VB Transform大会的舞台上表示,“它们是结果导向的,它们会解读信息,会适应变化,而且,它们的行为真的只有在现实世界环境中才会显现出来。
6/30/2025 7:07:00 AM
Marty Swant

从自主式AI领军企业实战中提炼的关键部署策略

在VB Transform 2025大会的第二天,行业领袖们分享了大规模部署智能体的宝贵经验。 本次小组讨论由Foundation . Capital的普通合伙人Joanne Chen主持,参与讨论的嘉宾包括:Rocket Companies的首席技术官Shawn .
6/30/2025 2:00:00 AM
Sean