AI在线 AI在线

Agent

ChatGPT Agent革命:从对话工具到自主代理的华丽转身

ChatGPT Agent革命:从对话工具到自主代理的华丽转身

从每次对话需要重新输入指令,到现在能记住你的偏好、主动执行任务,ChatGPT的进化速度让人有点措手不及。 昨天还在感叹GPT-4o的强大,今天就发现OpenAI上线了Agent模式。 这个功能不只是技术升级那么简单,它彻底改变了我们与AI交互的方式。
7/21/2025 2:22:00 AM 阿丸笔记
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

现有Mobile/APP Agent的工作可以适应实时环境,并执行动作,但由于它们大部分都仅依赖于动作级奖励(SFT或RL)。 而这些奖励只能引导代理预测每一步中最佳的单一动作,因此难以应对不断变化的移动环境。 比如一句指令:“打开飞猪,进入酒店套餐,进入热门直播,找到飞猪超级VIP,并关注主播”。
7/20/2025 2:48:17 PM 西风
又一华人面孔!OpenAI 深夜祭Agent大招!背后研究人员曝光!奥特曼:感受AGI!VibePPT将至,Manus晒对比测评

又一华人面孔!OpenAI 深夜祭Agent大招!背后研究人员曝光!奥特曼:感受AGI!VibePPT将至,Manus晒对比测评

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)又是一个不眠夜! 7 月对于 OpenAI 而言意义非凡,从去年盛传 GPT-5 将会发布,再到近日的被挖角风波,再到 OpenAI 即将推出 AI 浏览器,各种传言全都酝酿在今天凌晨的直播里。 发布前,小编的预期是,肯定是 Agentic 办公类的产品。
7/18/2025 2:43:13 PM
刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了

刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了

今晚,ChatGPT和Deep Research、Operator「三剑客」首度合体! 奥特曼亲自带队,25分钟高能直播重磅发布ChatGPT agent,开启人类和智能体协作全新时代。 ChatGPT agent的核心,是一个统一的智能体系统。
7/18/2025 9:59:35 AM
一文彻底搞懂智能体Agent基于Function Calling的工具调用

一文彻底搞懂智能体Agent基于Function Calling的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
7/18/2025 8:46:33 AM AI大模型应用开发
不用写产品文案了!手把手教你用Coze搭建设计AI助手​

不用写产品文案了!手把手教你用Coze搭建设计AI助手​

文案是产品与用户沟通的最直接的桥梁,也是影响用户理解和行为决策的关键。 此前,各业务都陆续建立了自己的语义规范。 怎样让静态的语义文档,变成日常工作中随手能用的一个工具,是推进规范应用的重要环节。
7/18/2025 2:14:11 AM 58UXD 团队
7个月翻一番!AI agent能力飙升,METR报告揭示指数级进化规律

7个月翻一番!AI agent能力飙升,METR报告揭示指数级进化规律

henry 发自 凹非寺. 量子位 | 公众号 QbitAIAgent能力每7个月翻一番! 根据非营利研究机构METR最新发布的报告,这一规律已在9项基准测试中得到了验证。
7/16/2025 4:28:55 PM henry
七个月翻一番!AI Agent能力飙升,METR报告揭示指数级进化规律

七个月翻一番!AI Agent能力飙升,METR报告揭示指数级进化规律

Agent能力每7个月翻一番! 根据非营利研究机构METR最新发布的报告,这一规律已在9项基准测试中得到了验证。 这些任务涉及编程、数学、计算机使用、自动驾驶等领域,表明大模型正在不断向着高度自动化迈进。
7/16/2025 10:06:00 AM
代码大模型+金融场景:aiXcoder入选TiD 2025年度软件研发优秀案例

代码大模型+金融场景:aiXcoder入选TiD 2025年度软件研发优秀案例

2025年7月10日——基于代码大模型的aiXcoder智能化软件开发解决方案,凭借其技术创新和在国有银行的落地应用实践,入选TiD 2025质量竞争力大会“2025年度软件研发优秀案例”。 在该案例中,硅心科技(aiXcoder)将公司独特的领域化智能研发解决方案应用于某国有银行,助力该银行实现代码大模型的私有化部署,以及行内专属大模型的个性化训练和应用。 配合与银行自研云平台深度集成、企业专属研发管理平台和智能搜索系统等深度融合,硅心科技(aiXcoder)支持客户打造了银行专属的智能研发及交付体系,实现代码生成占比从个性化训练前的10%提升至35%、整体开发效率提升30%。
7/11/2025 5:24:00 PM 郑佳美
Lovart国产版超全测评!10分钟做了我一周的工作量!

Lovart国产版超全测评!10分钟做了我一周的工作量!

嗨大家好! 今天是星流 AI 操作员阿真! 之前我有分享过 Lovart 也就是第一个设计 Agent,整合多种 AI 模型来一站式完成概念到成品的创意过程。
7/7/2025 12:30:19 AM 阿真Irene
Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程,大神Karpathy一众创业者狂喊+1,网友:都是巫术

Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程,大神Karpathy一众创业者狂喊+1,网友:都是巫术

编辑 | 云昭Prompt工程又“失效”了? ! 之前是各种白领对它“喊打喊杀”,担心它取代自己的工作,后来的口风就变成了“大模型强大到不再需要Prompt工程了”,现在圈里又有谷歌的大佬抛出了神断言,让评论区炸锅的那种。
7/2/2025 12:10:50 PM 云昭
你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞

你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞

本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。 主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。 通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。
7/2/2025 8:46:00 AM
AI 智能体通信:潜力与挑战并存的未来

AI 智能体通信:潜力与挑战并存的未来

大家好,我是肆〇柒,大型语言模型(LLM)进步,以其卓越的自然语言理解和生成能力,催生了 LLM 驱动的 AI 智能体这一创新技术。 这些 AI 智能体,作为 LLM 的进阶应用形态,不仅具备传统 LLM 的语言处理能力,更集成了感知、推理、决策与行动执行等多元化功能,实现了从单纯的信息处理向自主任务操作的跨越。 其应用范围横跨科学研究、工业生产、社会服务等多个关键领域,展现出改变世界运行模式的巨大潜力,市场预计将以年均 40% 的速度增长,至 2035 年市场规模有望突破 2168 亿美元。
7/1/2025 5:00:00 AM 肆零柒
AI Agent 体如何改变我们与网页的互动方式

AI Agent 体如何改变我们与网页的互动方式

AI 智能体(像 OpenAI Operator 这样的)能帮你自动完成网上找产品、管理浏览器标签等任务,简直是解放双手! 但要让这些智能体真正派上用场,挑战可不小。 这篇文章会聊聊 AI 智能体在网页互动中的现状、痛点,以及一个叫 Agentic Web Interfaces (AWIs) 的新解决方案。
7/1/2025 2:10:00 AM AI研究生
为何无头浏览器是 AI Agent 的关键技术

为何无头浏览器是 AI Agent 的关键技术

Browserbase CEO Paul Klein IV 认为每个 AI 代理都需要一个无头浏览器作为与传统互联网交互的桥梁。 Browserbase 已经转型为“适用于您的 AI 的 Web 浏览器”,并获得了 4000 万美元的 B 轮融资。 无头浏览器在 AI 代理中用于信息收集和任务执行,主要有视觉 Web 代理和文本 Web 代理两种类型。
6/27/2025 4:07:08 PM 岱军
让Agent审查代码,第一版天崩!AI原生Github创始人血泪:话痨、误判,别幻想万能代理,快让AI闭嘴!网友:有效,但没必要

让Agent审查代码,第一版天崩!AI原生Github创始人血泪:话痨、误判,别幻想万能代理,快让AI闭嘴!网友:有效,但没必要

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“我们用 AI 来做代码审查,结果它比我老板还话多。 ”——这句话可能是很多开发者的真实写照。 最近,一篇名为《How we made our AI code reviewer stop being so noisy》的博客引发了热议。
6/27/2025 1:06:48 PM 云昭
一文彻底搞懂智能体Agent基于ReAct的工具调用

一文彻底搞懂智能体Agent基于ReAct的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
6/27/2025 6:00:00 AM AI大模型应用开发
掌控 AI 智能体自主性:五级框架下的人机协作之道

掌控 AI 智能体自主性:五级框架下的人机协作之道

大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
6/23/2025 10:05:40 AM 肆零柒