AI在线 AI在线

智能体

o1核心贡献者离职后首发声:AI是史上最强杠杆,超越人力、资本和代码

又一位离职OpenAI的核心研究员发声! 刚刚被曝加入Meta的Hyung Won Chung,分享了他对AI未来的深刻思考:人工智能正在成为有史以来最强大的杠杆机制。 Hyung Won Chung和一同离开OpenAI的Jason Wei是长期搭档,他们的合作可以追溯到谷歌大脑时期,两人曾共同作为第一作者发表了关于模型微调的重要论文《Scaling Instruction-Finetuned Language Models》。
7/18/2025 9:33:26 AM

一文彻底搞懂智能体Agent基于Function Calling的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
7/18/2025 8:46:33 AM
AI大模型应用开发

ChatGPT智能体正式发布,多个创业赛道昨夜无眠

实用,太实用了! 这才是OpenAI Agent该有的样子。 就在刚刚,OpenAI最新发布来了,ChatGPT Agent正式对外亮相。
7/18/2025 8:45:56 AM
白交

让你拥有一个24小时助手!写给设计师的AI智能体科普指南

当视频在手机上无法加载,可前往PC查看。 当你告诉它,“我想为 xxx 咖啡做一套包装设计”,它就能自动生成 3 种不同风格的包装盒、咖啡袋、马克杯和展示场景。 就像请了一位 AI 视觉总监,一次性打包输出你要的品牌物料方案。
7/18/2025 7:22:00 AM
言川Artie

不用写产品文案了!手把手教你用Coze搭建设计AI助手​

文案是产品与用户沟通的最直接的桥梁,也是影响用户理解和行为决策的关键。 此前,各业务都陆续建立了自己的语义规范。 怎样让静态的语义文档,变成日常工作中随手能用的一个工具,是推进规范应用的重要环节。
7/18/2025 2:14:11 AM
58UXD 团队

从聊天记录到数字资产:MIRIX 让记忆可买卖

大家好,我是肆〇柒。 当下,LLM 智能体在各种复杂任务中表现得越来越出色。 然而,记忆这一关键要素却始终制约着 LLM 智能体的进一步发展。
7/17/2025 10:08:30 AM
肆零柒

孙正义宣称要部署10亿个智能体,释放出什么信号?

在科技圈,沉寂颇久的孙正义又扔下了一颗重磅炸弹。 最近,他公开表示,打算在今年于软银集团内部部署 10 亿个 AI 智能体,还要给这些智能体设计专门的操作系统。 此语一出,业界纷纷侧目,孙正义这葫芦里,到底卖的什么药?
7/17/2025 9:39:15 AM
小菲

OpenAI离职员工自曝:干了一年就润了!007压力逼到极限,AGI成宗教

外界对于OpenAI众说纷纭,很少有人从内部视角描述它的真实文化。 三周前,在推出Codex后,Calvin French-Owen离开了OpenAI。 在2024年5月,他加入了OpenAI,全程见证了OpenAI编程智能体Codex的诞生。
7/16/2025 1:09:46 PM

OpenAgentSafety 框架:AI 智能体安全评估的创新实践

大家好,我是肆〇柒,在 AI 智能体快速发展的当下,它们潜在的安全风险也日益凸显。 现有的 AI 智能体安全评估方法存在诸多局限:多数评估依赖于简化现实复杂性的模拟环境,难以准确反映智能体在真实场景下的表现;许多评估仅关注单一领域,如仅测试智能体的网页浏览或代码编写能力,缺乏对多领域综合任务的考察;此外,多轮多用户交互在评估中的缺失,使得难以洞察智能体在复杂人际互动和长期任务执行中的表现与潜在风险。 由卡耐基梅隆大学和艾伦人工智能研究所联合提出的 OpenAgentSafety(OA-SAFETY)框架,通过支持智能体与真实工具(如文件系统、终端、浏览器、消息平台等)的交互,并模拟多样化用户意图(包括良性、恶意和模糊意图)以及多轮交互场景,全面覆盖八大关键安全风险类别,系统地揭示了智能体在实际应用中可能存在的安全隐患。
7/15/2025 4:00:00 AM
肆零柒

员工AI助手应用指南:在应对挑战中实现效益最大化

“处于这一曲线顶端的公司——我们称之为未来构建型公司,那些最为成熟的公司——正在看到实质性的成果:收入增长达到1.5倍,股东价值提升1.8倍,”Kropp说道,“这里存在价值,但我们还处于早期阶段。 ”部署、重塑、创新为了利用AI和智能体创造价值,公司需要确定重点领域,采用部署、重塑、创新的框架。 AI已经在每个企业中部署,未来几年内将集成智能体,但如果你只是给员工一个聊天机器人,你并没有改变工作的方式。
7/15/2025 1:00:00 AM
D1net编译

关于智能体和RPA 企业决策者需要了解的事项

在当今关于业务自动化的讨论中,经常出现的两个术语是“智能体”和“机器人流程自动化(RPA)”。 它们经常被一起提及,因为两者都旨在简化传统上由人类处理的重复性、基于规则的任务。 然而,尽管它们在自动化和使用“机器人”方面有一些共同点,但它们代表了解决不同类型问题的截然不同方法。
7/14/2025 7:06:00 AM
Bernard Marr

Claude团队大揭秘!如何调动多智能体搞深度搜索

如何用多智能体的方法构建深度搜索? 现在,Claude团队把自家最新的心得,对外分享了。 在这篇文章中,它详细展示了如何构建一个有效的多智能体研究系统,这是一个架构,其中主代理(The Lead Agent)会生成和协调子代理(Subagents),以并行方式探索复杂查询,内容涵盖系统架构、提示工程以及评估方法等。
7/14/2025 3:22:00 AM

临交工两周,智能体演示全盘血崩!大牛顿悟:我只是做了个花式提示词链!血泪重构血泪总结:AI智能体的五个进阶等级(附完整代码实现)

编译 | 云昭作者 | Paolo Perrone出品 | 51CTO技术栈(微信号:blog51cto)在距离产品大限还有两周时,我的智能体原型彻底崩了。 表面上看,它没什么问题:能抓取数据、调用工具、还能解释它的执行步骤。 但其实全是装的。
7/11/2025 3:36:29 PM
云昭

消息称亚马逊 AWS 将于 7 月 15 日推出 AI 智能体市场,Anthropic 参与

AI在线 7 月 11 日消息,外媒 TechCrunch 当地时间昨日援引消息人士的话称,亚马逊 AWS 将于 7 月 15 日在美国纽约市举行的 AWS 峰会上发布一个 AI 智能体 / 代理市场。 这一市场允许 AI 初创公司直接向 AWS 客户提供 AI 代理服务,允许企业客户按需浏览、安装和查找各类 AI 智能体。 与其它在线市场类似,AI 初创公司可通过这一平台上向用户收取智能体使用费,AWS 则将从中抽成。
7/11/2025 2:44:37 PM
溯波(实习)

AI 15分钟"逆向工程"桌面软件:79美元/月的"专有技术"竟然是这样...

用了Claude Code几天之后,我决定测试一下它的逆向工程能力。 结果让我彻底震惊了。 一个收费79美元/月的"专有"桌面软件,Claude Code用15分钟就完全拆解了。
7/11/2025 9:16:49 AM
阿丸笔记

WebSailor 突破边界:助力开源智能体跨越复杂推理 “天花板”

大家好,我是肆〇柒,自从互联网时代开启以来,人类社会经历了多次信息技术变革,而互联网犹如一把双刃剑。 一方面,它以每两年数据量翻一番的惊人速度,为人类打开了通往海量知识的大门;另一方面,也向我们的认知能力发起了前所未有的挑战。 当我们面对无边无际的信息数据时,人类有限的记忆容量、脆弱的注意力稳定性,以及线性单一的探索路径,无疑成为了制约我们高效获取精准信息的瓶颈。
7/10/2025 10:21:19 AM
肆零柒

DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌

西风 发自 凹非寺. 量子位 | 公众号 QbitAI“人类最后的考试”首次突破30分,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过10分。
7/9/2025 1:28:00 PM
西风

Agent RL和智能体自我进化的关键一步:TaskCraft实现复杂智能体任务的自动生成

近年来,基于智能体的强化学习(Agent RL)与智能体优化(Agent Optimization)在学术界引发了广泛关注。 然而,实现具备工具调用能力的端到端智能体训练,首要瓶颈在于高质量任务数据的极度稀缺。 当前如 GAIA 与 BrowserComp 等主流数据集在构建过程中高度依赖人工标注,因而在规模与任务复杂性方面均存在明显限制——BrowserComp 仅涵盖约 1300 个搜索任务,GAIA 则仅提供约 500 条多工具协同任务样本。
7/4/2025 4:46:57 PM