智能体
OpenAI发布34页智能体实践指南:从网络搜索到代码编写
2025年4月17日,OpenAI通过社交媒体宣布发布了一份34页的《智能体实践指南》,为开发者提供构建智能体应用的全面指导。 此举标志着OpenAI在推动AI技术落地与标准化方面的又一重要进展。 据推文内容,该指南详细介绍了如何利用OpenAI的Responses API构建智能体,涵盖网络搜索、文件搜索及计算机使用等功能。
OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)
人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。 这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。 通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建和安全部署智能体。
当智能体失控时,企业将遭受重创
在采访中,AutoRABIT的CTO Jason Lord探讨了将智能体集成到现实世界中的系统所带来的网络安全风险。 诸如幻觉、提示注入和嵌入式偏见等问题可能会使这些系统成为易受攻击的目标。 Lord呼吁进行监督、持续监控和人为介入循环控制以应对这些威胁。
字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。
李彦宏将于25日在Create2025百度AI开发者大会发表首场演讲,揭示百度AI新动态
今日,百度创始人李彦宏的25年首场演讲海报正式曝光。 根据海报信息,李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲,题为《模型的世界,应用的天下》。 演讲内容将聚焦AI领域的热门议题,包括MCP、智能体、数字人、模型成本等,引发业界广泛关注。
智能体版《苦涩的教训》,图灵奖得主Sutton、谷歌RL大佬Silver新作:超人智能靠经验
人类生成的数据推动了人工智能的惊人进步,但接下来会怎样呢? 几天前,Google DeepMind 强化学习副总裁 David Silver 参与了一场播客访谈节目,探讨了如何从依赖人类数据的时代迈向自主学习的时代。 与此同时,David Silver 和他的老师、2024 年图灵奖得主 Richard Sutton 合作撰写的论文《Welcome to the Era of Experience》称人们正站在人工智能新时代的门槛上,并有望达到前所未有的水平;同时展望了新一代智能体,认为它们将主要通过经验来学习,获得超越人类的能力。
刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star
深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。 该系列模型经过训练,会在响应之前进行更长时间的思考。 OpenAI 表示,这是他们迄今为止发布的最智能模型,也标志着 ChatGPT 能力的巨大飞跃。
蚂蚁百宝箱正式推出“MCP专区”,首批上线“支付MCP Server”等30余款服务
4月16日消息,为提升智能体(AI Agent)与外部工具的配置效率,蚂蚁智能体平台—百宝箱推出了“MCP专区”,全面支持各类MCP服务的部署和调用。 开发者通过百宝箱,可调用支付宝、高德地图、无影等30余款MCP服务,最快3分钟即可搭建一个连接MCP服务的智能体。 (图说:百宝箱已上线30余款MCP服务)MCP是给多智能体系统使用的上下文服务协议,能够让不同智能体听得懂彼此的“工作语言”,只要符合MCP标准,所有智能体之间都可实现握手,共同服务用户,去年11月一经发布就受到行业热捧。
本地部署DeepSeek+DiFy平台构建智能体应用
在大模型实际应用落地时候,利用智能体平台,构建本地的向量化知识库,基于RAG知识增强技术和大模型的推理能力,提升效率。 本文简要介绍RAG、大模型微调和大模型蒸馏的特点,通用智能体平台,并在本地部署DiFy智能体平台,利用本地部署的DeepSeek模型和知识库构建智能体应用。 1、RAG、微调和蒸馏大模型的落地使用主要有RAG、微调和蒸馏几种方式,每种方式有各自的特点和适用场景。
谷歌推出 AI 智能体交互协议 Agent2Agent:为智能体带来互操作性
遵循 A2A 协议,开发人员可构建能同使用该协议的其它任何智能体连接的智能体;而对于用户而言,可通过标准化的方式配置、管理来自不同供应商的智能体服务。
鏖战企业级市场,AI Agent如何重塑智能商业未来?
在科技的浩瀚星河中,DeepSeek掀起的技术风暴余波未平,全球首款通用Agent产品Manus的惊艳登场,再度点燃了整个行业的激情,让科技圈为之沸腾。 暂且不论Manus自身性能究竟达到何种高度,其引发的从“被动应答”到“主动执行”的颠覆性范式跃迁,正以前所未有的态势,不断突破繁杂业务流程场景下智能化的边界,为企业级市场带来无限可能。 近期,IDC发布的《中国AI Agent应用市场概览(2025Q1)》,首次对中国AI Agent应用的市场格局进行了系统性梳理。
2025必知AI趋势:智能体技术如何重塑人机协作
托尼·斯塔克与J.A.R.V.I.S的完美配合,曾是科幻电影中的经典场景。 智能助手接收指令,自主思考,调用资源,执行任务,甚至主动提醒风险。 这种高度智能的人机协作,正从银幕走入现实,这就是AI智能体(AI Agents)。
智能体|基于ReAct框架:构建极简智能体实践的探索
基于ReAct的方式,手动制作了一个最小的Agent结构(其实更多的是调用工具)。 完整代码可以参考::ReAct: Synergizing Reasoning and Acting in Language Models1、Step 1: 构造大模型首先我们需要一个大模型,这里我使用智谱的glm-4。 glm-4是基于Decoder-Only的通用对话大模型,可以使用API_key来调用模型。
OpenAI官方基准测试:承认Claude遥遥领先(狗头)
OpenAI承认Claude是最好的了(狗头)。 刚刚开源的新基准测试PaperBench,6款前沿大模型驱动智能体PK复现AI顶会论文,新版Claude-3.5-Sonnet显著超越o1/r1排名第一。 与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比,PaperBench更考验综合能力,不再是只执行单一任务。
成功采用AI需要具备两个条件
企业不应回避利用AI工具,但需要找到最大化效率和缓解企业风险之间的平衡点。 他们需要做到以下几点:制定无缝的AI安全政策以往,AI可能只是开发人员或专家交互的技术,但如今,公司各层级的员工都使用AI来协助他们完成各种任务。 因此,企业必须教育所有员工,让他们了解哪些大型语言模型和智能体应用程序是他们被授权使用的,以及他们可以与这些系统共享哪些类型的数据。
深度解析 MCP 与 AI 工具的未来
自 2023 年 OpenAI 发布函数调用功能以来,我一直在思考如何构建一个智能体与工具协同的生态系统。 随着基础模型的智能化程度提升,智能体与外部工具、数据和 API 的交互能力变得日益碎片化:开发者需要为每个集成系统单独实现包含特定业务逻辑的智能体。 显然,我们需要一个执行、数据获取和工具调用的标准接口。
关于大模型智能体意图识别不准确问题:function call 的缺陷
最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
MCP 协议:大模型构建 Agent 智能体的桥梁
大模型技术的发展日新月异,但关于大模型的应用却步履维艰;自从2024年开始市场开始把大模型应用提上日程,但到底怎么把大模型应用于各行各业是很多人都在思考的问题。 随着时间的推移,RAG,Agent智能体的概念被提出,特别是智能体技术被称为人工智能的未来,也是大模型被应用于其它领域的途径。 但到底怎么打造智能体,却是业界一直在思考的问题;虽然后来提出了思维链以及function call,然后结合工作流技术(如coz平台),但大模型在实际应用中依然存在各种各样的问题,而且效果也并不太好。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉