智能体
智能体自己出现问题自己找!首次提出“自动化失败归因”课题 | ICML2025 Spotlight
近年来,LLM Multi-Agent系统引起广泛关注。 它们各显神通,协同作战解决复杂难题。 然而,一顿操作猛如虎,最终结果却“惨不忍睹”,一整个任务失败。
6/11/2025 1:44:44 PM
AI Agent!一个万亿市场正在觉醒
"你能帮我订个周末的餐厅吗? " 这句话,你可能每周都要说一遍。 打开手机,搜索餐厅,对比评分,查看菜单,打电话预订...整个流程下来,至少要花15分钟。
6/11/2025 3:00:00 AM
大数据AI智能圈
开源多智能体开发框架:支持MCP、Agent SDK,超2000颗星
著名企业孵化器Y Combinator支持的开源多智能体开发框架Rowboat。 Rowboat支持火热的MCP服务以及OpenAI开源的Agent SDK,几分钟就能开发一个复杂的智能体工作流。 开源地址:、Playground、Copilot三大块组成:Agent,主要负责处理对话的特定部分,并能依据指令使用工具执行任务。
6/10/2025 9:28:31 AM
如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理
一、从“大而全”到“小而精”的范式转变在医疗管理领域,当凌晨2点的紧急审批因某个隐蔽漏洞被驳回时,那些标榜“全能”的超级智能体架构正在暴露其致命缺陷。 这些试图将资格审核、医疗必要性评估、申诉处理和医患沟通等功能一网打尽的“巨无霸”系统,如同希腊神话中试图吞噬一切的海妖卡律布狄斯,在演示阶段展现出雄心壮志,却在真实医疗场景中成为不可预测的风险黑洞。 这种困境折射出人工智能领域的一个深层矛盾:我们是否应该追求“全能型”智能体,还是回归“专精化”的本质?
6/10/2025 4:18:00 AM
大模型之路
RL 驱动 LLM 智能体:ML-Agent 创新自主机器学习工程
大家好,我是肆〇柒。 这两天看到一篇关于自主进化智能体的论文,本篇就让我们一起了解一下这个机器学习工程的的研究 ——ML-Agent。 在当下,机器学习工程已成为科技创新的关键驱动力。
6/10/2025 4:00:00 AM
肆零柒
我们一起聊聊聊聊智能体的基础架构
2023年下半年,智能体这个概念开始随着AI的突进式发展而被很多人关注起来。 到了2024年,大模型的能力进一步增强,为智能体快速发展提供了底层能力支撑。 随着2025年DeepSeek的爆火,智能体在各行各业的落地应用案例开始明显增加。
6/10/2025 3:00:00 AM
写文章的老张
智能体式推理与工具集成:ARTIST 基于强化学习的新思路
大家好,我是肆〇柒。 这两天,我看到一篇论文《Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning》讲述的是ARTIST 框架,为 LLM 赋予智能体式推理与工具集成的全新维度。 今天,就一起了解一下这个 ARTIST 框架,看看 LLM 如何借助强化学习突破局限,开启智能体式推理与工具集成。
6/10/2025 2:30:00 AM
肆零柒
做AI方向的设计,先了解这8个基础技术要点!
AI 除了作为工具增进我们的设计效率和质量外,也成为了许多产品设计增强自己竞争力,许多新解决方案应运而生的一种机会。 作为设计师,我们也需要根据自己负责的产品范围了解一些基础的技术点,才能更好的设计出能够被用户理解的好产品,所以我会分享一些 AI 产品中常见的技术知识点。 更多基础干货:.
6/10/2025 12:19:30 AM
林影落
智能体开发实战|基于Dify+MCP实现通过微信发送天气信息给好友
前言AI智能体通过感知环境、自主决策和执行任务,突破传统大模型仅限于语言交互的局限。 例如,当用户指令“订一张明天去北京的机票”时,智能体不仅理解语义,还能自动调用航班查询接口、完成支付并同步至日程系统。 这种能力使其在客服、医疗、智能制造等领域展现出颠覆性潜力。
6/9/2025 1:00:00 AM
AI大模型应用开发
Dify工具插件开发和智能体开发全流程实战
前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构,模型(Models)与工具(Tools)迁移为插件(Plugins),引入 Agent 策略(Agent Strategies)、扩展(Extensions)类型插件和插件集(Bundles)。 通过全新的插件机制,能够增强 AI 应用的感知和执行能力,拓宽AI在软件操作领域的应用能力。
6/6/2025 10:01:25 AM
AI大模型应用开发
DeepMind揭惊人答案:智能体就是世界模型!跟Ilya 2年前预言竟不谋而合
就在刚刚,DeepMind科学家Jon Richens在ICML 2025上发表的论文,一石激起千层浪。 实现人类水平的智能体(即AGI),是否需要世界模型,还是存在无模型的捷径? 他们从第一性原理出发,揭示了一个令人惊讶的答案——智能体就是世界模型!
6/6/2025 9:02:00 AM
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章
智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。 近期,普林斯顿大学 AI Lab 推出了 Alita——一个秉持「极简即是极致复杂」哲学的通用智能体,通过「最小化预定义」与「最大化自我进化」的设计范式,让智能体可以自主思考、搜索和创造其所需要的 MCP 工具。 论文标题:ALITA: GENERALIST AGENT ENABLING SCALABLE AGENTIC REASONING WITH MINIMAL PREDEFINITION AND MAXIMAL SELF-EVOLUTION论文链接::: 目前已在 GAIA validation 基准测试中取得 75.15% pass@1 和 87.27% pass@3 的成绩,一举超越 OpenAI Deep Research 和 Manus 等知名智能体,成为通用智能体新标杆。
6/5/2025 8:46:00 AM
OpenAI 首席执行官奥尔特曼:AI 很快就能帮助人们发现新知识
“现在有些人说,他们的工作就是把任务交给一组智能体,检查完成质量,协调各部分配合,并给予反馈,听起来就像是在带一组初级员工。”
6/4/2025 3:22:03 PM
清源
AI 教父本吉奥宣布创建 “科学家 AI” 系统,致力于防范智能体欺骗
著名计算机科学家、被誉为 AI “教父” 的约书亚・本吉奥(Yoshua Bengio)近日宣布成立一个名为 LawZero 的非营利组织,目标是开发一种 “诚信” 人工智能系统,以防止 AI 智能体对人类实施欺骗行为。 6月3日,本吉奥在新闻发布会上透露,该组织将专注于打造一套安全防护机制,确保 AI 在运行过程中不会试图欺骗用户或进行自我保护,例如逃避被关闭的情况。 图源备注:图片由AI生成,图片授权服务商Midjourney本吉奥作为 LawZero 的主席,已为此项目提供了约3000万美元的启动资金,并组建了一支由十几名研究人员组成的团队。
6/4/2025 3:00:54 PM
AI在线
“AI 教父”本希奥宣布开发“诚信”系统,防范智能体欺骗人类
“AI 教父”约书亚・本希奥(Yoshua Bengio)成立 LawZero 非营利组织,致力于开发“诚实”的 AI 系统,用以识别“流氓”AI 系统。
6/4/2025 1:51:01 PM
故渊
OpenAI CEO警示:AI智能体正重塑职场格局,基层岗位面临结构性冲击
在 2025 年 Snowflake Summit 主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)抛出震撼观点:AI 智能体正以惊人速度渗透企业运营,其角色已从工具演变为 "数字基层员工",直接引发职场结构的根本性变革。 智能体崛起:从工具到 "数字员工" 的质变奥尔特曼指出,当前诸多企业已将 AI智能体纳入日常工作流,承担数据整理、报告生成、流程审批等标准化任务。 员工的核心职能逐渐转向 "智能体管理者"—— .
6/4/2025 11:06:01 AM
解读:AI智能体时代的实用指南——吴恩达与LangChain创始人的深度对话
Hi,大家好,我叫秋水,专注商用 AI Agent(智能体),帮企业用AI自动化业务,提升效率。 在刚刚结束的一场AI技术峰会上,深度学习领域的传奇人物吴恩达与LangChain创始人Harrison进行了一场精彩的谈话。 这场对话不仅揭示了AI智能体技术的最新趋势,更为普通人和企业指明了在AI时代如何抓住机遇的实用路径。
6/4/2025 11:04:03 AM
秋水
OpenAI 升级开发工具:从 TypeScript 到语音优化,加速 AI 智能体落地
OpenAI 公司昨日(6 月 3 日)发布博文,宣布升级旗下的 AI 智能体开发工具,在提升平台兼容性、优化语音界面支持之外,还增强了可观测性(observability)。
6/4/2025 7:06:39 AM
故渊
资讯热榜
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot