智能体

AI赋能，重塑零售：详解零售巨头塔吉特的业务转型策略

零售巨头塔吉特正全力推进一项转型计划，旨在扭转销售额和客流量持续下滑的局面，而技术在此过程中发挥着关键作用。现任首席运营官兼候任首席执行官迈克尔·菲德尔克(Michael Fiddelke)在8月份的第二季度财报电话会议上，概述了其转型工作的重点。这位高管强调了重获商品经营权的重要性，并表示公司必须更好地利用“技术来提升我们的业务速度、客户体验和整体效率”。

10/23/2025 11:21:43 AM

Dani

大家好，我是肆〇柒。今天要和大家分享一篇由上海人工智能实验室团队主导的研究《Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents》。这项研究首次系统性揭示了自演化LLM智能体中潜藏的"误进化"风险——即使基于GPT-4o、Claude-4、Gemini-2.5等顶级模型构建的智能体，在自主演化过程中也可能悄然偏离安全对齐目标，从"助手"蜕变为潜在威胁。

10/23/2025 8:58:03 AM

肆零柒

保姆级教程！教你用Coze工作流2分钟生成优质文章

大家好，我是陌晨，分享有用的AI知识与工具，喜欢记得关注。今日分享的Coze工作流，通过公众内容二创生成自己的内容，然后做排版一键发布，非常方便。更多教程：一、工作流思路选对标.

10/23/2025 1:52:40 AM

小狮子锋锋

OpenAI元老Karpathy：AI智能体离 “上岗” 还有十年

近日，AI 领域知名人物 Andrej Karpathy 在与播客主持人 Dwarkesh Patel 的对话中，分享了对当前人工智能（AI）发展的深刻看法。他的观点引发了广泛关注，尤其是关于智能体(Agent)和 AGI(通用人工智能)成熟度的看法。 Karpathy 表示，现阶段的智能体如 Claude 和 Codex 虽然令人惊叹，但距离真正 “能上岗” 的程度还需十年。

10/22/2025 4:21:33 PM

AI在线

AI牛马实现“干中学”！上海AI Lab联合推出智能体自我进化新框架

在人工智能的广阔世界里，我们早已习惯了LLM智能体在各种任务中大放异彩。但有没有那么一瞬间，你觉得这些AI“牛马”还是缺了点什么？没错，它们缺少的是我们人类最宝贵的职场技能：经验的积累和持续的自我进化。

10/22/2025 9:00:00 AM

自主式AI安全漏洞来袭：确保企业无忧的七道防线

智能体是专为执行特定任务而设计的模型，可在指令下自主或半自主地运行，目前已在各企业中广泛应用(普华永道今年早些时候的一份报告显示，在所有接受调查的企业中，这一比例高达79%)。但这些智能体也带来了新的安全风险。当发生智能体安全漏洞事件时，企业可能会迅速解雇员工并归咎于他们，但却迟迟无法识别和修复导致漏洞出现的系统性故障。

10/22/2025 7:05:00 AM

Louis

智能体时代的三重奏：身份验证、安全防护与AI驱动型数据治理的融合演进

如今，在数字世界的闲聊圈子里，有一条不成文的新规矩：千万别问别人关于其“智能体年龄”的问题。试图通过大语言模型逗乐取笑，这招可不怎么高明，而当下正进行得如火如荼、收获颇丰的，是一场抢占身份安全管理市场的行动。随着智能体的广泛应用，这一市场正迎来爆发式增长。

10/21/2025 7:10:00 AM

Joel

Nature点赞！哈佛MIT最新作：AI科学家时代来了

随着近期大模型和智能体的飞速发展，这条路径正在通向一种全新的阶段：「AI科学家」。在AI赋能科研的前沿，我们正见证一个重要的里程碑：从证明AI智能体「能否」解决特定科学问题，转向思考如何让它「高效、可靠、规模化」地参与整个研究过程。 Nature近期发布的新闻解析，报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT发布的首款大规模工具开源框架ToolUniverse。

10/20/2025 5:06:19 PM

OpenAI 创始人 Karpathy：未来十年 AI 智能体仍需努力

在人工智能迅速发展的背景下，OpenAI 的联合创始人 Andrej Karpathy 近日发表了一些引人注目的观点。他在一次采访中表示，当前的 AI 智能体距离真正成熟的状态还有很长的路要走，预计需要十年的时间才能实现。他认为，现在的智能体功能有限，智能水平不够高，缺乏多模态的能力，无法真正操作电脑，更谈不上具备持续学习的能力。

10/20/2025 10:17:08 AM

AI在线

自主式AI对SaaS及合作伙伴生态系统的影响

作为一名架构师，我深切体会到，在过去十年里，企业支持应用程序和数据生态系统间互操作性的能力，已成为实现差异化竞争和快速上市的关键主题。行业渠道合作伙伴和SaaS原始设备制造商早已认识到这一点，并构建了跨其他合作伙伴网络和渠道的生态系统。 API的早期实现基于这样一种理念：将专有软件“黑盒”之外的功能和数据接口开放，以实现与其他异构系统的集成。

10/20/2025 7:00:00 AM

Dion

迈向可信AI Agent：Jeddak AgentArmor意图对齐与约束遵循方案

构建可信AI Agent：智能体行为偏离的深层危机在人工智能技术快速演进的背景下，AI Agent 已经成为复杂任务的执行主体与人机协作的关键接口。当关键任务被委托给 Agent，我们需要的不是一次性的“准点执行”，而是贯穿输入、推理与行动全流程的“意图理解与约束遵循”能力。近期的安全事件表明，意图误解与约束失守可以在零交互或间接注入条件下触发严重风险：有报告显示电商平台智能购物助手在用户提出 “帮我买200元以下的衣服” 请求时，因对颜色、尺码、促销等动态因素的意图理解偏差，错误估算商品价格，导致实际支付价格超过用户预算，可能造成用户经济损失，反映出意图误判与约束失守的潜在风险。

10/16/2025 9:23:48 AM

字节安全研究团队

20.3次工具调用的秘密：InfoAgent如何让信息检索真正"懂你"

大家好，我是肆〇柒。今天一起看看由东南大学、布朗大学与微软研究院联合推出的最新研究成果——InfoAgent。这项工作直指当前深度研究智能体领域的核心痛点，通过创新的数据合成管道和自托管搜索工具，成功让14B参数的模型在复杂研究任务上超越72B参数的竞品。

10/16/2025 8:35:41 AM

四零柒

智能体时代CEO的六大战略：从人机协作到优势重构的领导力议程

根据你交谈的对象或阅读的内容，智能体(基于GenAI基础模型构建的系统，能够在实际世界中行动并执行多步骤流程)要么将带来生产力的乌托邦;要么将取代大量劳动力，要么将导致机器人统治世界，要么将赋予每个人超能力;要么以上情况全部出现。为了应对这一不确定的未来，企业高管需要抛开情绪化的讨论。承诺随处可见，但批判性思维却十分匮乏。

10/16/2025 3:00:00 AM

Barr Seitz

从失败中学习：Google 提出 ReasoningBank 让 LLM 智能体真正“吃一堑长一智”

大家好，我是肆〇柒。今天要和大家分享一项来自 Google Cloud AI Research 与伊利诺伊大学香槟分校（UIUC）等机构的最新研究成果——ReasoningBank。这项工作直面当前 LLM 智能体在持久任务中记不住教训、重复犯错的根本瓶颈，提出了一种全新的记忆框架：不仅能从成功中提炼策略，更能从失败中提取预防性教训，让智能体实现“越用越聪明”的自进化能力。

10/16/2025 2:00:00 AM

肆零柒

你无法察觉的攻击面：如何保护自主式AI与智能体系统安全

风险新领域几十年来，网络安全一直致力于保护静态资产，如服务器、终端和代码。即使是复杂的现代软件，通常也具有确定性，遵循明确、预先定义的规则。自主式智能体的引入，从根本上改变了这种安全格局。

10/15/2025 7:02:00 AM

Ritu

最新研究！告别“大材小用”！智能体任务的黄金法则是：用小模型（SLM）

一、研究背景任务定义这篇论文研究的核心问题是：小型语言模型（SLMs，参数量在1-12B之间）是否能够在智能体系统（Agentic Systems）中替代大型语言模型（LLMs）。智能体系统指的是那些需要调用外部工具、生成结构化输出、执行函数调用的AI应用场景，比如：检索增强生成（RAG）API调用和工具使用代码生成和执行结构化数据提取研究动机长期以来，业界有个默认共识："模型越大越好"。但这篇论文挑战了这个观点，提出了一个颠覆性的发现：在智能体场景下，小模型不仅够用，而且往往更优秀。

10/15/2025 2:35:00 AM

ChallengeHub

将科研脏活累活真·丢给AI！上海AI Lab推出科研智能体FlowSearch

将复杂科研过程自动化落地，上海人工智能实验室推出FlowSearch！在GAIA、HLE、GPQA以及TRQA等科研基准上，FlowSearch不仅实现了性能全面领先，还展示了AI在复杂科研任务中的动态协作与深度推理能力。展开来说，当AI在问答基准和标准化测试中表现卓越之时，其进行科学研究的能力也在被更多关注。

10/14/2025 12:15:55 PM

一水

只需1/4预算，性能反超基线：阿里高德提出Tree-GRPO，高效破解智能体RL难题

对于大模型的强化学习已在数学推理、代码生成等静态任务中展现出不俗实力，而在需要与开放世界交互的智能体任务中，仍面临「两朵乌云」：高昂的 Rollout 预算（成千上万的 Token 与高成本的工具调用）和极其稀疏的「只看结果」的奖励信号。来自阿里高德的一篇最新研究论文提出了面向 Agent RL 的 Tree-GRPO 方法，将独立的链式采样改造为智能体步骤级的树搜索。该方法通过共享前缀、一次扩展多个分支，在相同预算下获得更丰富的有效轨迹；更重要的是，仅凭最终奖励即可沿树结构回溯出过程中的偏好信号，等价于隐式的步骤级偏好学习。

10/14/2025 9:06:00 AM

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构深度拆解！这可能是全网最详细的AI视频创作教程

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质开发者具身智能 xAI 生成式神经网络机器学习 3D 人形机器人 AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

智能体