AI在线 AI在线

智能体

DATAMIND:构建专业级数据分析智能体的可扩展方法论

大家好,我是肆〇柒。 今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。 这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架,更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B,为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。
10/27/2025 9:00:09 AM
肆零柒

多轮交互驱动的Text-to-SQL智能体

在大语言模型(LLM)风头正劲的当下,让普通用户用自然语言向数据库提问、自动生成 SQL 查询成为一种重要探索方向,即所谓 Text-to-SQL 技术。 尽管近年来已有不少成果,但在真实场景下,Text-to-SQL 仍存在一些挑战,尤其是在 多轮交互、宽表(很多列)查询、可解释性 等方面:用户常常不是一次性把完整问题说出来,而是一步步迭代补充、提出子问题数据库表可能列很多、关系复杂,模型在“选列”“join”“过滤条件”上容易出错模型直接给一个 SQL 字符串,往往不透明、难以调试与纠错这篇论文 “Interactive-T2S” 正是在这类痛点中切入,提出一种 交互式、多轮驱动 的 Text-to-SQL 框架,让模型在生成 SQL 的过程中向数据库“发问”、拉取信息,从而提高准确性与可解释性。 下面,我们从核心思路、方法设计、实验结果及未来展望四个层面解读。
10/24/2025 10:58:24 AM

"在思考中回忆,在回忆中思考":MemGen 开启 AI 记忆新范式

大家好,我是肆〇柒。 今天要和大家分享的是一项来自新加坡国立大学的突破性研究——MemGen。 这项研究由张贵斌、付沐鑫和严水城三位研究者主导,他们发现现有LLM智能体的记忆机制存在根本局限:参数化方法导致灾难性遗忘,检索式方法则难以实现记忆与推理的无缝融合。
10/24/2025 9:41:21 AM
肆零柒

AI赋能,重塑零售:详解零售巨头塔吉特的业务转型策略

零售巨头塔吉特正全力推进一项转型计划,旨在扭转销售额和客流量持续下滑的局面,而技术在此过程中发挥着关键作用。 现任首席运营官兼候任首席执行官迈克尔·菲德尔克(Michael Fiddelke)在8月份的第二季度财报电话会议上,概述了其转型工作的重点。 这位高管强调了重获商品经营权的重要性,并表示公司必须更好地利用“技术来提升我们的业务速度、客户体验和整体效率”。
10/23/2025 11:21:43 AM
Dani

奖励机制的陷阱:自演化智能体如何被"带偏"?

大家好,我是肆〇柒。 今天要和大家分享一篇由上海人工智能实验室团队主导的研究《Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents》。 这项研究首次系统性揭示了自演化LLM智能体中潜藏的"误进化"风险——即使基于GPT-4o、Claude-4、Gemini-2.5等顶级模型构建的智能体,在自主演化过程中也可能悄然偏离安全对齐目标,从"助手"蜕变为潜在威胁。
10/23/2025 8:58:03 AM
肆零柒

保姆级教程!教你用Coze工作流2分钟生成优质文章

大家好,我是陌晨,分享有用的AI知识与工具,喜欢记得关注。 今日分享的Coze工作流,通过公众内容二创生成自己的内容,然后做排版一键发布,非常方便。 更多教程:一、工作流思路选对标.
10/23/2025 1:52:40 AM
小狮子锋锋

OpenAI元老Karpathy:AI智能体离 “上岗” 还有十年

近日,AI 领域知名人物 Andrej Karpathy 在与播客主持人 Dwarkesh Patel 的对话中,分享了对当前人工智能(AI)发展的深刻看法。 他的观点引发了广泛关注,尤其是关于智能体(Agent)和 AGI(通用人工智能)成熟度的看法。 Karpathy 表示,现阶段的智能体如 Claude 和 Codex 虽然令人惊叹,但距离真正 “能上岗” 的程度还需十年。
10/22/2025 4:21:33 PM
AI在线

AI牛马实现“干中学”!上海AI Lab联合推出智能体自我进化新框架

在人工智能的广阔世界里,我们早已习惯了LLM智能体在各种任务中大放异彩。 但有没有那么一瞬间,你觉得这些AI“牛马”还是缺了点什么? 没错,它们缺少的是我们人类最宝贵的职场技能:经验的积累和持续的自我进化。
10/22/2025 9:00:00 AM

自主式AI安全漏洞来袭:确保企业无忧的七道防线

智能体是专为执行特定任务而设计的模型,可在指令下自主或半自主地运行,目前已在各企业中广泛应用(普华永道今年早些时候的一份报告显示,在所有接受调查的企业中,这一比例高达79%)。 但这些智能体也带来了新的安全风险。 当发生智能体安全漏洞事件时,企业可能会迅速解雇员工并归咎于他们,但却迟迟无法识别和修复导致漏洞出现的系统性故障。
10/22/2025 7:05:00 AM
Louis

智能体时代的三重奏:身份验证、安全防护与AI驱动型数据治理的融合演进

如今,在数字世界的闲聊圈子里,有一条不成文的新规矩:千万别问别人关于其“智能体年龄”的问题。 试图通过大语言模型逗乐取笑,这招可不怎么高明,而当下正进行得如火如荼、收获颇丰的,是一场抢占身份安全管理市场的行动。 随着智能体的广泛应用,这一市场正迎来爆发式增长。
10/21/2025 7:10:00 AM
Joel

Nature点赞!哈佛MIT最新作:AI科学家时代来了

随着近期大模型和智能体的飞速发展,这条路径正在通向一种全新的阶段:「AI科学家」。 在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证明AI智能体「能否」解决特定科学问题,转向思考如何让它「高效、可靠、规模化」地参与整个研究过程。 Nature近期发布的新闻解析, 报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT发布的首款大规模工具开源框架ToolUniverse。
10/20/2025 5:06:19 PM

​OpenAI 创始人 Karpathy:未来十年 AI 智能体仍需努力

在人工智能迅速发展的背景下,OpenAI 的联合创始人 Andrej Karpathy 近日发表了一些引人注目的观点。 他在一次采访中表示,当前的 AI 智能体距离真正成熟的状态还有很长的路要走,预计需要十年的时间才能实现。 他认为,现在的智能体功能有限,智能水平不够高,缺乏多模态的能力,无法真正操作电脑,更谈不上具备持续学习的能力。
10/20/2025 10:17:08 AM
AI在线

自主式AI对SaaS及合作伙伴生态系统的影响

作为一名架构师,我深切体会到,在过去十年里,企业支持应用程序和数据生态系统间互操作性的能力,已成为实现差异化竞争和快速上市的关键主题。 行业渠道合作伙伴和SaaS原始设备制造商早已认识到这一点,并构建了跨其他合作伙伴网络和渠道的生态系统。 API的早期实现基于这样一种理念:将专有软件“黑盒”之外的功能和数据接口开放,以实现与其他异构系统的集成。
10/20/2025 7:00:00 AM
Dion

迈向可信AI Agent:Jeddak AgentArmor意图对齐与约束遵循方案

构建可信AI Agent:智能体行为偏离的深层危机在人工智能技术快速演进的背景下,AI Agent 已经成为复杂任务的执行主体与人机协作的关键接口。 当关键任务被委托给 Agent,我们需要的不是一次性的“准点执行”,而是贯穿输入、推理与行动全流程的“意图理解与约束遵循”能力。 近期的安全事件表明,意图误解与约束失守可以在零交互或间接注入条件下触发严重风险:有报告显示电商平台智能购物助手在用户提出 “帮我买200元以下的衣服” 请求时,因对颜色、尺码、促销等动态因素的意图理解偏差,错误估算商品价格,导致实际支付价格超过用户预算,可能造成用户经济损失,反映出意图误判与约束失守的潜在风险。
10/16/2025 9:23:48 AM
字节安全研究团队

20.3次工具调用的秘密:InfoAgent如何让信息检索真正"懂你"

大家好,我是肆〇柒。 今天一起看看由东南大学、布朗大学与微软研究院联合推出的最新研究成果——InfoAgent。 这项工作直指当前深度研究智能体领域的核心痛点,通过创新的数据合成管道和自托管搜索工具,成功让14B参数的模型在复杂研究任务上超越72B参数的竞品。
10/16/2025 8:35:41 AM
四零柒

智能体时代CEO的六大战略:从人机协作到优势重构的领导力议程

根据你交谈的对象或阅读的内容,智能体(基于GenAI基础模型构建的系统,能够在实际世界中行动并执行多步骤流程)要么将带来生产力的乌托邦;要么将取代大量劳动力,要么将导致机器人统治世界,要么将赋予每个人超能力;要么以上情况全部出现。 为了应对这一不确定的未来,企业高管需要抛开情绪化的讨论。 承诺随处可见,但批判性思维却十分匮乏。
10/16/2025 3:00:00 AM
Barr Seitz

从失败中学习:Google 提出 ReasoningBank 让 LLM 智能体真正“吃一堑长一智”

大家好,我是肆〇柒。 今天要和大家分享一项来自 Google Cloud AI Research 与 伊利诺伊大学香槟分校(UIUC) 等机构的最新研究成果——ReasoningBank。 这项工作直面当前 LLM 智能体在持久任务中记不住教训、重复犯错的根本瓶颈,提出了一种全新的记忆框架:不仅能从成功中提炼策略,更能从失败中提取预防性教训,让智能体实现“越用越聪明”的自进化能力。
10/16/2025 2:00:00 AM
肆零柒

你无法察觉的攻击面:如何保护自主式AI与智能体系统安全

风险新领域几十年来,网络安全一直致力于保护静态资产,如服务器、终端和代码。 即使是复杂的现代软件,通常也具有确定性,遵循明确、预先定义的规则。 自主式智能体的引入,从根本上改变了这种安全格局。
10/15/2025 7:02:00 AM
Ritu