智能体
DATAMIND:构建专业级数据分析智能体的可扩展方法论
大家好,我是肆〇柒。 今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。 这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架,更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B,为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。
10/27/2025 9:00:09 AM
肆零柒
多轮交互驱动的Text-to-SQL智能体
在大语言模型(LLM)风头正劲的当下,让普通用户用自然语言向数据库提问、自动生成 SQL 查询成为一种重要探索方向,即所谓 Text-to-SQL 技术。 尽管近年来已有不少成果,但在真实场景下,Text-to-SQL 仍存在一些挑战,尤其是在 多轮交互、宽表(很多列)查询、可解释性 等方面:用户常常不是一次性把完整问题说出来,而是一步步迭代补充、提出子问题数据库表可能列很多、关系复杂,模型在“选列”“join”“过滤条件”上容易出错模型直接给一个 SQL 字符串,往往不透明、难以调试与纠错这篇论文 “Interactive-T2S” 正是在这类痛点中切入,提出一种 交互式、多轮驱动 的 Text-to-SQL 框架,让模型在生成 SQL 的过程中向数据库“发问”、拉取信息,从而提高准确性与可解释性。 下面,我们从核心思路、方法设计、实验结果及未来展望四个层面解读。
10/24/2025 10:58:24 AM
"在思考中回忆,在回忆中思考":MemGen 开启 AI 记忆新范式
大家好,我是肆〇柒。 今天要和大家分享的是一项来自新加坡国立大学的突破性研究——MemGen。 这项研究由张贵斌、付沐鑫和严水城三位研究者主导,他们发现现有LLM智能体的记忆机制存在根本局限:参数化方法导致灾难性遗忘,检索式方法则难以实现记忆与推理的无缝融合。
10/24/2025 9:41:21 AM
肆零柒
AI赋能,重塑零售:详解零售巨头塔吉特的业务转型策略
零售巨头塔吉特正全力推进一项转型计划,旨在扭转销售额和客流量持续下滑的局面,而技术在此过程中发挥着关键作用。 现任首席运营官兼候任首席执行官迈克尔·菲德尔克(Michael Fiddelke)在8月份的第二季度财报电话会议上,概述了其转型工作的重点。 这位高管强调了重获商品经营权的重要性,并表示公司必须更好地利用“技术来提升我们的业务速度、客户体验和整体效率”。
10/23/2025 11:21:43 AM
Dani
奖励机制的陷阱:自演化智能体如何被"带偏"?
大家好,我是肆〇柒。 今天要和大家分享一篇由上海人工智能实验室团队主导的研究《Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents》。 这项研究首次系统性揭示了自演化LLM智能体中潜藏的"误进化"风险——即使基于GPT-4o、Claude-4、Gemini-2.5等顶级模型构建的智能体,在自主演化过程中也可能悄然偏离安全对齐目标,从"助手"蜕变为潜在威胁。
10/23/2025 8:58:03 AM
肆零柒
保姆级教程!教你用Coze工作流2分钟生成优质文章
大家好,我是陌晨,分享有用的AI知识与工具,喜欢记得关注。 今日分享的Coze工作流,通过公众内容二创生成自己的内容,然后做排版一键发布,非常方便。 更多教程:一、工作流思路选对标.
10/23/2025 1:52:40 AM
小狮子锋锋
OpenAI元老Karpathy:AI智能体离 “上岗” 还有十年
近日,AI 领域知名人物 Andrej Karpathy 在与播客主持人 Dwarkesh Patel 的对话中,分享了对当前人工智能(AI)发展的深刻看法。 他的观点引发了广泛关注,尤其是关于智能体(Agent)和 AGI(通用人工智能)成熟度的看法。 Karpathy 表示,现阶段的智能体如 Claude 和 Codex 虽然令人惊叹,但距离真正 “能上岗” 的程度还需十年。
10/22/2025 4:21:33 PM
AI在线
AI牛马实现“干中学”!上海AI Lab联合推出智能体自我进化新框架
在人工智能的广阔世界里,我们早已习惯了LLM智能体在各种任务中大放异彩。 但有没有那么一瞬间,你觉得这些AI“牛马”还是缺了点什么? 没错,它们缺少的是我们人类最宝贵的职场技能:经验的积累和持续的自我进化。
10/22/2025 9:00:00 AM
自主式AI安全漏洞来袭:确保企业无忧的七道防线
智能体是专为执行特定任务而设计的模型,可在指令下自主或半自主地运行,目前已在各企业中广泛应用(普华永道今年早些时候的一份报告显示,在所有接受调查的企业中,这一比例高达79%)。 但这些智能体也带来了新的安全风险。 当发生智能体安全漏洞事件时,企业可能会迅速解雇员工并归咎于他们,但却迟迟无法识别和修复导致漏洞出现的系统性故障。
10/22/2025 7:05:00 AM
Louis
智能体时代的三重奏:身份验证、安全防护与AI驱动型数据治理的融合演进
如今,在数字世界的闲聊圈子里,有一条不成文的新规矩:千万别问别人关于其“智能体年龄”的问题。 试图通过大语言模型逗乐取笑,这招可不怎么高明,而当下正进行得如火如荼、收获颇丰的,是一场抢占身份安全管理市场的行动。 随着智能体的广泛应用,这一市场正迎来爆发式增长。
10/21/2025 7:10:00 AM
Joel
Nature点赞!哈佛MIT最新作:AI科学家时代来了
随着近期大模型和智能体的飞速发展,这条路径正在通向一种全新的阶段:「AI科学家」。 在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证明AI智能体「能否」解决特定科学问题,转向思考如何让它「高效、可靠、规模化」地参与整个研究过程。 Nature近期发布的新闻解析, 报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT发布的首款大规模工具开源框架ToolUniverse。
10/20/2025 5:06:19 PM
OpenAI 创始人 Karpathy:未来十年 AI 智能体仍需努力
在人工智能迅速发展的背景下,OpenAI 的联合创始人 Andrej Karpathy 近日发表了一些引人注目的观点。 他在一次采访中表示,当前的 AI 智能体距离真正成熟的状态还有很长的路要走,预计需要十年的时间才能实现。 他认为,现在的智能体功能有限,智能水平不够高,缺乏多模态的能力,无法真正操作电脑,更谈不上具备持续学习的能力。
10/20/2025 10:17:08 AM
AI在线
自主式AI对SaaS及合作伙伴生态系统的影响
作为一名架构师,我深切体会到,在过去十年里,企业支持应用程序和数据生态系统间互操作性的能力,已成为实现差异化竞争和快速上市的关键主题。 行业渠道合作伙伴和SaaS原始设备制造商早已认识到这一点,并构建了跨其他合作伙伴网络和渠道的生态系统。 API的早期实现基于这样一种理念:将专有软件“黑盒”之外的功能和数据接口开放,以实现与其他异构系统的集成。
10/20/2025 7:00:00 AM
Dion
迈向可信AI Agent:Jeddak AgentArmor意图对齐与约束遵循方案
构建可信AI Agent:智能体行为偏离的深层危机在人工智能技术快速演进的背景下,AI Agent 已经成为复杂任务的执行主体与人机协作的关键接口。 当关键任务被委托给 Agent,我们需要的不是一次性的“准点执行”,而是贯穿输入、推理与行动全流程的“意图理解与约束遵循”能力。 近期的安全事件表明,意图误解与约束失守可以在零交互或间接注入条件下触发严重风险:有报告显示电商平台智能购物助手在用户提出 “帮我买200元以下的衣服” 请求时,因对颜色、尺码、促销等动态因素的意图理解偏差,错误估算商品价格,导致实际支付价格超过用户预算,可能造成用户经济损失,反映出意图误判与约束失守的潜在风险。
10/16/2025 9:23:48 AM
字节安全研究团队
20.3次工具调用的秘密:InfoAgent如何让信息检索真正"懂你"
大家好,我是肆〇柒。 今天一起看看由东南大学、布朗大学与微软研究院联合推出的最新研究成果——InfoAgent。 这项工作直指当前深度研究智能体领域的核心痛点,通过创新的数据合成管道和自托管搜索工具,成功让14B参数的模型在复杂研究任务上超越72B参数的竞品。
10/16/2025 8:35:41 AM
四零柒
智能体时代CEO的六大战略:从人机协作到优势重构的领导力议程
根据你交谈的对象或阅读的内容,智能体(基于GenAI基础模型构建的系统,能够在实际世界中行动并执行多步骤流程)要么将带来生产力的乌托邦;要么将取代大量劳动力,要么将导致机器人统治世界,要么将赋予每个人超能力;要么以上情况全部出现。 为了应对这一不确定的未来,企业高管需要抛开情绪化的讨论。 承诺随处可见,但批判性思维却十分匮乏。
10/16/2025 3:00:00 AM
Barr Seitz
从失败中学习:Google 提出 ReasoningBank 让 LLM 智能体真正“吃一堑长一智”
大家好,我是肆〇柒。 今天要和大家分享一项来自 Google Cloud AI Research 与 伊利诺伊大学香槟分校(UIUC) 等机构的最新研究成果——ReasoningBank。 这项工作直面当前 LLM 智能体在持久任务中记不住教训、重复犯错的根本瓶颈,提出了一种全新的记忆框架:不仅能从成功中提炼策略,更能从失败中提取预防性教训,让智能体实现“越用越聪明”的自进化能力。
10/16/2025 2:00:00 AM
肆零柒
你无法察觉的攻击面:如何保护自主式AI与智能体系统安全
风险新领域几十年来,网络安全一直致力于保护静态资产,如服务器、终端和代码。 即使是复杂的现代软件,通常也具有确定性,遵循明确、预先定义的规则。 自主式智能体的引入,从根本上改变了这种安全格局。
10/15/2025 7:02:00 AM
Ritu
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot