AI在线 AI在线

智能体

系统学习Deep Research,这一篇综述就够了

系统学习Deep Research,这一篇综述就够了

近年来,大模型的应用正从对话与创意写作,走向更加开放、复杂的研究型问题。 尽管以检索增强生成(RAG)为代表的方法缓解了知识获取瓶颈,但其静态的 “一次检索 一次生成” 范式,难以支撑多步推理与长期研究流程,由此催生了 Deep Research(DR)这一新方向。 然而,随着相关工作的快速涌现,DR的概念也在迅速膨胀并趋于碎片化:不同工作在系统实现、任务假设与评价上差异显著;相似术语的使用进一步模糊了其能力边界。
1/2/2026 12:46:00 AM 机器之心
AI一旦开始「内卷」,会变成什么样?腾讯混元和上交联合揭秘多智能体「饥饿游戏」

AI一旦开始「内卷」,会变成什么样?腾讯混元和上交联合揭秘多智能体「饥饿游戏」

在多智能体系统的想象中,我们常常看到这样一幅图景:多个 AI 智能体分工协作、彼此配合,像一个高效团队一样攻克复杂任务,展现出超越单体智能的 “集体智慧”。 但一个关键问题常常被忽略:当这些智能体不再只是 “同事”,而是被迫变成 “竞品”,甚至是 “对手”,会发生什么? 腾讯混元数字人团队与上海交通大学的最新研究,给出了一个颇为刺眼的回答:当面临极端竞争压力时,LLM 多智能体系统会出现严重的 “过度竞争” 行为,沉迷互踩、内卷和博弈,直接拖垮整体任务表现。
12/21/2025 6:45:00 PM 机器之心
火山引擎谭待:2026年大模型市场将迎十倍增长,AI竞争不是零和博弈而是共同做大蛋糕

火山引擎谭待:2026年大模型市场将迎十倍增长,AI竞争不是零和博弈而是共同做大蛋糕

在AI从技术演示迈向产业落地的关键拐点,火山引擎总裁谭待在2025 FORCE原动力大会上作出大胆预测: 2026 年大模型市场规模有望实现十倍增长,而企业间的竞争不应是“你死我活”的零和博弈,而应聚焦于共同扩大市场、加速行业AI化。 “明年,竞争的核心不再是争夺现有份额,而是如何一起把蛋糕做大,”谭待强调。 他认为, 2025 年AI已进入规模化应用爆发前夜,而衡量这一进程的核心指标是 Tokens调用量——“模型的价值,只有在真实调用中才能被验证和释放。
12/19/2025 6:16:43 PM AI在线
商汤推出如影营销电商智能体,包含四款 Agent 与数字人主播

商汤推出如影营销电商智能体,包含四款 Agent 与数字人主播

AI在线 12 月 18 日消息,商汤科技昨日发布了面向电商运营场景的如影营销智能体,综合四个电商 Agent 和数字人主播形成“五大智能体矩阵”,覆盖电商运营端到端全链路。 商汤宣称,店铺运营 Agent 复杂场景中可将真人需要半天的事件用时缩短到 10 分钟,单任务平均提效 20 倍;借助直播运营 Agent,同等质量运营复盘耗时从原本 2 小时降至 20 分钟;流量投放 Agent 能使投放监测单任务提效 5 倍;直播场控 Agent 能自动完成各类助播工作;数字人 Agent 可实现同日高质量复刻真人直播间。
12/18/2025 3:17:21 PM 溯波(实习)
支持“一人剧组”模式,商汤发布行业首个创编一体、多剧集生成智能体 Seko2.0

支持“一人剧组”模式,商汤发布行业首个创编一体、多剧集生成智能体 Seko2.0

AI在线 12 月 16 日消息,作为 2025 商汤产品发布周的一部分,商汤科技昨日发布了行业首个创编一体、多剧集生成智能体 Seko2.0,宣称这一 AI 产品让“一人剧组”变成可能。 Seko2.0 相较今年 7 月推出的初版 Seko 在 UI、多剧集、智能体调度方面均进行了功能升级,支持 100 集以内剧本的连续创作,人物妆造可随场景改变。 Seko2.0 集成了 SekoIDX 和 SekoTalk 两项技术,前者在扩散模型的高噪阶段引入“负参考图”,在一致性与避免过度相似间构建平衡;而后者是业内首个支持超过 2 人对口型的解决方案。
12/16/2025 1:42:06 PM 溯波(实习)
第二波!2025年12月精选实用设计干货合集

第二波!2025年12月精选实用设计干货合集

大家好,这是 2025 年 12 月第 2 波干货合集! 这期干货合集也是干货满满,包含了功能丰富的 AI 智能体平台 Genspark ,开源前端组件构建平台 shadcn/ui ,Google 出品的创意画板 AI 工具 Mixboard,专门用来创建内部应用的 AI 平台 Build0.ai,使用 macOS 来呈现的独特作品集,超好用的矢量插画图库 Getillustrations。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:.
12/16/2025 8:08:41 AM 陈子木
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

今天(12月15日)起,商汤科技正式启动「产品发布周」,多款兼具开创性与实用性的AI产品将陆续登场——. 今天,Seko2.0重磅发布。 作为行业首个创编一体、多剧集生成智能体,Seko2.0专为当下炙手可热的短剧、漫剧行业的个人创作者与工作室量身打造,让“一人剧组”变成可能。
12/15/2025 2:13:14 PM 十三
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026

张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026

编辑部 整理自 MEET2026. 量子位 | 公众号 QbitAI从ChatGPT到DeepSeek,AI正沿着“智能 ”的路径进入新一轮浪潮。 正值大模型从“算力堆叠”走向“推理优先”的关键节点,清华大学智能产业研究院(AIR)创始院长、中国工程院外籍院士张亚勤提出:新一轮人工智能,是信息智能、物理智能和生物智能的融合,本质上也是原子、分子和比特的融合。
12/11/2025 6:34:53 PM 思邈
智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放

智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放

智谱今日宣布正式开源其核心 AI Agent 模型 AutoGLM,这一具备“Phone Use”能力的智能体能够稳定完成外卖点单、机票预订等长达数十步的复杂手机操作流程。 开源意味着任何硬件厂商、手机厂商及开发者,都可以在自己的系统中复现一个能“看懂屏幕”、并能像真人一样完成点击、输入、滑动等操作的 AI 助手。 AutoGLM 已支持包括微信、淘宝、抖音在内的超过50款高频中文应用的核心场景,其演示效果与此前引发行业关注的“豆包手机”极为相似:用户无需手动操作,只需让 AI 观察屏幕内容,它便可以自动执行任务、连续完成多步骤操作并直达结果。
12/9/2025 11:36:56 AM AI在线
TRAE 发布 SOLO 正式版:实时感知 + 多智能体 开启新一代专业级 AI 编码模式

TRAE 发布 SOLO 正式版:实时感知 + 多智能体 开启新一代专业级 AI 编码模式

TRAE 宣布推出 SOLO 正式版,定位为 “The Responsive Coding Agent”,面向专业开发者提供更加实时、可掌控、多任务并行的 AI 编程体验。 即日起,该版本已在 TRAE 国际版全面开放,并开启限时免费体验活动。 今年7月,TRAE 推出 SOLO Beta 版,内置智能体 SOLO Builder,能够基于多模态上下文执行需求理解、任务分解、工具调度与结果交付,帮助开发者快速构建端到端应用。
11/14/2025 5:47:21 PM AI在线
百度打造「最硬AI云」,硬在哪里?

百度打造「最硬AI云」,硬在哪里?

2025年被称为“Agent元年”,这背后潜藏着一个深刻的行业转向:当AI如顶级赛车般展现出惊人性能后,企业已不再满足于驻足围观,只做看台上鼓掌的观众。 他们的真正诉求是走下看台踏上赛道,亲自握紧方向盘,将这辆性能超群的赛车,平稳、精准地驶向自己的商业目的地。 翻过“智能涌现”的华丽篇章,AI的下一章节是什么?
11/14/2025 3:30:00 PM 周蕾
斯坦福7B智能体全面超越GPT-4o,推理流登顶HF

斯坦福7B智能体全面超越GPT-4o,推理流登顶HF

当前AI Agent的发展正陷入两难的境地:一方面,训练「全能型」大模型让其同时承担推理、规划与工具调用,虽具一体化优势,但在长链推理中往往训练不稳定、扩展性受限;另一方面,基于prompt的智能体系统虽具灵活性,却缺乏学习与自我优化能力,无法从交互中持续进化。 如何突破这一瓶颈? 斯坦福大学联合德州农工大学(Texas A&M)、加州大学圣地亚哥分校(UC San Diego)和Lambda的研究团队给出了新答案:让智能体系统在推理「流」中进行在线强化学习,从而实现持续的自我提升与能力进化。
11/4/2025 8:42:27 AM
LangChain重磅升级!DeepAgents 0.2带来可插拔后端,重新定义AI智能体开发

LangChain重磅升级!DeepAgents 0.2带来可插拔后端,重新定义AI智能体开发

两个月前,LangChain团队提出了"深度智能体"(Deep Agents)的概念,用来描述那些能够执行复杂、开放式任务并在更长的时间范围内运行的AI智能体。 他们认为这类智能体需要四个关键要素:规划工具、文件系统访问、子智能体,以及详细的提示词。 随后,他们推出了deepagents这个Python包,内置了所有这些基础组件。
11/4/2025 12:00:00 AM 阿丸笔记
最新 Claude Code 实战秘籍!月烧十万氪金总结:管理智能体上下文、批量处理任务、快速原型、自动生成 PR……

最新 Claude Code 实战秘籍!月烧十万氪金总结:管理智能体上下文、批量处理任务、快速原型、自动生成 PR……

编辑 | 听雨小编最近刷到一篇让程序员直呼“醍醐灌顶”的文章——出自软件工程师兼安全工程师 Shrivu Shankar。 他基于日常使用 Claude Code 的真实经验,分享了从个人项目到企业级开发的全套智能体最佳实践。 Shrivu 不只是讲理论,他讲述了管理智能体上下文、批量处理任务、快速原型、自动生成 Pull Request 的实操技巧,还结合 Hooks、Skills、MCP、SDK 等高级特性,告诉你如何把 AI 真正融入日常工程工作流。
11/3/2025 3:17:45 PM 听雨
谷歌CEO确认:Gemini3年内发布,AI Agent能力或成突破口

谷歌CEO确认:Gemini3年内发布,AI Agent能力或成突破口

谷歌首席执行官桑达尔·皮查伊在最新的财报电话会上证实,公司计划在今年内推出其下一代人工智能模型Gemini3。 这款新模型的目标是超越当前的Gemini2.5Pro,并着重提升其在处理复杂、多模态任务中的**“智能体”(Agent)能力**,以期进一步缩小与OpenAI GPT-5等顶级竞争对手之间的性能差距。 Gemini3:聚焦复杂多模态任务皮查伊指出,Gemini3在设计上将更注重实用性和复杂性。
11/3/2025 11:21:43 AM AI在线
字节发布通用游戏智能体!5000亿token训练,用鼠标键盘吊打GPT-5!

字节发布通用游戏智能体!5000亿token训练,用鼠标键盘吊打GPT-5!

用鼠标和键盘打游戏的智能体,这就来了! 它不仅能在《我的世界》中和普通玩家一较高下。 还能玩《神庙逃亡》、《星露谷》,甚至可以在未见过的3D网页游戏中实现零样本迁移。
10/31/2025 8:51:00 AM
智能体可能通过普通网络搜索泄露企业数据

智能体可能通过普通网络搜索泄露企业数据

该研究由Smart Labs . AI和奥格斯堡大学共同开展。 作者希望了解间接提示注入在实际应用中(而非仅在孤立案例中)是如何运作的。
10/31/2025 2:00:00 AM Mirko
Cursor 2.0来了!可视化的Claude Code?

Cursor 2.0来了!可视化的Claude Code?

如果把IDE的主角从“文件”挪到“代理”,会发生什么? Cursor 2.0 给出了一个很大胆的答案:界面不再围绕文件树展开,而是以“多个智能体”的协作来组织你的工作。 这次更新不只是加了一个侧栏或几个按钮,而是把多智能体并行、结果择优、改动可视化这些能力,变成了默认的交互基础。
10/30/2025 4:23:47 PM