智能体
系统学习Deep Research,这一篇综述就够了
近年来,大模型的应用正从对话与创意写作,走向更加开放、复杂的研究型问题。 尽管以检索增强生成(RAG)为代表的方法缓解了知识获取瓶颈,但其静态的 “一次检索 一次生成” 范式,难以支撑多步推理与长期研究流程,由此催生了 Deep Research(DR)这一新方向。 然而,随着相关工作的快速涌现,DR的概念也在迅速膨胀并趋于碎片化:不同工作在系统实现、任务假设与评价上差异显著;相似术语的使用进一步模糊了其能力边界。
AI一旦开始「内卷」,会变成什么样?腾讯混元和上交联合揭秘多智能体「饥饿游戏」
在多智能体系统的想象中,我们常常看到这样一幅图景:多个 AI 智能体分工协作、彼此配合,像一个高效团队一样攻克复杂任务,展现出超越单体智能的 “集体智慧”。 但一个关键问题常常被忽略:当这些智能体不再只是 “同事”,而是被迫变成 “竞品”,甚至是 “对手”,会发生什么? 腾讯混元数字人团队与上海交通大学的最新研究,给出了一个颇为刺眼的回答:当面临极端竞争压力时,LLM 多智能体系统会出现严重的 “过度竞争” 行为,沉迷互踩、内卷和博弈,直接拖垮整体任务表现。
火山引擎谭待:2026年大模型市场将迎十倍增长,AI竞争不是零和博弈而是共同做大蛋糕
在AI从技术演示迈向产业落地的关键拐点,火山引擎总裁谭待在2025 FORCE原动力大会上作出大胆预测: 2026 年大模型市场规模有望实现十倍增长,而企业间的竞争不应是“你死我活”的零和博弈,而应聚焦于共同扩大市场、加速行业AI化。 “明年,竞争的核心不再是争夺现有份额,而是如何一起把蛋糕做大,”谭待强调。 他认为, 2025 年AI已进入规模化应用爆发前夜,而衡量这一进程的核心指标是 Tokens调用量——“模型的价值,只有在真实调用中才能被验证和释放。
商汤推出如影营销电商智能体,包含四款 Agent 与数字人主播
AI在线 12 月 18 日消息,商汤科技昨日发布了面向电商运营场景的如影营销智能体,综合四个电商 Agent 和数字人主播形成“五大智能体矩阵”,覆盖电商运营端到端全链路。 商汤宣称,店铺运营 Agent 复杂场景中可将真人需要半天的事件用时缩短到 10 分钟,单任务平均提效 20 倍;借助直播运营 Agent,同等质量运营复盘耗时从原本 2 小时降至 20 分钟;流量投放 Agent 能使投放监测单任务提效 5 倍;直播场控 Agent 能自动完成各类助播工作;数字人 Agent 可实现同日高质量复刻真人直播间。
支持“一人剧组”模式,商汤发布行业首个创编一体、多剧集生成智能体 Seko2.0
AI在线 12 月 16 日消息,作为 2025 商汤产品发布周的一部分,商汤科技昨日发布了行业首个创编一体、多剧集生成智能体 Seko2.0,宣称这一 AI 产品让“一人剧组”变成可能。 Seko2.0 相较今年 7 月推出的初版 Seko 在 UI、多剧集、智能体调度方面均进行了功能升级,支持 100 集以内剧本的连续创作,人物妆造可随场景改变。 Seko2.0 集成了 SekoIDX 和 SekoTalk 两项技术,前者在扩散模型的高噪阶段引入“负参考图”,在一致性与避免过度相似间构建平衡;而后者是业内首个支持超过 2 人对口型的解决方案。
第二波!2025年12月精选实用设计干货合集
大家好,这是 2025 年 12 月第 2 波干货合集! 这期干货合集也是干货满满,包含了功能丰富的 AI 智能体平台 Genspark ,开源前端组件构建平台 shadcn/ui ,Google 出品的创意画板 AI 工具 Mixboard,专门用来创建内部应用的 AI 平台 Build0.ai,使用 macOS 来呈现的独特作品集,超好用的矢量插画图库 Getillustrations。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:.
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1
今天(12月15日)起,商汤科技正式启动「产品发布周」,多款兼具开创性与实用性的AI产品将陆续登场——. 今天,Seko2.0重磅发布。 作为行业首个创编一体、多剧集生成智能体,Seko2.0专为当下炙手可热的短剧、漫剧行业的个人创作者与工作室量身打造,让“一人剧组”变成可能。
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
编辑部 整理自 MEET2026. 量子位 | 公众号 QbitAI从ChatGPT到DeepSeek,AI正沿着“智能 ”的路径进入新一轮浪潮。 正值大模型从“算力堆叠”走向“推理优先”的关键节点,清华大学智能产业研究院(AIR)创始院长、中国工程院外籍院士张亚勤提出:新一轮人工智能,是信息智能、物理智能和生物智能的融合,本质上也是原子、分子和比特的融合。
智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放
智谱今日宣布正式开源其核心 AI Agent 模型 AutoGLM,这一具备“Phone Use”能力的智能体能够稳定完成外卖点单、机票预订等长达数十步的复杂手机操作流程。 开源意味着任何硬件厂商、手机厂商及开发者,都可以在自己的系统中复现一个能“看懂屏幕”、并能像真人一样完成点击、输入、滑动等操作的 AI 助手。 AutoGLM 已支持包括微信、淘宝、抖音在内的超过50款高频中文应用的核心场景,其演示效果与此前引发行业关注的“豆包手机”极为相似:用户无需手动操作,只需让 AI 观察屏幕内容,它便可以自动执行任务、连续完成多步骤操作并直达结果。
TRAE 发布 SOLO 正式版:实时感知 + 多智能体 开启新一代专业级 AI 编码模式
TRAE 宣布推出 SOLO 正式版,定位为 “The Responsive Coding Agent”,面向专业开发者提供更加实时、可掌控、多任务并行的 AI 编程体验。 即日起,该版本已在 TRAE 国际版全面开放,并开启限时免费体验活动。 今年7月,TRAE 推出 SOLO Beta 版,内置智能体 SOLO Builder,能够基于多模态上下文执行需求理解、任务分解、工具调度与结果交付,帮助开发者快速构建端到端应用。
百度打造「最硬AI云」,硬在哪里?
2025年被称为“Agent元年”,这背后潜藏着一个深刻的行业转向:当AI如顶级赛车般展现出惊人性能后,企业已不再满足于驻足围观,只做看台上鼓掌的观众。 他们的真正诉求是走下看台踏上赛道,亲自握紧方向盘,将这辆性能超群的赛车,平稳、精准地驶向自己的商业目的地。 翻过“智能涌现”的华丽篇章,AI的下一章节是什么?
斯坦福7B智能体全面超越GPT-4o,推理流登顶HF
当前AI Agent的发展正陷入两难的境地:一方面,训练「全能型」大模型让其同时承担推理、规划与工具调用,虽具一体化优势,但在长链推理中往往训练不稳定、扩展性受限;另一方面,基于prompt的智能体系统虽具灵活性,却缺乏学习与自我优化能力,无法从交互中持续进化。 如何突破这一瓶颈? 斯坦福大学联合德州农工大学(Texas A&M)、加州大学圣地亚哥分校(UC San Diego)和Lambda的研究团队给出了新答案:让智能体系统在推理「流」中进行在线强化学习,从而实现持续的自我提升与能力进化。
LangChain重磅升级!DeepAgents 0.2带来可插拔后端,重新定义AI智能体开发
两个月前,LangChain团队提出了"深度智能体"(Deep Agents)的概念,用来描述那些能够执行复杂、开放式任务并在更长的时间范围内运行的AI智能体。 他们认为这类智能体需要四个关键要素:规划工具、文件系统访问、子智能体,以及详细的提示词。 随后,他们推出了deepagents这个Python包,内置了所有这些基础组件。
最新 Claude Code 实战秘籍!月烧十万氪金总结:管理智能体上下文、批量处理任务、快速原型、自动生成 PR……
编辑 | 听雨小编最近刷到一篇让程序员直呼“醍醐灌顶”的文章——出自软件工程师兼安全工程师 Shrivu Shankar。 他基于日常使用 Claude Code 的真实经验,分享了从个人项目到企业级开发的全套智能体最佳实践。 Shrivu 不只是讲理论,他讲述了管理智能体上下文、批量处理任务、快速原型、自动生成 Pull Request 的实操技巧,还结合 Hooks、Skills、MCP、SDK 等高级特性,告诉你如何把 AI 真正融入日常工程工作流。
谷歌CEO确认:Gemini3年内发布,AI Agent能力或成突破口
谷歌首席执行官桑达尔·皮查伊在最新的财报电话会上证实,公司计划在今年内推出其下一代人工智能模型Gemini3。 这款新模型的目标是超越当前的Gemini2.5Pro,并着重提升其在处理复杂、多模态任务中的**“智能体”(Agent)能力**,以期进一步缩小与OpenAI GPT-5等顶级竞争对手之间的性能差距。 Gemini3:聚焦复杂多模态任务皮查伊指出,Gemini3在设计上将更注重实用性和复杂性。
字节发布通用游戏智能体!5000亿token训练,用鼠标键盘吊打GPT-5!
用鼠标和键盘打游戏的智能体,这就来了! 它不仅能在《我的世界》中和普通玩家一较高下。 还能玩《神庙逃亡》、《星露谷》,甚至可以在未见过的3D网页游戏中实现零样本迁移。
智能体可能通过普通网络搜索泄露企业数据
该研究由Smart Labs . AI和奥格斯堡大学共同开展。 作者希望了解间接提示注入在实际应用中(而非仅在孤立案例中)是如何运作的。
Cursor 2.0来了!可视化的Claude Code?
如果把IDE的主角从“文件”挪到“代理”,会发生什么? Cursor 2.0 给出了一个很大胆的答案:界面不再围绕文件树展开,而是以“多个智能体”的协作来组织你的工作。 这次更新不只是加了一个侧栏或几个按钮,而是把多智能体并行、结果择优、改动可视化这些能力,变成了默认的交互基础。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉