智能体
上百万智能体在OASIS模拟平台上玩推特,AI玩社交媒体和真人有多像?
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/29/2024 2:34:00 PM
机器之心
一次示范让Agent适应各种新环境,浙大杭电智能体框架入选NeurIPS
只需一次人类示范,就能让智能体适应新环境? 来自杭州电子科技大学和浙江大学的研究者,提出了一套新的智能体框架AutoManual。 该研究有效解决了智能体过度依赖人类专家提供的知识,难以自主适应新环境的问题。
11/29/2024 1:58:49 PM
自主智能体提前实现了?!大佬自研Python工具包,让大模型成为生产级水准,免费可用!智能体可自主反馈,人类只需批准即可
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)2025年,都知道智能体会爆发,然而,即将爆发的智能体会长成什么样子? 它不再只是一个“对话界面”那么简单,也不再将是“给你一项任务,去完成吧”的人类主动发起的各种工具调用(滚动聊天界面),而是一个真正意义上的自发发起任务,自动执行,但会在关键环节提醒人类进行批准确认的高级智能。 图片这一点不再是空穴来风,已经有玩家开始入场做尝试了,就在刚刚,一个名为Humanlayer的产品在圈内走红,它能让AI代理联系人类,让AI真得像得力助手一样,只需要批准确认就行。
11/27/2024 2:30:45 PM
言征
AI智能体失控时,谁来负责?
保护AI堆栈中的数据意味着了解数据流向何处以及防止滥用。 译自Who’s Responsible When AI Agents Go Rogue?,作者 Vrajesh Bhavsar。 无论您身处科技界还是与家人共进晚餐,如今都无法逃脱AI的影响。
11/26/2024 12:14:08 AM
岱军
斯坦福大学、华盛顿大学研究:1000 个 AI 智能体预测人类行为,准确率最高可达 85%
据The Decoder今日报道,斯坦福大学、华盛顿大学和 Google DeepMind 的研究人员联合开发了一种 AI 智能体(AI Agent,也称“AI代理”),能够在社会实验中逼真地模拟人类行为。
11/25/2024 7:53:55 AM
清源
续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作
Scaling Law又能续命了? 如何通过语言智能体的高级规划来Scaling推理时计算? 答案就是——使用LLM作为世界模型。
11/22/2024 2:10:00 PM
新智元
世界最大AI Agent生态系统!微软推出全新「自主AI智能体」,10万企业工作流被改变
微软正在悄悄改变企业AI的游戏规则! 现在,微软已经悄悄组建了世界最大的AI智能体生态系统,自推出以来,已经有超过10万家公司,用Copilot Studio创建了自己的AI智能体。 比如,麦肯锡通过自动化的流程分配智能体,将项目受理流程从20天缩短至仅2天;Pets at Home在不到两周内部署了防欺诈智能体,每年节省数百万美元……「这个增长速度远超我们的预期,也远超我们发布的其他任何前沿技术的表现,」微软智能体负责人Charles Lamanna透露道,「仅仅一个季度,就实现了2倍的增长。
11/21/2024 2:35:00 PM
新智元
硬科技观察之智能体:2025年会是AI智能体爆发之年
OpenAI CEO奥特曼不久前曾说:“我们会拥有越来越好的模型,但我认为下一个巨大突破来自智能体。 ”所谓AI智能体,实际上就是由AI驱动的软件工具,只需要给出最小的监督,它就可以执行多步骤任务。 除了自然语言处理,AI智能体还可以做决策、解决问题、执行任务时与环境互动。
11/18/2024 7:06:21 PM
小刀
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
环境生成模型(generative models of environments),也可以叫世界模型(world model),在「通用智能体规划」和「推理环境」中的关键组成部分,相比传统强化学习采样效率更高。 但世界模型主要操作一系列离散潜在变量(discrete latent variables)以模拟环境动态,但这种压缩紧凑的离散表征有可能会忽略那些在强化学习中很重要的视觉细节。 日内瓦大学、爱丁堡大学的研究人员提出了一个在扩散世界模型中训练的强化学习智能体DIAMOND(DIffusion As a Model Of eNvironment Dreams),文中分析了使扩散模型适应于世界建模(world modeling)所需的设计要素,并展示了如何通过改善视觉细节来提高智能体的性能。
11/18/2024 2:35:00 PM
新智元
Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟
受 ChatGPT 强大问答能力的影响,大型语言模型(LLM)提供商往往优化模型来回答人们的问题,以提供良好的消费者体验。 随着智能体研究日趋成熟,优化似乎有了新的方向。 人工智能著名学者、斯坦福大学教授吴恩达今天指出:「现在有一种趋势是优化模型以适应智能体工作流程,这将为智能体性能带来巨大提升」,并撰写一篇博客简单阐述了这种趋势。
11/15/2024 1:16:00 PM
机器之心
Meta最新!PARTNR:具身多智能体任务中规划与推理的基准测试框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&出发点本文提出了一个人机协作中的规划与推理任务基准(PARTNR),旨在研究家庭活动中的人机协调。 PARTNR任务展现了日常任务的特点,如空间、时间和异构agent能力约束。
11/14/2024 10:40:00 AM
具身智能之心
李彦宏:不是要一个“超级应用”,是要打造数百万“超级有用”的应用
“过去24个月,AI行业的最大变化是什么? 是大模型基本消除了幻觉。 ”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
11/12/2024 11:26:50 AM
玩转「智能体魔方」!清华推出AgentSquare模块化搜索框架,开启AI智能体高速进化时代
优秀基因的演化和重组,是生命体适应环境、永葆活力的自然法则。 AI智能体能否像有机生命一样,实现适应任务环境的高效自我演化? 大模型智能体的快速发展在数学、医疗、个人助手等各领域产生了突破性应用,但依赖专家知识的手工设计方法制约了它们的任务自适应能力。
11/8/2024 9:20:00 AM
新智元
1000个智能体打造《我的世界》,北大校友35页技术报告揭秘
北大校友打造的1000个智能体「我的世界」,背后原理揭晓了! 团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……其中最精彩的,当数团队整活儿:让牧师NPC引入虚拟宗教,最后发现该宗教在500个智能体(横跨6大城乡)中进行了广泛传播。 据介绍,项目整体由一个名为PIANO的架构提供支持,它核心解决多智能体交互问题,用于确保多个输出流的一致性。
11/5/2024 2:40:00 PM
量子位
Harrison Chase:独创AI智能体「认知架构」,定制+极简加减法双驱动
七月初,OpenAI 一篇博文让AI智能体的热潮席卷全球,业界对 AI 智能体的兴趣达到了一个新的高度。 首先要搞明白一个问题:AI 智能体和我们熟悉的 AI 助手到底有什么不同? 表面上看,它们似乎都是帮助我们完成任务的工具。
10/14/2024 10:18:00 AM
刘洁
吴恩达:多智能体协作是新关键,软件开发等任务将更高效
招很多智能体来帮我干活。前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。在软件开发领域,这些智能体展示了其独特的能力,能够高效协作,处理编程中的复杂问题,甚至进行代码自动生成。最新的技术动态显示,AI 智能通在软件开发中显示出巨大的潜力。还记得 Devin 吗?号称世界第一个 AI 软件工程师的它出场就惊艳到了我们,一
4/26/2024 2:33:00 PM
机器之心
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot