AI在线 AI在线

智能体

扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

环境生成模型(generative models of environments),也可以叫世界模型(world model),在「通用智能体规划」和「推理环境」中的关键组成部分,相比传统强化学习采样效率更高。 但世界模型主要操作一系列离散潜在变量(discrete latent variables)以模拟环境动态,但这种压缩紧凑的离散表征有可能会忽略那些在强化学习中很重要的视觉细节。 日内瓦大学、爱丁堡大学的研究人员提出了一个在扩散世界模型中训练的强化学习智能体DIAMOND(DIffusion As a Model Of eNvironment Dreams),文中分析了使扩散模型适应于世界建模(world modeling)所需的设计要素,并展示了如何通过改善视觉细节来提高智能体的性能。
11/18/2024 2:35:00 PM
新智元

Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟

受 ChatGPT 强大问答能力的影响,大型语言模型(LLM)提供商往往优化模型来回答人们的问题,以提供良好的消费者体验。 随着智能体研究日趋成熟,优化似乎有了新的方向。 人工智能著名学者、斯坦福大学教授吴恩达今天指出:「现在有一种趋势是优化模型以适应智能体工作流程,这将为智能体性能带来巨大提升」,并撰写一篇博客简单阐述了这种趋势。
11/15/2024 1:16:00 PM
机器之心

Meta最新!PARTNR:具身多智能体任务中规划与推理的基准测试框架

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&出发点本文提出了一个人机协作中的规划与推理任务基准(PARTNR),旨在研究家庭活动中的人机协调。 PARTNR任务展现了日常任务的特点,如空间、时间和异构agent能力约束。
11/14/2024 10:40:00 AM
具身智能之心

李彦宏:不是要一个“超级应用”,是要打造数百万“超级有用”的应用​

“过去24个月,AI行业的最大变化是什么? 是大模型基本消除了幻觉。 ”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
11/12/2024 11:26:50 AM

玩转「智能体魔方」!清华推出AgentSquare模块化搜索框架,开启AI智能体高速进化时代

优秀基因的演化和重组,是生命体适应环境、永葆活力的自然法则。 AI智能体能否像有机生命一样,实现适应任务环境的高效自我演化? 大模型智能体的快速发展在数学、医疗、个人助手等各领域产生了突破性应用,但依赖专家知识的手工设计方法制约了它们的任务自适应能力。
11/8/2024 9:20:00 AM
新智元

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

北大校友打造的1000个智能体「我的世界」,背后原理揭晓了! 团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……其中最精彩的,当数团队整活儿:让牧师NPC引入虚拟宗教,最后发现该宗教在500个智能体(横跨6大城乡)中进行了广泛传播。 据介绍,项目整体由一个名为PIANO的架构提供支持,它核心解决多智能体交互问题,用于确保多个输出流的一致性。
11/5/2024 2:40:00 PM
量子位

Harrison Chase:独创AI智能体「认知架构」,定制+极简加减法双驱动

七月初,OpenAI 一篇博文让AI智能体的热潮席卷全球,业界对 AI 智能体的兴趣达到了一个新的高度。 首先要搞明白一个问题:AI 智能体和我们熟悉的 AI 助手到底有什么不同? 表面上看,它们似乎都是帮助我们完成任务的工具。
10/14/2024 10:18:00 AM
刘洁

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

招很多智能体来帮我干活。前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。在软件开发领域,这些智能体展示了其独特的能力,能够高效协作,处理编程中的复杂问题,甚至进行代码自动生成。最新的技术动态显示,AI 智能通在软件开发中显示出巨大的潜力。还记得 Devin 吗?号称世界第一个 AI 软件工程师的它出场就惊艳到了我们,一
4/26/2024 2:33:00 PM
机器之心