AI在线 AI在线

Agent

AI在《我的世界》PK盖楼,新旧Claude差距过于明显,网友:审美也是智力的一种

测评大模型Agent能力,从未如此直观。 新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼,差距不要太明显,引来大量围观。 图片如果让AI不断迭代,甚至能盖出一片建筑群。
11/15/2024 1:22:07 PM

Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

继Anthropic之后,OpenAI也要接管人类电脑了? ! 就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。
11/14/2024 6:40:57 PM

LLM-R:基于RAG和层次化Agent落地案例解析

在这个由智能设备主导的时代,维护工作的重要性愈发凸显,几乎成了生产活动的守护神。 想象一下,当一台精密的机器在深夜突发故障,而维护手册却像天书一样难以理解,这时,交互式电子技术手册(IETMs)就像一束温暖的灯塔,指引着维护人员安全渡过难关。 面对从图形用户界面(GUIs)到自然语言用户界面(LUIs)的转变,以及复杂逻辑关系的梳理,传统的IETMs显得有些力不从心。
11/14/2024 6:39:23 PM
哎呀AIYA

Agent不是被卡住了,其实在思考

在与用户进行自然对话时,智能体承担着两大核心任务:一是流畅的对话交流,二是精准的推理与规划。 智能体必须整合所有可用信息以作出回应,同时确保其行为始终围绕既定目标展开。 基于人类“快速思考”和“慢速思考”的认知系统灵感,丹尼尔·卡尼曼提出了一个全新的架构Talker-Reasoner,旨在模拟人类的这两种思维模式。
11/7/2024 8:28:53 AM
哎呀AIYA

谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设备,有望挽回数十亿美元损失

AI 首次发现真实世界中的重大安全漏洞? SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。 莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?
11/2/2024 1:32:26 PM
清源

阿里达摩院开源 CoI-Agent:一键生成科研 idea 的 AI 研究助手

阿里巴巴达摩院本月开源了一款名为 CoI-Agent 的 AI 工具,旨在帮助科研人员自动生成科研想法。 这款工具通过输入特定的论文主题,能够迅速生成相关的科研 idea,从而节省科研人员的时间,提高工作效率。 只需输入一个主题,CoI-Agent 就能生成一系列相关的关键词、研究问题和研究方法。
10/25/2024 11:00:56 AM
汪淼

微软连发 10 个 AI 智能体,纳德拉硬刚 Salesforce CEO

就在刚刚,纳德拉亲自宣布:微软一口气发布 10 个 AI Agent!这 10 个 AI Agent 将在 Dynamics 365 中开放,帮助销售、服务、财务和供应链团队提升业务价值,让企业的整体运营更上一层楼。在今年晚些时候,它们就将提供公共预览版。
10/22/2024 6:36:25 PM
汪淼

把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了

把《我的世界》交给大模型,会怎么样?GPT-4o 鲨牛宰羊,Claude3.5 不停在人类身旁放炸药包和敌人,还把家拆了。GPT-4o mini 玩《我的世界》belike: 来到游戏里面,GPT-4o mini(玩家 karolina)一开始还蛮礼貌的:你好世界!
10/21/2024 1:11:17 PM
清源

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]
9/30/2024 2:14:00 PM
机器之心

新「AI科学家」?MIT整合多智能体,实现材料科学研究自动化

编辑 | 萝卜皮人工智能(AI)的一个关键挑战是:如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中,麻省理工学院(Massachusetts Institute of Technology)原子与分子力学实验室(LAMM)的研究人员提出了 SciAgents,一种可以整合利用三个核心概念的方法:(1)使用大规模本体知识图谱来组织和互连不同的科学概念;(2)一套大型语言模型(LLM)和数据检索工具;(3)具有现场学习能力的多智能体(agent)
9/27/2024 5:41:00 PM
ScienceAI

OpenAI 朝 AI 第 3 阶段迈进,正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后,下一步会怎么走?该公司研究员诺姆・布朗(Noam Brown)在 X 平台给出了答案,组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,解决人类水平问题的人工智能第三级:智能体,能够代表用户采取行动的人工智能第四级:创新
9/21/2024 12:10:50 PM
故渊

微软发布 Windows Agent Arena 基准框架,评估 AI Agents 运行主流 Windows 应用性能

科技媒体 NeoWin 昨日(9 月 14 日)发布博文,报道称微软官方推出了 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能。Windows Agent Arena 基准框架微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程应用,记事本、时钟和画图等预装 Windows 应用,VLC 等主流
9/15/2024 10:04:37 AM
故渊

荣耀赵明:苹果的 AI 方案会让整个行业更清醒一点,只集成第三方功能不能称为 AI 手机

荣耀 CEO 赵明在 IFA 2024 上宣布,推出行业首个跨应用开放生态智能体(AI Agent)。据AI在线此前报道,荣耀 Magic 7 手机将首发搭载荣耀 AI Agent。“与苹果的封闭系统相比,在中国的互联网和 AI 服务生态下,开放的生态更容易与海量的互联网 AI 服务相结合。”赵明表示:“未来我们跟微软、谷歌和其他的互联网合作伙伴以及 AI 合作伙伴都会持续合作。”谈及苹果的 AI 路径,赵明认为,“苹果的 AI 解决方案会让整个行业更清醒一点,如果手机厂商只是集成了诸如第三方 AI 翻译之类的功能
9/8/2024 8:29:11 PM
沛霖(实习)

英伟达推出 NIM Agent Blueprints 服务,加速企业创建 AI 应用

感谢英伟达昨日(8 月 27 日)发布新闻稿,宣布联合全球合作伙伴,推出全新的 NIM Agent Blueprints 服务,帮助企业打造自己的 AI 体验。AI在线援引英伟达新闻稿内容,NIM Agent Blueprints 服务是预训练、定制 AI 工作流程(workflows)的目录,可为数百万企业开发人员提供一整套软件,用于构建和部署典型用例的生成式人工智能应用,例如客户服务化身、检索增强生成和药物发现虚拟筛选等等。NIM Agent Blueprints 助推开发人员使用 1 个或者多个 AI Age
8/28/2024 10:23:43 AM
故渊

汇智智能CarrotAI大模型通过大模型服务备案

近日,由江苏汇智智能数字科技有限公司(以下简称汇智智能)自主研发的CarrotAI大模型通过国家大模型服务备案(上线备案号:Jiangsu-CarrotAI-202407030002)。作为南京第4家,江苏省第7家通过大模型服务备案的科创企业,此次备案的通过意味着汇智智能将面向大模型行业上下游伙伴、客户提供更有力的软硬件联合优化服务,从而推动生成式人工智能行业的可持续发展。而就在不久前,汇智智能自主研发的文本生成算法通过《第六批深度合成服务算法》备案,双备案的通过更是对汇智智能在人工智能领域的深厚积累和创新实力的认
7/30/2024 2:26:00 PM
新闻助手

有效评估Agent实际表现,新型在线评测框架WebCanvas来了

当 LLM Agent 踏入真实的在线网络世界时,它们的表现能否如预期般游刃有余?
7/17/2024 3:00:00 PM
机器之心

智能化软件开发2.0 | aiXcoder落地Agent技术,聚焦企业项目级代码生成场景

基于大模型的AI Agent,作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术,正在重塑软件开发流程,引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究,先后发表了多篇相关论文【1,2,3,4】,是全球第一批研究通过大模型+工具调用去解决项目级代码生成问题的团队,为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果,结合多年来为各行业落地个性化企业代码大模型的实践经验,aiXcoder
7/16/2024 2:54:00 PM
新闻助手

容联云发布容犀大模型应用矩阵,助力产业数智化升级

7月6日,在2024世界人工智能大会上,容联云成功举办主题为“数智聚合 产业向上”的生成式应用与大模型商业化实践论坛。论坛上,容联云发布了容犀智能大模型应用升级,该系列应用包括容犀Agent Copilot、容犀Knowledge Copilot、容犀Coach Agent、容犀Insight Agent和容犀Virtual Agent等,覆盖了从营销、销售、服务到企业内部管理的核心场景,为企业打造全面、高效的营销服智能化生态系统。同时,现场还发布了大模型赋能下的以客户为中心的运营中台ELITE MOS,为企业提供
7/8/2024 9:56:00 AM
新闻助手