Agent
把 AI 放进《我的世界》服务器:GPT-4o 杀牛宰羊,Claude3.5 把家拆了
把《我的世界》交给大模型,会怎么样?GPT-4o 鲨牛宰羊,Claude3.5 不停在人类身旁放炸药包和敌人,还把家拆了。GPT-4o mini 玩《我的世界》belike: 来到游戏里面,GPT-4o mini(玩家 karolina)一开始还蛮礼貌的:你好世界!
10/21/2024 1:11:17 PM
清源
端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
9/30/2024 2:14:00 PM
机器之心
新「AI科学家」?MIT整合多智能体,实现材料科学研究自动化
编辑 | 萝卜皮人工智能(AI)的一个关键挑战是:如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中,麻省理工学院(Massachusetts Institute of Technology)原子与分子力学实验室(LAMM)的研究人员提出了 SciAgents,一种可以整合利用三个核心概念的方法:(1)使用大规模本体知识图谱来组织和互连不同的科学概念;(2)一套大型语言模型(LLM)和数据检索工具;(3)具有现场学习能力的多智能体(agent)
9/27/2024 5:41:00 PM
ScienceAI
OpenAI 朝 AI 第 3 阶段迈进,正招募人才组建“多智能体”团队
OpenAI 在发布 o1 AI 模型之后,下一步会怎么走?该公司研究员诺姆・布朗(Noam Brown)在 X 平台给出了答案,组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表,最新推出的 o1 模型处于第二阶段,即所谓的“推理者”(reasoners),而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,解决人类水平问题的人工智能第三级:智能体,能够代表用户采取行动的人工智能第四级:创新
9/21/2024 12:10:50 PM
故渊
微软发布 Windows Agent Arena 基准框架,评估 AI Agents 运行主流 Windows 应用性能
科技媒体 NeoWin 昨日(9 月 14 日)发布博文,报道称微软官方推出了 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能。Windows Agent Arena 基准框架微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程应用,记事本、时钟和画图等预装 Windows 应用,VLC 等主流
9/15/2024 10:04:37 AM
故渊
荣耀赵明:苹果的 AI 方案会让整个行业更清醒一点,只集成第三方功能不能称为 AI 手机
荣耀 CEO 赵明在 IFA 2024 上宣布,推出行业首个跨应用开放生态智能体(AI Agent)。据AI在线此前报道,荣耀 Magic 7 手机将首发搭载荣耀 AI Agent。“与苹果的封闭系统相比,在中国的互联网和 AI 服务生态下,开放的生态更容易与海量的互联网 AI 服务相结合。”赵明表示:“未来我们跟微软、谷歌和其他的互联网合作伙伴以及 AI 合作伙伴都会持续合作。”谈及苹果的 AI 路径,赵明认为,“苹果的 AI 解决方案会让整个行业更清醒一点,如果手机厂商只是集成了诸如第三方 AI 翻译之类的功能
9/8/2024 8:29:11 PM
沛霖(实习)
英伟达推出 NIM Agent Blueprints 服务,加速企业创建 AI 应用
感谢英伟达昨日(8 月 27 日)发布新闻稿,宣布联合全球合作伙伴,推出全新的 NIM Agent Blueprints 服务,帮助企业打造自己的 AI 体验。AI在线援引英伟达新闻稿内容,NIM Agent Blueprints 服务是预训练、定制 AI 工作流程(workflows)的目录,可为数百万企业开发人员提供一整套软件,用于构建和部署典型用例的生成式人工智能应用,例如客户服务化身、检索增强生成和药物发现虚拟筛选等等。NIM Agent Blueprints 助推开发人员使用 1 个或者多个 AI Age
8/28/2024 10:23:43 AM
故渊
汇智智能CarrotAI大模型通过大模型服务备案
近日,由江苏汇智智能数字科技有限公司(以下简称汇智智能)自主研发的CarrotAI大模型通过国家大模型服务备案(上线备案号:Jiangsu-CarrotAI-202407030002)。作为南京第4家,江苏省第7家通过大模型服务备案的科创企业,此次备案的通过意味着汇智智能将面向大模型行业上下游伙伴、客户提供更有力的软硬件联合优化服务,从而推动生成式人工智能行业的可持续发展。而就在不久前,汇智智能自主研发的文本生成算法通过《第六批深度合成服务算法》备案,双备案的通过更是对汇智智能在人工智能领域的深厚积累和创新实力的认
7/30/2024 2:26:00 PM
新闻助手
有效评估Agent实际表现,新型在线评测框架WebCanvas来了
当 LLM Agent 踏入真实的在线网络世界时,它们的表现能否如预期般游刃有余?
7/17/2024 3:00:00 PM
机器之心
智能化软件开发2.0 | aiXcoder落地Agent技术,聚焦企业项目级代码生成场景
基于大模型的AI Agent,作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术,正在重塑软件开发流程,引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究,先后发表了多篇相关论文【1,2,3,4】,是全球第一批研究通过大模型+工具调用去解决项目级代码生成问题的团队,为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果,结合多年来为各行业落地个性化企业代码大模型的实践经验,aiXcoder
7/16/2024 2:54:00 PM
新闻助手
容联云发布容犀大模型应用矩阵,助力产业数智化升级
7月6日,在2024世界人工智能大会上,容联云成功举办主题为“数智聚合 产业向上”的生成式应用与大模型商业化实践论坛。论坛上,容联云发布了容犀智能大模型应用升级,该系列应用包括容犀Agent Copilot、容犀Knowledge Copilot、容犀Coach Agent、容犀Insight Agent和容犀Virtual Agent等,覆盖了从营销、销售、服务到企业内部管理的核心场景,为企业打造全面、高效的营销服智能化生态系统。同时,现场还发布了大模型赋能下的以客户为中心的运营中台ELITE MOS,为企业提供
7/8/2024 9:56:00 AM
新闻助手
英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」
作者丨赖文昕 马蕊蕾编辑丨陈彩娴大模型浪潮一起,被视为是大模型最佳载体的机器人,热度也随之飙升,「具身智能」这个在1950年由艾伦·图灵提出的概念,时隔75年再次成为了 AI 界的宠儿。 2024年才过去不到半年,AI 圈就迎来了 Sora、Claude 3、Devin、GPT-4o 等数颗重磅炸弹,文生视频、AI Agent(智能体)、多模态等多个方向都有了显著的进展。 但显然,与屡爆惊喜的模型、应用不同,更「硬」的「具身智能」在产业界掀起商业化与资本狂潮的同时,也面临着需要冷静的现实:大模型并未在行业中得到广泛应用。
6/4/2024 2:38:00 PM
赖文昕
超越Devin,姚班带队OpenCSG创造大模型编程新世界纪录
来自中国大模型初创公司OpenCSG推出的StarShip CodeGen Agent,以23.67%的成绩刷新了普林斯顿SWEBench(大模型真实独立编程评测)排行榜,取得了全球第二名的成绩,同时创造了非GPT-4o基模的最高纪录(SOTA)。SWEBench评测高度贴近真实编程场景,难度极高,不仅要求模型能理解需求、协调多个函数/类甚至文件的变更,还要求模型与执行环境交互,处理超长上下文并执行远超传统代码生成任务的复杂逻辑推理。在这种高难度的真实测试中,行业中最先进的GPT4和Devin,也仅能解决1.74%
5/31/2024 9:30:00 AM
新闻助手
独角兽也卷不动了:AI Agent初创Adept被爆考虑出售
机器之能报道编辑:Sia越来越多的生成AI公司考虑加入出售的行列。据 Theinformation 消息,近几个月,AI 独角兽 Adept 领导层与科技巨头公司就出售或战略合作可能性进行了谈判。Adept 是一家由前 OpenAI 和谷歌 AI 开发人员创立的 AI 公司,专注于 AI Agent ,成立仅两年。Adept 去年 3 月完成新一轮融资后,估值已超 10 亿美元。消息人士称,Adept 曾与 Meta 接触,尽管收购的可能性不大。越来越多的生成 AI 公司在考虑出售可能性。AI 硬件公司 Human
5/24/2024 6:49:00 PM
机器之能
贾扬清、林咏华、刘威等嘉宾出席 Keynote 演讲,AICon 于 5月17日落地北京,五大看点值得期待
大模型的崛起为众多企业带来了新的增长机遇,尤其是中小型企业找到了更优解决方案,提升了产品体验甚至引发了颠覆性创新。各行各业都在悄然改变中,建筑业利用大模型设计装修方案,金融领域则运用它进行营销推荐,汽车业也在改变交互方式等等。甚至股神巴菲特都将人工智能与核武器相提并论,可见大模型的出现备受瞩目。如何将大模型应用于企业,是许多人关注的焦点。InfoQ将于5月17日至18日举办AICon全球人工智能开发与应用大会暨大模型应用生态展·2024,此次会议面向工程师、产品经理、数据分析师等人群,将深入探讨大模型的开发与应用实
5/9/2024 3:00:00 PM
新闻助手
面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程
近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资完成后,面壁智能将进一步推进优秀人才引入,加固大模型发展的底层算力与数据基础,持续引领「高效大模型」路线,推动大模型高效训练、快步应用落地。本轮由光源资本担任独家财务顾问。依托于扎实的原创性AI技术底蕴,面壁智能是世界范围内对「高效大模型」探索最为前列的大模型团队之一,目前已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局。核心研发团队脱胎于清华NLP实验室,拥有中国
4/11/2024 4:42:00 PM
新闻助手
定位“神队友”,谷歌发布 SIMA 模型:具备约 600 项游戏技能
谷歌 DeepMind 团队近日发布了 SIMA 模型,通过训练和学习游戏技能,让其整体操作风格更接近于人类。SIMA 的全称是“Scalable, Instructable, Multiworld Agent”(可扩展、可指导、多世界 Agent),目前仅处于研究阶段,未来可以和你一起玩游戏。SIMA 的定位并非是游戏中的 AI NPC,而是要成为你的队友,默契配合你的操作。SIMA 结合自然语言和图像识别技术,能够理解 3D 游戏世界,希望能成为玩家的默契队友。谷歌与 Hello Games、Embracer、
3/14/2024 8:26:30 AM
故渊
从框架到经典方法,全面了解分布式深度强化学习DDRL
本文在回顾分布式深度强化学习 DDRL 基本框架的基础上,重点介绍了 IMPALA 框架系列方法。AlphaGo 是一个在人机博弈中赢得众多职业围棋手的 agent 机器人。随着 AlphaGo 的突破,深度强化学习(Deep Reinforcement Learning,DRL)成为一种公认的解决连续决策问题的有效技术。人们开发了大量算法来解决介于 DRL 与现实世界应用之间的挑战性问题,如探索与开发困境、数据低效、多 agent 合作与竞争等。在所有这些挑战中,由于 DRL 的试错学习机制需要大量交互数据,数据
2/15/2024 4:17:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
英伟达
Anthropic
代码
算法
训练
Stable Diffusion
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
Agent
机器学习
研究
生成
AI for Science
xAI
计算
人形机器人
AI视频
Sora
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
RAG
字节跳动
具身智能
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
安全