智能体
微软联手谷歌力推 A2A 开放协议,AI 智能体实现跨云跨平台无缝协作
微软公司今天(5 月 8 日)发布博文,宣布支持谷歌的全新开放智能体协议 Agent2Agent(A2A),将在其 Azure AI Foundry 和 Copilot Studio 将整合该协议,推动跨云、跨组织协作。
OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!
王鸿儒目前就读于香港中文大学博士四年级 (预计今年7月毕业),导师为黄锦辉教授,研究方向主要包括对话系统,工具学习以及大语言模型智能体等,英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者,在国际顶级会议如NeurIPS, ACL, EMNLP等发表30余篇相关论文,其中包括10多篇一作或共一论文,代表工作有Cue-CoT, SAFARI, AppBench, Self-DC, OTC等,谷歌学术引用超600次,NeurIPS Area Chair以及多个国际顶级会议审稿人,NICE社区初创成员,曾获得国际博士生论坛最佳论文奖,ACL 2024@SIGHAN 最佳论文奖,WWW2024 Online Safety Prize Challenge冠军等多项荣誉。 Agent 即一系列自动化帮助人类完成具体任务的智能体或者智能助手,可以自主进行推理,与环境进行交互并获取环境以及人类反馈,从而最终完成给定的任务,比如最近爆火的 Manus 以及 OpenAI 的 o3 等一系列模型和框架。 强化学习(Reinforcement Learning)被认为是当下最具想象力、最适合用于 Agent 自主学习的算法。
微软将大量AI功能、智能体集成在Windows11,全民AI时代来了
今天凌晨,微软在官网发布了以AI为主题的新版Windows 11。 本次集成的AI功能非常多,涵盖搜索、设置、文件管理、画图、截图、Copilot等,同时还推出了以Copilot PC为主的全新Surface商务笔记本。 下面「AIGC开放社区」将根据官方内容为大家详细解读这些功能。
成熟的编程智能体,已经学会升级自己的系统了
编程智能体,几乎成为了 2025 年最热门的话题之一。 不管是学术机构还是工业界,都在寻找更高效的落地路径。 机器学习领域的历史经验表明,手工设计的解决方案最终会被学习到的解决方案所取代。
新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即
编程智能体能完成的任务量,正以爆炸式的速度增长! 而且,这一趋势还在加速。 2024到2025年,它们的任务处理能力每4个月翻一倍;而在2019到2025年,这个翻倍周期则是7个月。
新・摩尔定律诞生:AI 智能体能力每 4 个月翻一番,“智能爆炸”在即
2024 到 2025 年,它们的任务处理能力每 4 个月翻一倍;而在 2019 到 2025 年,这个翻倍周期则是 7 个月。
AI杀手级应用有苗头了,自主使用操作系统Agent智能体,开源!
最近微软开源了一个 Agent 叫 UFO,通过自然语言指令实现 Windows 操作系统上的自动化任务操作。 图片之前我们分享的 Agent 大多是自主使用浏览器,而 UFO 更进了一步,可以使用操作系统中的各种APP帮你完成任务。 下面是 UFO 的架构图UFO² architecture可以看到,它是一个多Agent系统,中间的 HostAgent 用来解析用户的自然语言,启动必要的应用程序。
微软高管乐观预测:未来每个人都可以是“AI 员工”的领导
微软预测,未来企业将出现一种全新形态——即所谓的“前沿企业”,由人类员工指挥自主运行的智能体完成各类任务。
微软发布2025工作趋势:每位员工将是Agent老板
微软在官网发布了2025年工作趋势指数报告,主要分析了来自中国、美国、澳大利亚、巴西、加拿大等全球31个国家/地区的31,000家企业。 同时结合了Linked劳动力市场趋势,数万亿个Microsoft365生产力信号,以及原生初创企业、学者、经济学家、科学家和思想领袖的意见。 结果显示,由Agent智能体 人类的“人机协作”模式正在重塑企业架构,一种全新形态的“前沿公司”诞生。
智能体 Agent 与工作流构建实战指南:从选型决策到高效实施
作者 | fred历经多个业务系统的构建,我深感Anthropic的《Build effective agents》一文与自身实战经历高度契合。 本文在详解工作流与Agent的技术选型标准、设计模式应用及实施要点的同时,也融入了我的实战心得与实践经验总结。 无论您正考虑构建工作流系统还是Agent系统,都能在此找到适合场景的最佳实践方案。
AI无边界:通过MCP实现不同智能体框架的协作(含代码)
在人工智能飞速发展的当下,智能体框架如雨后春笋般不断涌现。 从LangChain利用高度抽象的方式构建智能体,到CAMEL - AI为用户提供细致配置选项来创建智能体,不同框架各显神通。 但这些框架之间就像说着不同“方言”的个体,彼此沟通困难重重。
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。 如何将这种深度推理模型扩展到智能体和具身领域,让机器人通过思考和推理来完成复杂具身交互等任务? 近期,来自浙江大学、中科院软件所和阿里巴巴的团队提出了 Embodied-Reasoner,让机器人或智能体拥有深度思考和交互决策能力,从而在真实物理世界完成环境探索、隐藏物体搜索、交互和搬运等长序列复杂任务。
百度发布AI开放计划,助力开发者全面拥抱 MCP
在百度 Create 开发者大会上,百度创始人李彦宏宣布了一系列重要的 AI 发展计划和举措,积极拥抱 AI 应用井喷时代,为开发者提供全方位支持。 百度搜索开放平台正式发布 “AI 开放计划”(sai.baidu.com),旨在通过建立多样的内容和服务分发机制,为用户提供更全面的 AI 服务。 该计划将面向智能体、H5、小程序、独立 App 等不同形态的 AI 应用开放,不仅满足用户对最新最全 AI 服务的需求,还为开发者带来显著的流量和收益潜力。
机械臂+大模型+多模态:打造人机协作具身智能体
在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
智能体的五大商业用例
AI的下一代已经到来,它具有自主性。 智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。 去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .
大学文凭成废纸?AI暴击美国00后!他哥大退学成千万富翁,我却还要还学贷
摊牌了,不装了,美国的Z时代已经对上大学彻底不耐烦了。 现在,他们喊出这样的宣言:有了ChatGPT,大学文凭已经彻底成了一张废纸! 纯粹就是浪费时间和金钱。
从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手
该研究成果由北京大学和加州大学洛杉矶分校共同完成。 第一作者蔡少斐为北京大学三年级博士生,通讯作者为北京大学助理教授梁一韬。 该工作基于 MineStudio 开源项目,一个全流程简化版 Minecraft AI Agent 开发包,相关代码均已在 GitHub 上开源。
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!
OpenAI,正引领生成式AI的革命浪潮。 这家公司如何确立行业领先地位? 又采取了哪些策略保持竞争优势?
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉