AI在线 AI在线

微软发布全新Agent操作系统UFO² ,深度整合Windows与智能自动化

作者:AI在线
2025-04-27 10:00
近日,微软宣布重磅升级其开源项目 AgentUFO,推出了全新的 UFO² 版本,该版本新增了操作系统功能,并与 Windows 系统实现了深度集成。 此举不仅增强了自动化任务的执行效率,还使得用户能够更便捷地进行复杂操作。 UFO² 的一个显著特点是其能够直接调用 Windows 的原生 API 和 COM 接口。

近日,微软宣布重磅升级其开源项目 AgentUFO,推出了全新的 UFO² 版本,该版本新增了操作系统功能,并与 Windows 系统实现了深度集成。此举不仅增强了自动化任务的执行效率,还使得用户能够更便捷地进行复杂操作。

QQ_1745715630574.png

UFO² 的一个显著特点是其能够直接调用 Windows 的原生 API 和 COM 接口。这种方式相比传统的机器人流程自动化(RPA),能够在执行复杂业务时更加高效且精准。例如,在 Excel 中将表格数据转换为图表,传统 RPA 需要模拟多次点击鼠标,而 UFO² 则可以通过一次 API 调用轻松完成,避免了视觉定位和鼠标模拟的繁琐。

通过测试数据显示,UFO² 在自动化任务的成功率方面,显著高于 OpenAI 的 Operator。在不同的测试场景中,UFO² 的成功率分别达到了30.5% 和32.7%,而 Operator 的成功率仅为20.8% 和14.3%。此外,UFO² 在处理复杂任务和跨应用操作的表现上也明显优于 Operator,其在非标准界面的适应性更强。

QQ_1745715651841.png

UFO² 的核心控制组件 HostAgent 负责解析用户指令、管理应用程序生命周期和协调 AppAgents 的执行。当用户通过自然语言发出自动化指令时,HostAgent 会将任务分解为一系列子任务,并将其分配给相应的 AppAgents 执行。

每个 AppAgent 专注于特定的 Windows 应用程序,能够以更高的效率执行任务。UFO² 还引入了混合控制检测机制,结合视觉输入与应用程序的元数据,提升了系统对 GUI 元素的感知能力。这一创新使得 AppAgent 能够在标准和非标准环境中都能稳定工作。

另一个值得注意的创新是 UFO² 的画中画模式。这一功能实现了自动化任务与用户主桌面的隔离,用户可以在主桌面上正常操作,而自动化任务则在独立的虚拟桌面中运行。这种设计提升了用户体验,降低了系统干扰和潜在安全风险。

UFO² 的这些新功能展现了微软在自动化领域的最新技术进步,为用户提供了更加高效、灵活的工作环境。

开源地址:https://github.com/microsoft/UFO?tab=readme-ov-file

划重点:

1. 🚀 UFO² 与 Windows 系统深度集成,能直接调用原生 API,提升自动化效率。

2. 📊 UFO² 的自动化任务成功率显著高于 OpenAI 的 Operator,表现出色。

3. 🖥️ 新增的画中画模式实现自动化任务与用户操作的隔离,提升用户体验。

相关标签:

相关资讯

RPA界面元素智能自适应定位与操控技术-金克

本文详细了RPA界面元素的应用技术及其优缺点
12/20/2022 3:29:00 PM
达观数据

从RPA到智能体:智能自动化迎来革命性飞跃

在过去的一年里,自动化竞赛愈演愈烈,智能体已成为提升企业效率的终极变革者。 虽然GenAI工具在过去三年里取得了显著进步,成为企业工作流程中的宝贵助手,但现在焦点正转向能够自主思考、行动和协作的智能体。 对于准备迎接下一波智能自动化浪潮的企业而言,了解从聊天机器人到检索增强生成(RAG)应用再到自主多智能体的飞跃至关重要。
12/17/2024 11:56:17 AM
Rohan Sharma

从RPA到AI Agent:五种agent模式全解析,搭配两个实践项目介绍(text2SQL、流水解析)

24年年末Anthropic公司发布那篇Building effective agents的Blog,无疑是 AI Agent的入门必读文章之一。 其中反复强调了,最成功的应用案例并非依赖复杂的框架或专业的库,而是采用了简单且可组合的模式,个人实践下来,深以为然。 复制本篇结合个人近期的相关项目或者比赛经验,为大家就其中的五种agent模式应用实践做下分享,正文特意避免了过多技术细节,专注于核心概念和实际案例,可放心使用。
2/24/2025 9:04:20 AM
韦东东
  • 1