AI在线 AI在线

IBM 发布 CUGA:一款开源 AI 助手,任务完成率超六成

近日,IBM 研究人员推出了一款名为 CUGA 的开源 AI 助手,旨在自动化复杂的企业工作流程,并能完成超过一半的任务。 CUGA 代表 “可配置通用代理”,该软件通过多代理编排、API 集成和代码生成等功能,力求帮助知识工作者更高效地处理日常或复杂的工作。 根据 IBM 研究团队的描述,CUGA 的设计目标是让知识工作者能够安全、可靠地配置和调整该代理,以满足他们的工作需求。

近日,IBM 研究人员推出了一款名为 CUGA 的开源 AI 助手,旨在自动化复杂的企业工作流程,并能完成超过一半的任务。CUGA 代表 “可配置通用代理”,该软件通过多代理编排、API 集成和代码生成等功能,力求帮助知识工作者更高效地处理日常或复杂的工作。

根据 IBM 研究团队的描述,CUGA 的设计目标是让知识工作者能够安全、可靠地配置和调整该代理,以满足他们的工作需求。虽然市场上对于 AI 代理的安全性和可靠性存有疑虑,但 IBM 依然看好自动化的前景,并致力于提升工作效率。

CUGA 在 WebArena 和 AppWorld 基准测试中取得了61.7% 的网页任务完成率和48.2% 的 API 任务完成率。这些得分虽然不算高,但在当前 AI 代理技术中已算是顶尖表现。IBM 并未使用自己的企业专用测试标准 WebAgentBench 来评估 CUGA,这引发了一些关注。

通过对比其他 AI 代理的表现,CUGA 的得分显示出 AI 技术的进步。例如,其他代理在类似测试中平均完成率仅为24.4%。IBM 的研究团队指出,企业工作流程通常涉及多项政策的同时适用,因此 CUGA 需要具备更强的政策合规能力。

CUGA 的结构设计上,首先通过对用户意图的分析来理解输入的任务,然后将任务分解为多个子任务,并进行动态的重新规划。这样,CUGA 能将特定子任务分配给专业代理处理,从而确保结果尽可能符合企业的政策。

该系统还与 Langflow 低代码平台兼容,并支持多种开源模型的集成。尽管 CUGA 在实际应用中可能还存在一些小问题,比如偶尔无法正常退出运行循环,但 IBM 强调,用户在使用 AI 代理软件时应保持合理的期望。

划重点:  

🌟 CUGA 是一款开源 AI 助手,旨在自动化复杂的企业工作流程。  

📊 CUGA 在基准测试中取得61.7% 的任务完成率,显示出 AI 代理技术的进步。  

🔧 CUGA 支持动态任务分解和多种开源模型,有望提高工作效率。

相关资讯

IBM CEO:DeepSeek 证明我们是正确的,小型且高效的模型同样能有实际成果

“历史早有先例。计算机发展早期,存储和计算能力的成本高得惊人。然而,随着技术进步和规模效应,这些成本迅速下降,推动了计算机的普及和创新。”
2/7/2025 7:56:57 AM
清源

IBM发布视觉语言模型Granite-Vision-3.1-2B,轻松解析复杂文档

随着人工智能技术的不断发展,视觉与文本数据的融合成为了一项复杂的挑战。 传统的模型往往难以准确解析表格、图表、信息图和图示等结构化视觉文档,这一限制影响了自动内容提取和理解能力,进而影响了数据分析、信息检索和决策等应用。 面对这一需求,IBM 近期发布了 Granite-Vision-3.1-2B,一款专为文档理解设计的小型视觉语言模型。
2/8/2025 4:45:00 PM
AI在线

IBM与欧莱雅联合开发AI模型 打造智能化妆品

在全球化妆品行业日益关注可持续发展的背景下,IBM 与法国美容巨头欧莱雅宣布达成战略合作,联合开发一个专门针对化妆品行业的生成式人工智能基础模型。 这一合作旨在提高欧莱雅在可持续原材料使用方面的效率,减少生产过程中的能源和材料浪费。 IBM 表示,该模型将利用其先进的生成式人工智能技术,结合欧莱雅的丰富化妆品配方数据。
1/24/2025 11:14:00 AM
AI在线