AI在线 AI在线

噱头大于实用?深度测评3款人气超高的AI智能体产品

关于 Manus 这类产品,我想说.... 从 Manus 发布至今,围绕着这类通用型智能体的讨论从没停过。 如今,在舆情平息的时候,我们觉得是时候好好评价一下这类产品了。

噱头大于实用?深度测评3款人气超高的AI智能体产品

关于 Manus 这类产品,我想说...

从 Manus 发布至今,围绕着这类通用型智能体的讨论从没停过。如今,在舆情平息的时候,我们觉得是时候好好评价一下这类产品了。

全网爆火的Manus到底能做什么?超多演示案例来了!

关注科技 AI 圈的同学,在 3 月 6 号这天都被 Manus 刷屏了,那么他是个啥呢?

阅读文章 >

首先,我们称赞 Manus 这类产品的构建思路 —— 通过多模型协作,确实在向传说中的 “世界大模型” 靠近。但实际测试中却暴露不少问题:号称 “重新定义 AI 协作” 的 Manus,内测时生成 PPT 打不开 WPS、股票分析用错数据等。

这类产品的出现确实推动了行业讨论。但从实际可用性来看,目前多数通用智能体都像 Manus 一样 “噱头大于实用”。

以下是我们针对目前三款“通用 Agent”产品的主观评价:

总的来说,目前三款产品可用性不足,任务成功率低,文字相关能力与 LLM 原生功能无异,通用 Agent 附加价值有限。

一、能力对比

1. Manus

主观评分:☆☆

信息收集:可访问网页及读取其中的图片及pdf文档内容

噱头大于实用?深度测评3款人气超高的AI智能体产品

编程:接入Claude代码大模型

噱头大于实用?深度测评3款人气超高的AI智能体产品

PPT生成:可编辑,但质量较差

噱头大于实用?深度测评3款人气超高的AI智能体产品

图像生成:不支持

视频生成:不支持

资费:免费,1000积分/月;Starter/Pro,$39/$399月

噱头大于实用?深度测评3款人气超高的AI智能体产品

2. Genspark

主观评分:☆

信息收集:可访问网页及读取其中的图片及pdf文档内容

噱头大于实用?深度测评3款人气超高的AI智能体产品

编程:接入多种代码大模型混合使用

噱头大于实用?深度测评3款人气超高的AI智能体产品

PPT生成:使用代码方式写PPT,效果还可以,但不可编辑

噱头大于实用?深度测评3款人气超高的AI智能体产品

图像生成:直接接入Flux,ideogram等图像大模型

噱头大于实用?深度测评3款人气超高的AI智能体产品

视频生成:直接接入可灵,minimax等视频大模型

噱头大于实用?深度测评3款人气超高的AI智能体产品

资费:免费,200积分/日;Plus版,24.99美元/月

噱头大于实用?深度测评3款人气超高的AI智能体产品

3. 扣子空间

主观评分:☆

信息收集:可访问网页及读取其中的图片及pdf文档内容

噱头大于实用?深度测评3款人气超高的AI智能体产品

编程:接入豆包代码大模型

噱头大于实用?深度测评3款人气超高的AI智能体产品

PPT生成:视觉以及结构还可以,同时提供了PDF、PPT、文字三个版本,可二次编辑:

噱头大于实用?深度测评3款人气超高的AI智能体产品

图像生成:支持添加MCP拓展图片生成:

噱头大于实用?深度测评3款人气超高的AI智能体产品

视频生成:不支持

资费:目前完全免费,每日有4-5个任务限制

噱头大于实用?深度测评3款人气超高的AI智能体产品

一、Manus

1. 核心架构

基础模块:信息收集、信息分析、代码编写,无生成图片视频等多模态功能。

它通过多代理架构将任务拆分为规划、执行、验证等子模块,每个代理基于独立的语言模型或强化学习模型,通过 API 协同工作;

优势

  1. 工作流程条理性较强,先确定任务步骤,按步骤依次进行,;
  2. 推理过程所使用的文件均可以下载,推理流程较为透明;

劣势

  1. 需要魔法上网,对部分用户可能有使用门槛;
  2. 多模态能力较弱,缺乏图像处理等多模态工具;
  3. 工具集较为有限,严重依赖Python脚本,可以生成PPT格式的文件,但质量较差,无法二次编辑;
  4. 性能方面,推理过程较慢,从收集资料到生成分析文档总计要消耗近30min。

2. 代码生成

代码方面因为是直接调用了其他 LLM 模型,所以性能与其一致。以下是生成的前端页面。

噱头大于实用?深度测评3款人气超高的AI智能体产品

3. 多模态分析功能

对于图像有基本的分类功能,但是没有配置针对图像处理的模型,处理分析功能效果不好。

深度分析

收集信息,使用代码方式生成调研报告,并发布在网页,对于信源等搜索分析不全面,与其他 AI 工具无大异。

噱头大于实用?深度测评3款人气超高的AI智能体产品

二、Genspark

1. 核心架构

基础模块:AI 对话/生图/视频/翻译,沿用 ChatGPT、可灵等主流模型;

工具型智能体,5 类专业场景应用:综合智能体,深度研究智能体,事实核查智能体,数据表智能体,打电话智能体;

宣传中"80+工具"实际是基于“AI 聊天,AI 生图,AI 视频,翻译“等类型工具的排列组合。

优势

  1. 功能模块全面,包括AI搜索与浏览器、图片工作室、视频生成、深度研究等。
  2. 任务执行效率高,尤其在多轮对话和复杂任务处理上

劣势

  1. 需要魔法上网,对部分用户可能有使用门槛;
  2. 工具创新不足:超90%功能与竞品同质化,唯视频生成系独家配置(当前质量未达可用标准),尚未形成真实竞争力;
  3. 技术整合度低:多模型简单堆砌,缺乏深度调优;
  4. 营销与实际落差:概念智能体未突破传统Agent框架,格式转换等工具实为API封装

2. 综合分析能力

噱头大于实用?深度测评3款人气超高的AI智能体产品

实际使用流程与 Manus 一致,输入一个任务,Genspark 开始自动安排工作,完成后输出结果,生成 PPT 视觉效果还可以,但无法二次编辑修改。

3. AI 聊天

官方宣传其多模型集成系统(含 GPT-4、Claude3 及自研模型),但实测认为在常规对话、文本生成和信息检索等基础场景中,该系统表现与单一优质模型并无显著差异。

4. 图像生成

Genspark 会写一套提示词,然后使用 Flux 等公开模型(旧版模型)直接生成图片。生成效果差于直接使用生图工具。

噱头大于实用?深度测评3款人气超高的AI智能体产品

噱头大于实用?深度测评3款人气超高的AI智能体产品

5. 视频生成

视频生成模型使用的是可灵等开放模型,生成清晰度低,视频不稳定,消耗积分大,仅一次就消耗掉了当日所有免费积分,视频效果差于可灵等生视频工具。

噱头大于实用?深度测评3款人气超高的AI智能体产品

当视频在手机上无法加载,可前往PC查看。

三、扣子空间

1. 核心架构

Agent:

  1. 通用 agent:与 Manus 相似。
  2. 专家 agent:针对通用 agent 做了内置 prompt,目前是用户研究、股票分析。

两种主要模式:

  1. 探索模式:不可修改任务规划步骤。
  2. 规划模式:可修改 Ai 规划任务步骤内容。

支持接入图片生成 MCP 产出图片,基于豆包大模型可处理多模态数据。

优势

  1. 不需要魔法上网,目前完全免费;
  2. 提供探索和规划两种模式,用户可以修改agent规划的步骤细节内容;
  3. 支持MCP扩展,AI agent的能力边界被进一步扩展。

劣势

  1. 官方宣传的“各行各业的「领域专家」,目前只有两个,且无法使用规划模式调整执行任务内容。
  2. MCP扩展目前是固定列表且不支持自定义,应用空间有限。
  3. 性能上,依赖豆包模型的逻辑能力,复杂任务(如商业模型分析)易出现细节缺失,规划模式推理过程较慢,从暂时不具备可用性。
  4. 完成任务一段时间后无法进行二次对话,任务永远结束。
  5. Beta版本全免费,高峰期服务器易拥堵,易出现影响响应速度。

2. 通用 agent(探索模式) 任务:品牌对比分析报告

通用 agent:进行第一轮、第二轮快速思考和浏览器搜索。搜到信息后生成并部署网页缺点:数据不够新,目前还是 2023 年的内容。目前生成文档每句话引用未标注来源,可信程度存疑。

噱头大于实用?深度测评3款人气超高的AI智能体产品

噱头大于实用?深度测评3款人气超高的AI智能体产品

3. 专家 agent 任务:生成问卷

噱头大于实用?深度测评3款人气超高的AI智能体产品

噱头大于实用?深度测评3款人气超高的AI智能体产品

噱头大于实用?深度测评3款人气超高的AI智能体产品

左侧为扣子空间、右侧为 deepseek,使用了相同的 prompt,对比 deepseek,扣子空间生成的问卷更加全面、分类更准确、问题语言更清晰易懂。

4. 通用 agent(规划模式) 任务:生成竞品分析并生成笔记

执行时间较长,针对复杂任务需要 10 分钟以上,同时在生成笔记中有概率会出现报错的问题。生成笔记信息不全面,出现关键细节缺失,分析不全面等问题。

噱头大于实用?深度测评3款人气超高的AI智能体产品

5. MCP agent(探索模式) 任务:生成可视化旅行攻略

噱头大于实用?深度测评3款人气超高的AI智能体产品

可以调用高德地图与墨迹天气的信息并适时设计旅行线路,同时可以导出至飞书表格直接生成攻略。

6. MCP agent(探索模式) 任务:生成一个会跳舞的猫

调用图像工具 MCP,生成的图像清晰但是对于主体的处理不符合事实,需要二次修改。

噱头大于实用?深度测评3款人气超高的AI智能体产品

结语

从 Manus、Genspark 到扣子空间,通用智能体产品虽在技术架构上尝试通过多模型整合、任务拆分等方式向 “世界大模型” 靠近,但实际使用中仍存在明显局限。

目前来看,这类产品普遍能力和问题相似,如信息收集、代码生成等能力差异不大,且多模态支持不足(如图像、视频生成功能缺失或质量较低)。同时,使用体验上存在稳定性不足、付费策略不够合理(如积分消耗快、套餐价格较高)、部分产品需依赖魔法上网等问题,影响了实际可用性。

未来,通用智能体需在技术生态建设、性能优化、付费体系完善等方面持续改进,才能从概念层面的讨论走向实际应用场景的落地,真正实现从 “有限可用” 到 “可用” 的跨越。

相关资讯

一键出海报!超简单的Coze入门案例实战教程

嗨,大家好! 今天要分享的同样是非常容易入门且可以很快获得成品的工具,那就是扣子。 下面是来自官方对扣子的简介:.
4/17/2025 12:16:31 AM
阿真Irene

扣子空间Coze Space正式开启内测 支持 MCP 扩展集成

字节跳动技术团队宣布,其全新 AI 协同办公平台“扣子空间”(Coze Space)正式开启内测。 “扣子空间”旨在成为用户与 AI Agent 协同办公的最佳场所,提供从回答问题到解决问题的全方位服务,帮助用户更高效地完成工作。 “扣子空间”具有多项创新特点,能够自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整的结果报告,如网页、PPT、飞书文档等。
4/19/2025 6:00:41 PM
AI在线

Genspark推出Deep Research功能:多模型协同提供AI研究能力

Genspark近期推出了新功能"Deep Research",该功能通过整合多个模型的能力,提供AI驱动的搜索和研究服务。 初步测试显示,尽管在内容深度上可能不及OpenAI的相关服务,但其质量和准确性表现令人满意。 值得注意的是,该功能目前支持免费试用。
2/7/2025 11:39:00 AM
AI在线
  • 1