AI在线 AI在线

马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research

2025年Agent大战,Deep Research「研究智能体」率先开打! 第一个登场的谷歌Gemini,随后OpenAI、Perplexity等也相继推出了自己的同名功能。 Grok是个例外,与Grok 3一同发布的是「DeepSearch」,没有「Research」只有「Search」。

2025年Agent大战,Deep Research「研究智能体」率先开打!

第一个登场的谷歌Gemini,随后OpenAI、Perplexity等也相继推出了自己的同名功能。

Grok是个例外,与Grok 3一同发布的是「DeepSearch」,没有「Research」只有「Search」。

有趣的是,就在昨天,Grok悄无声息地推出了全新的功能 ——「DeeperSearch」。

图片

在Grok网页中点击DeepSearch的小箭头,免费用户也可使用DeeperSearch。

比较一下DeeperSearch和Deep Research,不能说一模一样,至少也是AI界的Cosplay。

图片

图片

Grok DeeperSearch

Gemini Deep Research

现在利用AI的Deep Research / DeeperSearch,可以探索复杂主题,并以全面、详细的报告形式呈现研究成果。

图片

接下来,深入了解一下如何更高效的使用Deep Research/DeeperSearch的技巧吧。

DeeperSearch试用

Grok是X上内置的AI模型,让DeeperSearch搜索了过去48小时X上的热点AI资讯,效果的确不错。

图片

不过,不是每次体验都很流畅。

从事NLP研究的Casper Hansen,表示:「Grok DeeperSearch再创纪录。纯搜索和思考时长达16 分钟。」

图片

搞笑的是在思考过程中,DeeperSearch很像人的自言自语,比如「我在想,搜索****可能会太模糊。」

图片

现场开盒匿名网友

从事预测研究的Sam Atis,直接问起了Grok的DeeperSearch下列问题:

你可以找出Sam Atis是谁吗?我想知道撰写Samstack.io的人的真实身份。

同样的问题,Grok的DeeperSearch认出了Sam Atis的真实身份,而DeepSearch并没有得到正确答案。

DeeperSearch查出了他之前工作过的地方(一家非常小的NPO),然后检查了那里所有工作人员的背景,与他在 UCL学习政治学的事实相符。

Sam Atis还测试了「你能找到[人物]的Reddit账号吗?」,其中[人物]针对他认识的人,结果很成功。

尽管和Reddit账号之间没有明显的联系,DeeperSearch从一篇文章中正确推断出来的匿名账户的真实真实身份。

这也让Sam Atis猜测:「不久,使用化名的作者都将不在安全,许多人都能被LLM认出来了。」

图片

如果真的在乎个人隐私,这的确令人担心。

AI也被问烦了

网友Nathan Clement向DeeperSearch问了一个智能体协议MCP的问题,把Grok 3问沉默了。

Grok 3对提问分析了长达5分钟47秒,找到了10个网页,但报告一句话也没生成,直接显示无法完成回复。

图片

Nathan Clement推测,或许DeeperSearch被MCP问题问烦了。

图片

实测:速度有些慢

打开Grok 3的DeeperSearch功能,发送提示:「总结一下深度研究功能的进展」。

DeeperSearch查询了46个信息来源,10个网站,耗时37分钟37秒,完成了相关报告。

图片

然而,Grok 3只总结了OpenAI的深度研究功能进展。

图片

全球范围内,谷歌Gemini首次发布了Deep Research功能,并在不断更新;xAI的类似功能也没有考虑进去。

毫无疑问,关键引用全是OpenAI的消息。

图片

DeeperSearch:不只是搜索

热衷xAI的Denis Labelle,在X上分享了充分利用DeeperSearch的经验。

图片

DeeperSearch增强了下列3项功能:

  1. 广泛的查询处理能力:(例如)收集Grok 3高级功能的全面信息,表现完美。
  2. 个性化洞察:能够根据查询意图调整回复内容。
  3. 实时集成:获取最新数据,比如随时掌握Grok 3相关讨论的最新动态。

图片

1. 从一般查询入手,进行初步研究

DeeperSearch采用先进算法,能够快速提供多样化、符合上下文的搜索结果。

如何操作:提出关于Grok 3功能的高层次问题。

示例:「Grok 3的主要高级功能有哪些?」 

(你将获得关于DeeperSearch、Think模式、实时数据集成等功能的详细概述。)

2. 利用Think功能进行深入分析

  • 提炼Grok 3的高级功能要点。
  • 评估信息的可靠性。
  • 查找明确需要进一步探索的领域。

操作步骤:

  1. 运行DeeperSearch查询:「Grok 3的高级功能有哪些?」
  2. 切换到Think模式:「总结Grok 3的高级功能,并指出可能缺失的细节。」
  3. 根据生成的结果,优化你的下一步查询

3. 设计精准提示词,获取深入见解

  • 明确你的需求,聚焦特定信息
  • 请求分析,而不仅仅是事实罗列
  • 表达清晰、简洁

示例:

  • 「分析Grok 3的DeeperSearch功能,如何处理关于其高级特性的复杂查询。」
  • 「评估Grok 3的实时数据集成功能在增强其高级特性方面的作用。」

4. 使用透明度功能验证结果

  • 理解逻辑:查看AI如何解读Grok 3的高级功能
  • 发现错误:识别潜在的偏见或不准确之处
  • 建立信任:确认输出结果的可靠性

操作步骤:

  1. 在获得结果后,切换「思考」(think)选项以查看AI的推理步骤
  2. 检查关于Grok 3功能声明的一致性
  3. 如有必要,调整你的问题

5. 采用迭代式工作流程

  • DeeperSearch模式:从关于Grok 3高级功能的一般查询开始
  • Think模式:分析结果并找出遗漏之处
  • 再次切换至DeeperSearch模式:优化查询,深入挖掘信息

重复上述过程,直到满意为止。

示例:

  • 「Grok 3的高级功能有哪些?」
  • 「响应列出了功能,但缺乏对局限性的详细说明。遗漏了什么?」
  • 「Grok 3的高级功能(如DeeperSearch)有哪些局限性?」

高效prompt推荐

  • 「分析Grok 3的DeeperSearch功能如何增强其高级功能集。」
  • 「评估Grok 3的Think模式在其高级功能中的有效性。」
  • 「评估Grok 3的实时数据集成功能作为高级功能的优势与劣势。」
  • 「分析Grok 3的DeeperSearch在详细说明其高级功能时的准确性。」
  • 「确定Grok 3的高级功能(如DeeperSearch)如何支持AI研究。」
  • 「总结Grok 3的透明性功能(如Thoughts开关)在其高级功能中的优势。」
  • 「预测Grok 3的高级功能基于当前能力可能如何发展。」
  • 「分析Grok 3的DeeperSearch作为未来版本中领先的高级功能的潜力。」

谷歌Deep Research的6大技巧

Gemini高级产品经理Aarush曾想为孩子寻找适合的夏令营,这通常需要打开几十个浏览器标签页,再把所有重要信息整理到一个文档中。

Aarush和软件工程师Mukund想到开发一个能研究所有相关信息,并创建报告的AI系统。

与团队经过几周进行原型设计后,他们做到了。以下是6个使用小技巧。

Gemini深度研究现已面向所有人开放,还新添了音频概述功能!

图片

先看这任务需不需要深度研究

如果你要做的事,得花大量时间浏览网页,还得开好多标签页,那深度研究就特别有用。

Deep Research是帮你从对某个主题啥都不懂,到透彻了解的得力助手。

但要是想马上得到一个简单快速的答案,可能用不着深度研究。

比如说,想简单了解「金融科技」是啥,直接用Gemini默认的聊天功能就行。

可要是你是个风险投资人,要跟一家金融科技初创公司见面,想快速了解行业最新趋势,这时候深度研究就能派上大用场。

从简单直白的问题问起

虽说叫「深度」研究,但不意味着一开始提问就得绞尽脑汁。

「别想太复杂,你随时能改问题。在深度研究开始干活之前,它会把研究计划给你看,要是觉得不合适,还能按自己的想法调整。」Aarush表示。

只要点「编辑计划」选项,用大白话告诉它要加什么内容,或者换个研究方向就行。

不用非得是提问高手,只要把最终目标说清楚,比如「我想给10岁孩子在纽约找个超棒的夏令营」,剩下的深度研究就会帮你搞定。

图片

顺着报告内容追问细节

等拿到报告,可能会发现一两个特别有意思的细节,这时候Aarush建议接着追问。

在聊天窗口里输入问题,深度研究要么根据之前的研究,马上给你答案,要么再去网上找找更多信息。

还能在报告生成之后,让深度研究再加点新内容,它会马上更新报告。

比如,让它「在报告里加上夏令营费用的信息」,深度研究就会去找相关信息,然后加到报告里。

看看相关链接

Gemini忙着研究、写报告的时候,界面上会有「显示思考过程」和「浏览过的网站」这两个选项。

要是点击「显示思考过程」,就能看到它是怎么一步步写出报告的。

这两个选项都会列出深度研究用到的网站,「浏览过的网站」会把网站列出来,但不会讲具体研究过程。

等报告的时候,要是哪个网站吸引你了,点一下,就能在新标签页打开。

这可是发现新网站的好办法,要是自己找,说不定根本发现不了这些网站。

图片

用深度研究解决身边的问题

深度研究特别擅长本地化搜索,能帮你找到周边的信息。

要是想多了解自己住的社区,或者想找本地商家做个复杂的家庭项目,不妨试试深度研究。

还有个挺实用的场景,就是让它策划活动,像办个晚餐聚会或者生日派对,看深度研究怎么搜寻本地资源。

生成音频报告,或者导出文档

因为本周的更新,现在能给报告生成音频概述了。

音频概述功能最早是在NotebookLM里推出的,用户可以听两个AI主持人讨论、解读上传的信息。

现在深度研究也有这功能啦!

报告做好以后,右上角能看到一个切换按钮,有好几个选项,其中一个就是生成音频概述。

它会像播客一样,把报告内容给你讲一遍。

这样一来,听音频的时候还能干别的事,出门在外也能听。要是你觉得听比看更容易理解,这个功能就太适合了。

不管是在网页还是手机上,都能听,分享、下载也很方便。还能把报告导成文档。

图片

Mukund表示,「要是我觉得这份报告特别好,想自己再改改,然后发给别人,让他们也提提意见。」

把报告导成文档的时候,深度研究引用的所有资料,都会列在参考文献部分。

要是想把东西打印出来看,或者在上面写写画画,也完全没问题。对于习惯在纸质文件上做标记的人来说,这可太实用了!

相关资讯

鏖战企业级市场,AI Agent如何重塑智能商业未来?

在科技的浩瀚星河中,DeepSeek掀起的技术风暴余波未平,全球首款通用Agent产品Manus的惊艳登场,再度点燃了整个行业的激情,让科技圈为之沸腾。 暂且不论Manus自身性能究竟达到何种高度,其引发的从“被动应答”到“主动执行”的颠覆性范式跃迁,正以前所未有的态势,不断突破繁杂业务流程场景下智能化的边界,为企业级市场带来无限可能。 近期,IDC发布的《中国AI Agent应用市场概览(2025Q1)》,首次对中国AI Agent应用的市场格局进行了系统性梳理。
4/9/2025 12:30:41 PM

AI智能体2小时击败人类,引爆贝叶斯推理革命!仅用10%数据训练秒杀大模型

最近,Verses团队在AI领域投下了一枚重磅炸弹,他们自研的Genius智能体,创造了一个几乎不可能的奇迹——只用10%数据,训练2小时,就能打造出最强AI智能体! 在经典游戏Pong中,Genius智能体多次达到完美的20分,一举超越了苦练数天的其他AI,和顶尖的人类玩家。 更让人惊掉下巴的是,它的规模只有SOTA模型IRIS的4%(缩小了96%),直接在搭载M1芯片的MacBook上就能跑。
1/21/2025 1:15:37 PM
新智元

2025智能体元年!斯坦福科学家8000字讲清所有要点

许多人认为「智能体」是AI发展的终极目标。 智能体在处理复杂任务时,展现出了巨大潜力。 从协助搭建网站、管理客户账户,到开展市场调研、自动录入数据,智能体的应用场景日益广泛。
1/24/2025 9:30:00 AM
新智元
  • 1