谷歌在扩散技术领域持续发力。这次,他们将扩散技术应用于深度研究agent,专门用于优化研究报告生成过程。该方法在长篇研究任务中对比OpenAI Deep Research取得了69.1%的胜率。
图片
论文提出了测试时扩散深度研究员(TTD-DR),重新思考了深度研究agent生成长篇报告的方式。TTD-DR没有依赖传统的静态推理策略(如思维链或最优N选择采样),而是将报告生成过程构建为扩散过程——从噪声草稿开始,通过检索增强的去噪过程进行迭代优化,并由结构化计划进行指导。
图片
以草稿为骨架 TTD-DR从初步报告草稿和研究计划开始。这个不断演进的框架会指导应该发起哪些搜索查询,以及如何整合新信息,从而在研究生成过程中提升连贯性和时效性。
图片
基于检索的去噪 噪声草稿通过类似扩散的方式反复修订,每个步骤都包括发起新的搜索查询、整合检索到的内容并更新草稿。这个循环持续到收敛为止,确保外部知识的及时融入。
组件级自进化 研究工作流程中的每个单元(计划生成、查询构建、答案综合、最终写作)都有自己的优化循环。这种进化使用了多变体采样、LLM评判打分、基于批评的修订以及交叉合并等技术来选择高适应性的输出。
卓越成果 在五个基准测试(LongForm Research、DeepConsult、HLE-Search、HLE-Full和GAIA)中,TTD-DR始终优于来自OpenAI、Perplexity和Grok的agent。例如,在长篇生成任务中对比OpenAI Deep Research达到69.1%的胜率,在短篇多跳问答任务中获得4.8%至7.7%的提升。
图片
高效扩展 与仅使用骨架和仅使用自进化的变体相比,完整的TTD-DR系统实现了最优的性能/延迟权衡,表明基于检索的去噪是一种高效的测试时扩展策略。
这又是一篇将扩散、自进化算法和结构化规划等理念巧妙结合的优秀论文,为构建更先进的长篇研究报告生成agent提供了新思路。
论文链接:https://arxiv.org/abs/2507.16075