AI在线 AI在线

成本降低88%:阿里巴巴ZeroSearch技术颠覆AI训练模式

阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术,彻底改变了训练人工智能系统搜索信息的方式。 这项创新技术通过模拟方法让大型语言模型(LLM)开发高级搜索功能,无需在训练过程中与真实搜索引擎交互,从而消除了对昂贵商业搜索引擎API的依赖。 解决成本与复杂性难题ZeroSearch解决了AI行业面临的两大关键挑战:搜索引擎返回文档质量的不可预测性,以及向谷歌等商业搜索引擎进行数十万次API调用所产生的高昂成本。

阿里巴巴集团研究人员近日推出一项名为"ZeroSearch"的突破性技术,彻底改变了训练人工智能系统搜索信息的方式。这项创新技术通过模拟方法让大型语言模型(LLM)开发高级搜索功能,无需在训练过程中与真实搜索引擎交互,从而消除了对昂贵商业搜索引擎API的依赖。

解决成本与复杂性难题

ZeroSearch解决了AI行业面临的两大关键挑战:搜索引擎返回文档质量的不可预测性,以及向谷歌等商业搜索引擎进行数十万次API调用所产生的高昂成本。

研究人员在本周发表于arXiv的论文中指出:"强化学习[RL]训练需要频繁部署,可能涉及数十万个搜索请求,这会产生大量的API开销,并严重限制可扩展性。为了应对这些挑战,我们推出了ZeroSearch,这是一个强化学习框架,无需与真实搜索引擎交互即可激励LLM的搜索能力。"

QQ20250509-094446.png

创新的训练方法

阿里巴巴的方法首先采用轻量级的监督式微调,将LLM转换为能够根据查询生成相关和不相关文档的检索模块。在强化学习训练过程中,系统采用"基于课程的推出策略",逐步降低生成文档的质量。

研究人员解释道:"我们的关键见解是,LLM在大规模预训练过程中获得了广泛的世界知识,能够根据搜索查询生成相关文档。真实搜索引擎和模拟LLM之间的主要区别在于返回内容的文本风格。"

性能超越传统方法的同时大幅降低成本

在七个问答数据集的全面测试中,ZeroSearch不仅匹敌,甚至经常超越使用真实搜索引擎训练的模型。令人印象深刻的是,一个70亿参数的检索模块实现了与谷歌搜索相当的性能,而140亿参数的模块甚至超越了后者。

成本节省更是显著:通过SerpAPI使用Google搜索进行约64,000个查询的训练成本约为586.70美元,而在四台A100GPU上使用14B参数模拟LLM的成本仅为70.80美元,节省了88%的费用。

论文结论指出:"这证明了在强化学习设置中使用训练有素的LLM替代真实搜索引擎的可行性。"

对AI行业的深远影响

这一突破标志着AI训练方式的重大转变。ZeroSearch表明,AI系统可以通过自我模拟而非依赖外部工具来实现功能改进,为行业带来多重益处:

  • 降低进入门槛:对预算有限的初创公司和研究团队,API调用成本降低近90%使高级AI训练更加平民化
  • 增强控制能力:开发者可以精确控制AI训练过程中接触的信息,不再受制于搜索引擎返回结果的不确定性
  • 适用性广泛:该技术已在多个模型系列上得到验证,包括Qwen-2.5和LLaMA-3.2的基础版本和指令调整版本

研究团队已在GitHub和Hugging Face上公开了相关代码、数据集和预训练模型,鼓励行业广泛采用这一创新方法。

随着大型语言模型继续发展,ZeroSearch这样的技术预示着未来AI系统将能通过自我模拟而非依赖外部服务来开发更复杂的功能,这可能从根本上改变AI开发的经济性并减少对大型技术平台的依赖。

讽刺的是,在教AI无需搜索引擎进行搜索的过程中,阿里巴巴可能创造了一项让传统搜索引擎对AI发展不再那么重要的技术。随着这些系统变得更加自给自足,技术格局可能在未来几年内发生巨大变化。

相关资讯

AI学会“自我谷歌”!!阿里ZeroSearch技术不靠搜索引擎照样学得飞起,成本还降了88%?

想象一下,如果AI不再依赖谷歌搜索、Bing搜索这些“外包助手”,而是自带“搜索引擎大脑”自我检索、自我学习,结果表现还更优秀——你是不是觉得这听起来像是《黑客帝国》第二集?但阿里真的做到了!这不只是一次技术突破,更像是一次“AI自给自足革命”的打响第一枪。 ZeroSearch 的出现,可能正悄悄改变我们构建智能系统的底层逻辑。 01|告别谷歌,AI开始“自我检索”“用强化学习训练一个AI助手,光是搜索费用就能掏空初创公司的预算。
5/9/2025 3:00:51 PM
AI在线

阿里巴巴开源 ZeroSearch 搜索引擎:训练成本大幅降低 80%

近日,阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎,这一新工具通过强化学习框架,极大地提高了搜索能力,并且在训练过程中不需要与真实搜索引擎互动。 ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识,快速生成相关内容,并且可以动态控制生成内容的质量。 与传统的搜索引擎相比,ZeroSearch 的训练成本显著降低。
5/9/2025 9:00:59 AM
AI在线

阿里开源大模型搜索引擎 ZeroSearch,大幅降低成本

近日,阿里巴巴在 Github 等平台正式开源了其全新研发的大模型搜索引擎 ZeroSearch。 这款搜索引擎以强化学习框架为基础,能够在无需与真实搜索引擎交互的情况下,激发大模型的搜索能力。 ZeroSearch 的核心技术是利用大模型在大规模预训练过程中积累的丰富知识,将其转化为一个高效的检索模块。
5/9/2025 9:00:59 AM
AI在线
  • 1