AI在线 AI在线

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎

官方披露的信息显示,在 7 大问答数据集评测中,其性能与谷歌搜索相当甚至实现超越(70 亿参数模型得分为 33.06 vs. 谷歌 32.47),且成本降低 87.93%。
感谢阿里巴巴开源了 ZeroSearch 大模型,官方称其无需搜索即可激励搜索能力

AI在线附阿里对该模型的介绍大意如下:

我们提出了一种名为 ZeroSearch 的强化学习框架,通过不依赖真实搜索引擎来提升大型语言模型(LLM)的搜索能力。

在监督式微调的基础上,我们将 LLM 转化为一个能够生成相关或噪声文档的检索模块,响应查询。

为了更好地激发模型的推理能力,我们引入了课程化展开机制,通过让模型面对越来越复杂的检索任务,逐步培养其思考能力。

我们在多个领域内外的数据集上进行了大量实验,结果显示,ZeroSearch 在没有任何 API 费用的情况下,优于基于真实搜索引擎的模型

此外,它能够很好地在不同规模的基础型和指令微调型 LLM 上泛化,并支持多种强化学习算法。

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎

官方披露的信息显示,在 7 大问答数据集评测中,其性能与谷歌搜索相当甚至实现超越(70 亿参数模型得分为 33.06 vs. 谷歌 32.47),且成本降低 87.93%。

通过 SerpAPI 使用谷歌搜索训练 64,000 个查询的费用大约为 586.70 美元,而使用 14B 参数的模拟 LLM 在四个 A100 GPU 上训练仅需 70.80 美元。

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎

目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。

开源地址:https://github.com/Alibaba-nlp/ZeroSearch

相关资讯

阿里国际将推出全球首个AI驱动的B2B搜索引擎

继日前OpenAI发布SearchGPT之后,被点燃的“AI Search”赛道再迎一全新的重量级选手:阿里国际研发的AI驱动的B2B搜索引擎将于今年9月正式亮相。当下,AI的出现彻底改变了搜索的体验。而阿里国际的新产品将是全球首个专业版AI搜索引擎,其应用场景和商业价值非常明确:专注于全球B2B电商,面向全世界的中小企业主群体,意在改变全球采购流程,使之更加直观和高效。它能用主动理解采购者的自然语言,并转化为专业的采购请求。更进一步,它还能根据全球市场数据预测需求、提供建议,实现更精准的匹配。据悉,该AI搜索引擎
8/2/2024 2:28:00 PM
新闻助手

阿里 QwQ-32B 大模型集成至国家超算互联网平台 Chatbot 可视化对话 / API 在线调用服务

国家超算互联网平台今日发文宣布 MaaS 服务再上新:QwQ-32B 推理大模型正式集成至 Chatbot 可视化对话服务与 API 在线调用服务。
3/17/2025 7:32:12 PM
归泷(实习)

哥伦比亚大学研究:AI 搜索工具平均准确率仅六成,且自信满满“不认错”

除 Perplexity 及其付费版外,其余 AI 搜索引擎的表现都不尽如人意。整体来看,AI 搜索引擎提供的答案有 60% 是不准确的,而且 AI 对错误答案的“自信”反而加剧了问题。
3/13/2025 4:33:22 PM
清源
  • 1