AI在线 AI在线

超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强

阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。
感谢阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。

超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强

ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。

超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强

研究人员在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大问答数据集上进行了综合评测。结果显示,一个 70 亿参数的监督微调模型使用 ZeroSearch 后,其搜索能力达到了 33.06;140 亿参数的模型则达到了 33.97,超过了谷歌搜索的 32.47。

超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强

研究人员通过 SerpAPI 使用谷歌搜索进行约 64,000 次搜索查询的训练,成本约为 586.70 美元(AI在线注:现汇率约合 4238 元人民币);而在四个 A100GPU 上使用 140 亿参数的大模型进行模拟时,成本仅为70.80 美元(现汇率约合 511 元人民币),意味着成本降低了 87.93% 以上。

参考链接:

  • 论文地址:https://arxiv.org/abs/2505.04588

  • 开源地址:https://github.com/Alibaba-nlp/ZeroSearch

  • 抱抱脸:https://huggingface.co/collections/sunhaonlp/zerosearch-681b4ce012b9b6899832f4d0

相关资讯

通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布:号称优于 Deepseek V3 等竞品,暂未开源

据介绍,通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。
1/29/2025 3:15:06 AM
问舟

从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它

最近 AI 大模型领域可以说是热点话题不断,DeepSeek 的热潮还未消退,国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议
2/7/2025 2:13:55 PM
汐元

全球第一:阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单

1 月 29 日新年之际,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型,号称在多个基准测试中超越 DeepSeek V3 登竞争对手。
2/5/2025 6:42:42 PM
问舟
  • 1