AI在线 AI在线

WebSailor,模型,开源,推理,训练,复杂,QA,任务,问题,BrowseComp

刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3

在互联网信息检索任务中,即使是很强的LLM,有时也会陷入“信息迷雾”之中:当问题简单、路径明确时,模型往往能利用记忆或一两次搜索就找到答案;但面对高度不确定、线索模糊的问题,模型就很难做对。 举个例子,我们平常问一个直白的问题(比如“某城市的人口是多少”),搜索引擎一查即可。 但如果问题被设计得非常复杂,比如“这首与南美某首都密切相关的乐曲,其歌词作者在21世纪初获颁当地荣誉称号,其旋律创作者曾就读于哥伦比亚西部的一所著名艺术学院。
7/7/2025 4:25:40 PM
梦晨
  • 1