AI在线 AI在线

“人类最后的考试”

DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌

西风 发自 凹非寺. 量子位 | 公众号 QbitAI“人类最后的考试”首次突破30分,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过10分。
7/9/2025 1:28:00 PM
西风
  • 1