AI在线 AI在线

HLCE

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准

本文的第一作者为华为诺亚研究员李向阳,毕业于北京大学,开源组织 BigCode 项目组成员。 此前他们团队曾经推出 CoIR 代码检索基准,目前已经成为代码检索领域的标杆 benchmark。 其余主要成员也大部分来自 CoIR 项目组。
7/5/2025 6:41:00 PM
机器之心
  • 1