AI在线 AI在线

NewtonBench

港科大&英伟达提出NewtonBench:在「平行宇宙」中评估大模型科学发现能力

作者 | 论文团队编辑 | ScienceAI随着大语言模型(Large Language Models, LLMs)推理能力的提升,其在自动化科学发现(Automatic Scientific Discovery)领域的潜力也引发了学术界与公众的广泛关注。 AI 领域知名学者何恺明曾在一次访谈中提出一个引人深思的问题:「以当前大模型的智能水平,若将其置于牛顿时代,它能否独立发现牛顿物理定律? 」然而,评估这种能力面临诸多挑战。
10/15/2025 11:56:00 AM
ScienceAI
  • 1