AI在线 AI在线

AI 评测体系

上海交大/上海AI Lab翟广涛:当评测不再重要,AGI就实现了

上海交通大学教授、上海人工智能实验室双聘研究员翟广涛认为,完美的 AI 评测体系本身就等同于通用人工智能。 人工智能的世界里,数字似乎就是一切。 几乎每周,都有某个新发布的 AI 模型在基准测试中打破纪录,MMLU、SuperCLUE、HLE……这些曾经只在学术圈流转的晦涩代号,如今成为衡量一个个大模型「智商」的通用货币,是决定其市场声誉乃至背后公司估值的关键砝码。
7/15/2025 11:52:00 AM
机器之心
  • 1