AI在线 AI在线

ClockBench

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

90%人都会的读钟题,顶尖AI全军覆没! AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench,专注于测试AI的「看懂」模拟时钟的能力。 结果让人吃惊:人类平均准确率89.1%,而参与测试的11个主流大模型最好的成绩仅13.3%。
9/8/2025 6:08:28 PM
  • 1