AI在线 AI在线

中文教育评估基准

最强闭源模型也难应对!华东师范大学智能教育学院发布覆盖全学段、全学科的中文教育评估基准—OmniEduBench

随着大语言模型在教育领域的应用日益广泛,我们如何全面评估它们的能力? 一个好的“AI老师”仅仅是一个“解题高手”吗? 近日,来自华东师范大学的研究者们推出了OmniEduBench,这是一个旨在解决当前评测盲点的综合性中文教育基准。
11/6/2025 10:05:00 AM
新闻资讯
  • 1