AI在线 AI在线

哈佛大学法学院图书馆

哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书

哈佛大学法学院图书馆开源首个AI训练数据集“Institutional Books 1.0”,涵盖98.3万本图书、2420亿Token,支持245种语言。40%为英语,60%为其他语言,书籍主要来自19-20世纪。未来还将加入数百万份历史报纸数字化内容。#AI训练# #开源数据#
6/16/2025 10:27:21 PM
漾仔
  • 1