AI在线 AI在线

被指在 AI 训练中滥用盗版书籍,Adobe 面临集体诉讼

AI在线 12 月 18 日消息,据外媒 TechCrunch 今日报道,一项由作家 Elizabeth Lyon 发起的集体诉讼对 Adobe 发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。 Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。 Adobe 方面介绍,SlimLM 是一套面向移动设备文档辅助场景的小语言模型,其预训练基础为 SlimPajama-627B 数据集。

AI在线 12 月 18 日消息,据外媒 TechCrunch 今日报道,一项由作家 Elizabeth Lyon 发起的集体诉讼对 Adobe 发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。

Adobe 方面介绍,SlimLM 是一套面向移动设备文档辅助场景的小语言模型,其预训练基础为 SlimPajama-627B 数据集。该数据集由 Cerebras 于 2023 年发布,被描述为去重、多语料的开源集合。然而诉讼认为,SlimPajama 本身来源存在问题。

诉讼文件指出,SlimPajama 是在复制并加工 RedPajama 数据集的基础上生成的,而 RedPajama 包含广受争议的 Books3 数据集。Books3 收录约 19.1 万本书籍,其中包含大量受版权保护作品

诉讼明确指出,作为 RedPajama 的派生数据集,SlimPajama 同样包含 Books3 内容,因此不可避免地纳入了原告及其他作者的版权作品。

围绕 Books3 和 RedPajama 的争议,早已不止于 Adobe。此前,苹果和 Salesforce 均因涉嫌在 AI 训练中使用相关数据集而遭到起诉,相关案件指控企业未经授权使用受版权保护内容。

在更广泛的行业背景下,类似诉讼正在成为常态。AI 模型对训练数据规模的高度依赖,使数据来源问题频频引发法律风险。今年 9 月,Anthropic 同意向多名作者支付 15 亿美元(AI在线注:现汇率约合 105.77 亿元人民币),就其训练 Claude 时使用盗版作品的指控达成和解。该案件被外界视为 AI 训练版权争议的重要节点,然而行业内持续扩大的法律挑战仍未终结。

相关资讯

篮球明星勒布朗・詹姆斯 AI 怀孕视频大火,生成平台收到侵权律师函

AI在线 7 月 26 日消息,篮球明星勒布朗・詹姆斯的法律团队一直在试图阻止病毒式 AI 视频的传播。 据 404 Media 7 月 24 日报道,代表詹姆斯的律师事务所已向一个允许 Discord 用户制作勒布朗・詹姆斯 AI 视频的 AI 平台发出了停止侵权函。 报道提到,这些 AI 视频已经流传了一段时间,但似乎是一段特别奇怪的片段让詹姆斯的律师选择介入。
7/26/2025 5:14:22 PM
汪淼

抖音启动AI仿冒专项治理:严禁使用AI技术伪造名人带货

11月6日,抖音副总裁李亮发文回应近期“温峥嵘被AI盗播带货”事件,表示该案例中提到的“三个直播间同时开播”并非发生在抖音平台,但平台确实发现存在部分利用AI技术仿冒名人进行带货的短视频内容。 李亮指出,这类AI侵权仿冒行为严重损害了创作者、商家及平台在消费者心中的信任,也不符合平台的长期利益。 抖音对此高度重视,已启动专项治理行动,针对AI伪造人像、虚假带货等行为开展重点整治。
11/7/2025 11:01:19 AM
AI在线

​英国部长呼吁:不要抵制人工智能版权变革

近日,英国教育部长彼得・凯尔(Peter Kyle)就政府正在推进的人工智能(AI)版权提案表示,反对这一提案的声音不应成为变革的障碍。 凯尔强调政府将继续优先考虑推动前进,而非停滞不前。 他的言论是在创意产业对这一提案的强烈反对中发表的,这些反对者担心新规可能会损害艺术家的权益与创造力。
3/24/2025 4:25:00 PM
AI在线