AI在线 AI在线

AI大模型的版权风暴:行业巨头面临7500亿美元赔偿风险

近年来,随着人工智能技术的飞速发展,大型 AI 模型的训练数据来源问题日益成为业界关注的焦点。 许多知名企业在构建其 AI 模型时,似乎都选择了使用大量未授权的版权内容作为数据。 这一 “秘密配方” 引发了激烈的法律争论,并将硅谷的科技巨头们推上了风口浪尖。

近年来,随着人工智能技术的飞速发展,大型 AI 模型的训练数据来源问题日益成为业界关注的焦点。许多知名企业在构建其 AI 模型时,似乎都选择了使用大量未授权的版权内容作为数据。这一 “秘密配方” 引发了激烈的法律争论,并将硅谷的科技巨头们推上了风口浪尖。

2023年,《纽约时报》首次向 OpenAI 和微软提起诉讼,正式揭开了这场法律之战的序幕。不久后,Meta 因其 Llama 模型涉嫌使用盗版书籍而面临集体诉讼,而 Anthropic 也因为其 Claude 模型的训练数据受到指控。所有主要玩家几乎都面临着法律挑战,究竟在未经授权的情况下,使用受版权保护的作品作为 AI 训练数据,是否属于 “合理使用”?

版权

2025年6月,法院在对 Anthropic 案的裁决中给出了一个重要信号:尽管模型训练本身可能被视为一种高度 “变革性” 的使用,但如果数据来源涉及盗版,基本上就无法逃避侵权的指控。预计 Anthropic 可能面临高达7500亿美元的赔偿,这一消息令所有 AI 公司心惊胆战。

为了满足对数据的需求,各大模型公司采用了多种 “创意” 方式来获取数据,有的甚至游走在法律边缘。例如,OpenAI 利用网络爬虫广泛抓取网络内容,甚至在抓取过程中清除版权信息;而在高质量文本资源逐渐枯竭后,AI 公司又转向视频和纸书等其他格式的数据,利用技术手段进行提取。

此外,有些公司甚至选择了直接使用盗版书籍。例如,Meta 在训练 Llama 模型时,就被指控使用来自 “影子图书馆” 的盗版书籍。与此相反,苹果等保守派企业则选择通过合法授权和自有数据来规避法律风险。

在法律诉讼的推进中,版权方的策略逐渐转变,焦点不再是 AI 如何使用数据,而是数据的获取是否合法。法院的裁决表明,虽然 AI 的训练行为可能不构成直接侵权,但盗版资源的使用将受到严厉打击。

如今,AI 行业面临着一场前所未有的版权战争,如何在法律边缘游走并实现创新,成为了科技巨头们亟需解决的问题。

相关资讯

联邦法官首次裁定AI训练使用版权书籍属合理使用,Anthropic获胜但仍面临盗版指控

在一项具有里程碑意义的裁决中,联邦法官威廉·阿尔苏普(William Alsup)裁定,Anthropic公司在未经作者许可的情况下使用已出版书籍训练其人工智能模型属于合法行为。 这是法院首次认可AI公司关于合理使用原则的辩护论点,为科技行业在版权争议中奠定了重要先例。 行业影响深远这一判决对正在进行的AI版权大战产生重大影响。
6/25/2025 9:00:44 AM
AI在线

汤森路透在人工智能版权战中取得初步胜利

在美国法律界,人工智能(AI)相关的版权争议正愈演愈烈,汤森路透(Thomson Reuters)近日在这场版权战中赢得了一场初步胜利。 该公司2020年起诉了现已倒闭的法律研究公司罗斯智能(Ross Intelligence),指控其在未获得授权的情况下,使用了汤森路透的法律平台 Westlaw 的材料来训练其 AI 模型。 根据3rd U.S.
2/13/2025 1:51:00 PM
AI在线

谷歌Gemini 2.0 Flash引发争议:AI轻松去除图片水印引发版权担忧

一场关于AI边界的新争议正在科技圈掀起波澜。 谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印,包括来自盖蒂图片社等知名图库的专业水印,这一功能引发了创作者和版权持有者的广泛关注。 上周,谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围,使更多用户能够体验其强大的图像生成和编辑能力。
3/17/2025 9:27:00 AM
AI在线
  • 1