AI在线 AI在线

AI训练新方式!Anthropic 斥巨资 “拆书” 换数据,法律之争引热议

近日,人工智能公司 Anthropic 以数百万美元的巨额投入,购买并 “拆解” 大量图书,用于训练其 AI 助手 Claude。 这一举动引发了公众的广泛关注和法律界的热议。 根据外媒 Ars Technica 报道,Anthropic 为了获取训练数据,采取了一种颇具争议的方法。

近日,人工智能公司 Anthropic 以数百万美元的巨额投入,购买并 “拆解” 大量图书,用于训练其 AI 助手 Claude。这一举动引发了公众的广泛关注和法律界的热议。

根据外媒 Ars Technica 报道,Anthropic 为了获取训练数据,采取了一种颇具争议的方法。他们将大量实体书籍拆解、扫描成数字文件,然后直接销毁原件。这一做法在法庭文件中被披露,法官 William Alsup 对此进行了裁定,认为这种扫描方式构成合理使用。法官指出,Anthropic 所购买的书籍经过合法渠道获取,并在扫描后即刻销毁,数字文件仅用于内部使用,并未对外传播。这一判决为其他 AI 公司在获取数据时提供了法律上的参考。

机器人 AI 人工智能 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

这一策略背后,Anthropic 希望借鉴谷歌书籍项目的成功经验。Anthropic CEO 阿莫代伊曾提到,早期公司曾考虑使用盗版电子书,但出于法律风险的考虑,最终选择了通过购买二手书籍的方式来获取高质量的训练文本。通过 “破坏式扫描”,公司能够快速高效地将书籍转化为可供机器阅读的 PDF 格式,从而为 AI 模型的训练提供充足的数据支持。

然而,非破坏性扫描技术其实已经相当成熟。比如,Internet Archive 就开发出能够保留原书的数字化方式,OpenAI 和微软近期也与哈佛大学图书馆合作,计划数字化近百万本公版书籍,确保这些书籍的原版依然得到妥善保存。与这些同行相比,Anthropic 的做法显得有些激进,但无疑为 AI 训练领域开辟了新的思路。

随着人工智能的发展,如何在尊重知识产权的前提下获取训练数据将成为业界的持续话题。Anthropic 的尝试虽然引起争议,但也为未来的 AI 发展提供了新的可能性。

相关资讯

Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布

科技媒体 bleepingcomputer 今天(5 月 22 日)发布博文,报道称基于 Anthropic 官网配置文件,该公司正秘密研发 Claude Sonnet 4 和 Claude Opus 4 两款全新 AI 模型。
5/22/2025 10:48:24 AM
故渊

Claude移动端语音对话功能测试版上线,支持日程查询与文档搜索

Anthropic近日宣布,其AI助手Claude的移动端应用推出语音对话功能测试版,为用户带来更便捷的交互体验。 该功能支持通过语音指令查询日程、搜索文档、发送邮件等操作,显著提升移动端生产力。 目前,测试版仅支持英语,Anthropic计划在未来几周内向全球用户推出多语言支持。
5/28/2025 10:01:01 AM
AI在线

Anthropic在移动端推Claude对话语音模式,可搜索Google 文档、日历等

位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。 该功能已在苹果 App Store(iOS 设备)和谷歌 Play Store(Android 设备)的移动应用中上线。 除了语音模式的推出,Anthropic还为所有免费用户扩展了网络搜索功能。
5/28/2025 10:01:00 AM
AI在线
  • 1