AI在线 AI在线

OpenAI 首席技术官:不确定 Sora 的训练数据来自哪里

感谢OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 In
感谢OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。

OpenAI 首席技术官:不确定 Sora 的训练数据来自哪里

在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”

当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 Instagram 或 Facebook 视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。

当记者询问 OpenAI 是否与其合作伙伴图片素材公司 Shutterstock 达成过数据训练方面的合作,Murati 索性拒绝继续讨论数据来源话题。

Murati 甚至回避记者关于 OpenAI 与图片素材巨头 Shutterstock 的数据合作,拒绝透露来自该平台的视频是否被用于训练 Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。

Murati 这番闪烁其词的做法让 OpenAI 陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连 CTO 都无法说清其最热门模型的训练数据来源,难免让人怀疑 OpenAI 高层对该问题的重视程度。

据报道,采访结束后,Murati 私下承认了确有使用 Shutterstock 视频训练 Sora。然而,相较于网络上浩如烟海的视频内容,来自 Shutterstock 的素材可能只是 Sora 训练数据的一小部分。

IT之家注意到,Murati 的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO 竟然对如此关键的问题不知情,实在令人难以置信。

然而,也有人为 Murati 辩护,认为既然内容已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开内容,就应该承担被使用的风险。

Murati 的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的 AI 训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。

相关资讯

突发!OpenAI CEO Sam Altman被开除、退出董事会

Sam Altman 是拿到了乔布斯的剧本?自 ChatGPT 爆火以来,Sam Altman 也成为了 OpenAI 的门面以及代表性人物。这段时间以来,他一直活跃在宣传 OpenAI 与 ChatGPT 的舞台上,而 OpenAI 从估值到知名度也一直在蒸蒸日上。可以说 Sam Altman 与 OpenAI 这两个名字,有了极为深度的绑定。但令人惊讶与意外的是,今天 OpenAI 官方公告宣布:Sam Altman 将卸任首席执行官并退出董事会。临时接任他担任 CEO 的是 OpenAI CTO Mira M
11/18/2023 10:30:00 AM
李亚洲

前OpenAI CTO Mira Murati新公司完成20亿美元融资,推进多模态AI研发

前OpenAI首席技术官Mira Murati创立的人工智能初创公司Thinking Machines Lab宣布完成20亿美元种子轮融资,由Andreessen Horowitz(a16z)领投,NVIDIA、AMD、Accel、ServiceNow、Cisco和Jane Street等知名机构参投。 此次融资使公司估值达到120亿美元,成为AI领域最大规模的早期投资之一,凸显了Murati在AI行业的强大影响力据悉,Thinking Machines Lab成立于2025年2月,总部位于旧金山,定位为公共利益公司,致力于开发多模态AI,以自然方式与人类互动,包括对话、视觉和协作等场景。 Murati表示,公司目标是构建“与人类协作的通用智能”,使AI更易理解、可定制并广泛应用于各领域。
7/16/2025 3:01:25 PM
AI在线

New Company of Former OpenAI CTO Mira Murati Completes $2 Billion Funding to Advance Multimodal AI Development

The artificial intelligence startup Thinking Machines Lab, founded by Mira Murati, the former Chief Technology Officer of OpenAI, announced a $2 billion seed round of funding, led by Andreessen Horowitz (a16z), with participation from well-known institutions such as NVIDIA, AMD, Accel, ServiceNow, Cisco, and Jane Street.
7/16/2025 4:11:39 PM
AI在线
  • 1