AI在线 AI在线

OpenAI 首席技术官:不确定 Sora 的训练数据来自哪里

感谢OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 In
感谢OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora,然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详,无法明确说明 Sora 的训练数据来源。

OpenAI 首席技术官:不确定 Sora 的训练数据来自哪里

在采访中,记者直接询问 Murati 关于 Sora 训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”

当记者追问具体来源是否包含 YouTube 视频时,Murati 竟然表示“我实际上并不确定(I'm actually not sure about that)”,并拒绝回答有关 Instagram 或 Facebook 视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。

当记者询问 OpenAI 是否与其合作伙伴图片素材公司 Shutterstock 达成过数据训练方面的合作,Murati 索性拒绝继续讨论数据来源话题。

Murati 甚至回避记者关于 OpenAI 与图片素材巨头 Shutterstock 的数据合作,拒绝透露来自该平台的视频是否被用于训练 Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。

Murati 这番闪烁其词的做法让 OpenAI 陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连 CTO 都无法说清其最热门模型的训练数据来源,难免让人怀疑 OpenAI 高层对该问题的重视程度。

据报道,采访结束后,Murati 私下承认了确有使用 Shutterstock 视频训练 Sora。然而,相较于网络上浩如烟海的视频内容,来自 Shutterstock 的素材可能只是 Sora 训练数据的一小部分。

IT之家注意到,Murati 的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO 竟然对如此关键的问题不知情,实在令人难以置信。

然而,也有人为 Murati 辩护,认为既然内容已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开内容,就应该承担被使用的风险。

Murati 的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的 AI 训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。

相关资讯

突发!OpenAI CEO Sam Altman被开除、退出董事会

Sam Altman 是拿到了乔布斯的剧本?自 ChatGPT 爆火以来,Sam Altman 也成为了 OpenAI 的门面以及代表性人物。这段时间以来,他一直活跃在宣传 OpenAI 与 ChatGPT 的舞台上,而 OpenAI 从估值到知名度也一直在蒸蒸日上。可以说 Sam Altman 与 OpenAI 这两个名字,有了极为深度的绑定。但令人惊讶与意外的是,今天 OpenAI 官方公告宣布:Sam Altman 将卸任首席执行官并退出董事会。临时接任他担任 CEO 的是 OpenAI CTO Mira M
11/18/2023 10:30:00 AM
李亚洲

前OpenAI CTO Mira Murati新公司完成20亿美元融资,推进多模态AI研发

前OpenAI首席技术官Mira Murati创立的人工智能初创公司Thinking Machines Lab宣布完成20亿美元种子轮融资,由Andreessen Horowitz(a16z)领投,NVIDIA、AMD、Accel、ServiceNow、Cisco和Jane Street等知名机构参投。 此次融资使公司估值达到120亿美元,成为AI领域最大规模的早期投资之一,凸显了Murati在AI行业的强大影响力据悉,Thinking Machines Lab成立于2025年2月,总部位于旧金山,定位为公共利益公司,致力于开发多模态AI,以自然方式与人类互动,包括对话、视觉和协作等场景。 Murati表示,公司目标是构建“与人类协作的通用智能”,使AI更易理解、可定制并广泛应用于各领域。
7/16/2025 3:01:25 PM
AI在线

New Company of Former OpenAI CTO Mira Murati Completes $2 Billion Funding to Advance Multimodal AI Development

The artificial intelligence startup Thinking Machines Lab, founded by Mira Murati, the former Chief Technology Officer of OpenAI, announced a $2 billion seed round of funding, led by Andreessen Horowitz (a16z), with participation from well-known institutions such as NVIDIA, AMD, Accel, ServiceNow, Cisco, and Jane Street.
7/16/2025 4:11:39 PM
AI在线

种子轮就估值120亿美元,她能打造另一个OpenAI吗?

据《金融时报》报道,OpenAI 前 CTO Mira Murati 的创业公司 Thinking Machines Lab 在一轮「种子轮融资」中成功募集了 20 亿美元,投后估值达到 120 亿美元,成为硅谷历史上规模最大的种子轮融资之一。 从「几百万」到「二十亿」20 亿的种子轮投资是什么概念? 让我们先从一个金融知识开始。
7/16/2025 4:30:00 PM
机器之心

超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片

北大团队联合兔展发起的 Sora 复现计划,现在有了新成果。OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初,北大团队联合兔展启动了 Sora 复现计划 ——Open Sora Plan,该项目希望通过开源社区的力量复现 Sora。项目上线一个月,星标量已经达到 6.6k。项目地址
4/8/2024 2:50:00 PM
机器之心

Sora2公布提示词指南!直接抄作业能玩一整天!

最近你要问我什么最火,我可能会毫不犹豫地告诉你:Sora 2。 这玩意以一种不讲武德的姿态,短短7天狂飙62.7万下载量,把前辈GPT都拍在了沙滩上,直接登顶了App Store的榜首。 连奥特曼都亲自下场盖章,说这是创意领域的GPT 3.5时刻。
10/11/2025 8:30:55 AM
彭彭

掌握这10条实用技巧,让Sora2生成AI视频更真实!

本文作者系360奇舞团前端开发工程师。 最近 Sora2 推出后迅速流行,其对于音画生成结合的能力,让画面常常有以假乱真的效果,但有时大概也会有这种感觉:画面已经够清晰了、动作也顺畅了,可有时它依然“假”——像是一个完美的模拟,却没有那种“被镜头记录下来”的感觉。 其中原因是:AI生成的是内容,而真实视频包含的是物理规律 摄影语言 人的意图。
10/24/2025 2:09:18 AM

OpenAI 视频生成服务 Sora 引发隐私担忧,意大利数据监管机构展开调查

感谢意大利数据保护机构 (Garante) 周五宣布,已对微软支持的 OpenAI 公司开发的一项服务展开调查,这个名为 Sora 的服务可以根据文本提示生成视频。监管机构要求 OpenAI 澄清其向用户和非用户告知其产品 Sora 使用的数据的方式是否符合欧盟法规。OpenAI 公司暂未对此事发表评论。意大利数据监管机构是欧盟国家中最为积极的监管机构之一,一直致力于评估人工智能平台是否符合欧盟的数据隐私法规。IT之家注意到,去年该机构就以涉嫌违规使用用户数据为由,禁止了聊天机器人 ChatGPT 在意大利的使用。
3/10/2024 5:42:41 PM
远洋

全球首个类 Sora 开源复现方案来了!全面公开所有训练细节和模型权重

全球首个开源的类 Sora 架构视频生成模型,来了!整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。还能用航拍视角,展现悬崖海岸边,海水拍打着岩石的画面。亦或是延时摄影下的浩瀚星空。自 Sora 发布以来,由于效果惊艳但技术细节寥寥,揭秘、复现 Sora 成为了开发社区最热议话题之一。比如 Colossal-AI 团队推出成本直降 46% 的 Sora 训练推理复现流程。短短两周时间后,该团队再次发布最
3/18/2024 2:58:56 PM
清源

OpenAI公布「官方爬虫」:GPT-5靠它训练,有需要可以屏蔽

众所周知,OpenAI 从 GPT-4 开始就已经对技术细节完全保密了,最初只用一份 Tech Report 来展示基准测试结果,而闭口不谈训练数据和模型参数。尽管后来有网友各种爆料,OpenAI 也从未回应。
8/8/2023 2:24:00 PM
机器之心

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢

新智元报道  编辑:Aeneas 好困【新智元导读】2026 年的数据荒越来越近,硅谷大厂们已经为 AI 训练数据抢疯了!它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天 AI 忽然吐出了我们的自拍照或者隐私聊天,该怎么办?谁能想到,我们多年前的聊天记录、社交媒体上的陈年照片,忽然变得价值连城,被大科技公司争相疯抢。现在,硅谷大厂们已经纷纷出动,买下所有能购买版权的互联网数据,这架势简直要抢破头了!图像托管网站 Photobucket 的陈年旧数据,本来已经多年无人问津,但
4/7/2024 1:36:43 PM
远洋

真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界

以后的视频生成领域,恐怕真的只有 OpenAI 的 Sora 和其他模型了。昨天,OpenAI 发布的首个文本生成视频模型 Sora 引爆了社区,其生成的长达 1 分钟的高清、流畅视频令人们惊叹不已,直呼「好莱坞的时代结束了」。仅仅一年时间,文本生成视频的效果迎来了质的飞跃。                              图源:,随着 Sora 加入这场视频生成领域的战争,受到冲击最大的是同类竞品模型,比如 Runway、Pika、SDV、谷歌和 Meta。看到 Sora 的生成效果之后,很多人认为,S
2/19/2024 12:11:00 PM
机器之心

Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放

感谢近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。”对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但
3/13/2024 4:31:15 PM
清源

OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频

《华尔街日报》当地时间 13(今)日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑 Sora 生成的内容,“因为 AI 工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时,穆拉蒂没有给出非常具体的答案:“我不打算详谈所使
3/13/2024 10:30:35 PM
清源

开发者再分享 OpenAI Sora 生成的短视频:树叶大象、彩虹瀑布等

OpenAI 今年 2 月推出 Sora 模型之后,迅速成为 AI 圈内头条,能够基于用户的一句话,生成最长 1 分钟的视频,效果接近实拍。OpenAI 目前并未向公众发布 Sora,不过开发者 @LinusEkenstam 近日发布系列推文,展示了由 Sora 生成的 9 段新视频,包括被树叶覆盖的大象、蜜蜂视角飞跃花丛,以及彩虹颜色的瀑布等等。提示词:“An elephant made of leaves running in the jungle”(树叶做的大象在丛林中奔跑) 提示词:“An adorable
3/19/2024 11:52:53 AM
故渊

消息称 OpenAI 将与好莱坞电影公司会面并推荐 Sora

感谢据彭博社报道,OpenAI 计划下周在洛杉矶与好莱坞电影公司、媒体高管和人才经纪公司举行会议。知情人士透露,本次会议计划建立娱乐行业的合作伙伴关系,并鼓励电影制作人将其新的人工智能视频生成器整合到他们的工作流中。OpenAI 希望向好莱坞推介其 AI 视频生成工具 Sora,公司 CEO Altman 已经在奥斯卡电影节周末出席洛杉矶的多场派对。据IT之家此前报道,OpenAI Sora 模型可以严格根据用户输入的提示词,制作长达一分钟的视频,保持较高的视觉质量。该模型可以深度模拟真实物理世界,标志着人工智能在
3/23/2024 10:12:14 AM
浩渺

OpenAI 邀请艺术家们试用文生视频工具 Sora:气球脑袋、会飞的猪

感谢近日,OpenAI 公司近日邀请部分艺术家试用了其人工智能视频创作工具 Sora。通过使用 Sora,艺术家们创作了一系列惊艳的实验性短片,将人工智能的强大和新奇展现得淋漓尽致。 与我们熟悉  OpenAI  的聊天机器人 ChatGPT 和图片生成平台 DALL-E  不同,Sora 目前仍未面向大众开放。本周一,OpenAI 公司在其博客中发布了一篇名为“Sora:第一印象”的文章,展示了视觉艺术家、设计师、创意总监和电影制作人使用 Sora 创作的成果。这些短片时长从 20 秒到一分半不等,画面精美绝伦,
3/26/2024 4:22:18 PM
远洋

在好莱坞发动“魅力攻势”,消息称 OpenAI 向派拉蒙、环球等影业巨头展示 Sora

感谢据英国《金融时报》报道,OpenAI 近期在好莱坞发动了一场“魅力攻势”—— 与派拉蒙、环球和华纳兄弟探索等主要电影公司举行会议,展示其视频生成技术 Sora,并缓解对人工智能模型将损害电影行业的担忧。报道援引多位知情人士消息称,OpenAI 首席执行官山姆・阿尔特曼和首席运营官布拉德・莱特凯普在近期数日间举行的会议上,向影业巨头高管们做了 Sora 的产品介绍。参与会议的人员表示,OpenAI 正在就如何推出 Sora 寻求影业高管们的意见。一些观看了演示的人说,他们可以看到 Sora 或类似的人工智能产品如
3/29/2024 5:35:09 PM
清源
  • 1