Sora

从直观物理学谈到认知科学，Sora不是传统物理模拟器盖棺定论了？

本文篇幅很长，主题很多，但循序渐进，对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。最近，OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外，OpenAI 更是将 Sora 定义为一个「世界模拟器」（world simulators）。当然，这一说法遭到了包括图灵奖得主 Yann LeCun 在内很多学者的反驳。LeCun 的观点是：仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界，生成视频的过程与基于世界模型的因果预测完全不同。近日，澳大利亚麦考瑞大学

3/18/2024 11:47:00 AM 机器之心

美图创始人吴欣鸿：Sora 给行业较大心理冲击，原本以为 2-3 年后才能实现

美图公司昨日披露 2023 年业绩报告，全年实现总收入 27 亿元，同比增长 29.3%。经调整后归属于母公司权益持有人净利润 3.7 亿元，同比增长 233.2%。据新浪科技报道，美图公司创始人、董事长兼首席执行官吴欣鸿在业绩会上表示，AI 原生工作流会是未来非常巨大的机会，美图会致力于 AI 原生应用的进一步打造。同时他还强调，美图不会做通用大模型，但美图会针对不同垂直场景的需求做模型的训练和微调。吴欣鸿透露，Sora 给了行业较大的心理冲击，原本以为这样的能力会在 2-3 年后才能实现。Sora 也让美图反省

3/16/2024 7:48:21 AM 浩渺

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

采访首次揭示出 Sora「有所为（比如，将生成效果逼向极限）」和「有所为不为（比如短期内不开放、不生成公众人物）」背后的深层考量——找到一条将 AI 融入日常生活的正确道路是极其困难的，但也绝对值得一试。OpenAI 的 Sora 在今年 2 月横空出世，把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限，但是在各媒体平台上，Sora 的身影无处不在，大家都在期待着使用它。在前几天的访谈中，三位作者透露出 Sora 的更多细节，包括它处理手部时仍然存在困难，但正在优化。他们也对 S

3/15/2024 3:28:00 PM 机器之心

OpenAI 首席技术官：文生视频工具 Sora 数月内将公开发布，拟支持生成音频

《华尔街日报》当地时间 13（今）日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示，Sora 将在今年推出，“可能要等几个月”。穆拉蒂表示，除了面向公众公开提供 Sora 外，OpenAI 还计划加入音频生成功能，可能会使场景更为逼真。此外，公司还计划允许用户自己编辑 Sora 生成的内容，“因为 AI 工具并不总能生成准确的结果”。她说，公司正在试图找寻方法，使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时，穆拉蒂没有给出非常具体的答案：“我不打算详谈所使

3/13/2024 10:30:35 PM 清源

Sora 团队负责人称 Sora“还不是一个产品”，短期不会向公众开放

感谢近日，YouTube 频道 WVFRM Podcast 在其节目中，邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注：三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh，均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题，其称目前 Sora 仍处于反馈获取阶段，“还不是一个产品，短期之内不会向公众开放。”对于什么时候把它变成一个产品，我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它，但

3/13/2024 4:31:15 PM 清源

OpenAI 视频生成服务 Sora 引发隐私担忧，意大利数据监管机构展开调查

感谢意大利数据保护机构 (Garante) 周五宣布，已对微软支持的 OpenAI 公司开发的一项服务展开调查，这个名为 Sora 的服务可以根据文本提示生成视频。监管机构要求 OpenAI 澄清其向用户和非用户告知其产品 Sora 使用的数据的方式是否符合欧盟法规。OpenAI 公司暂未对此事发表评论。意大利数据监管机构是欧盟国家中最为积极的监管机构之一，一直致力于评估人工智能平台是否符合欧盟的数据隐私法规。IT之家注意到，去年该机构就以涉嫌违规使用用户数据为由，禁止了聊天机器人 ChatGPT 在意大利的使用。

3/10/2024 5:42:41 PM 远洋

Sora 竞争对手融资数千万美元，目前可免费“薅”

机器之能报道编辑：Sia效果确实没法和Sora比，但和其他对手水平差不多。对于需要快速、低成本地制作商业推广视频的主体来说，又多了一个不错的选择。情绪的所有颜色，基于 Genmo 最新模型生成的作品视频链接："a dramatic black and white photo of a lighthouse at night, crashing waves on shore" AI 视频生成创业公司——以及它的新投资者——在竞争中可能会得到比预想更多的东西。The information 从 3 名知情人士处获悉，A

3/8/2024 6:59:00 PM 机器之能

Sora 时代的 AI 视频生成何去何从？

3/7/2024 3:01:00 PM 机器之心

怒斥Sora之后，LeCun放出「视觉世界模型」论文，揭示AI学习物理世界的关键

Sora 的发布让整个 AI 领域为之狂欢，但 LeCun 是个例外。面对 OpenAI 源源不断放出的 Sora 生成视频，LeCun 热衷于寻找其中的失误：归根结底，LeCun 针对的不是 Sora，而是 OpenAI 从 ChatGPT 到 Sora 一致采用的自回归生成式路线。LeCun 一直认为， GPT 系列 LLM 模型所依赖的自回归学习范式对世界的理解非常肤浅，远远比不上真正的「世界模型」。所以，一遇到「Sora 是世界模型」的说法，LeCun 就有些坐不住：「仅仅根据 prompt 生成逼真视频并

3/5/2024 11:53:00 AM 机器之心

0.5秒，无需GPU，Stability AI与华人团队VAST开源单图生成3D模型TripoSR

最近，文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮，模型的多模态能力引起广泛关注。现在，AI 模型在 3D 内容生成方面又有了新突破。专长于视觉内容生成的 Stability AI 继图片生成（Stable Difussion 3 上线）、视频生成（Stable Video 上线）后紧接在 3D 领域发力，今天宣布携手华人团队 VAST 开源单图生成 3D 模型 TripoSR。TripoSR 能够在 0.5s 的时间内由单张图片生成高质量的 3D 模型，甚至无需 GPU 即可运行。TripoSR 模

3/5/2024 11:43:00 AM 机器之心

Sora 发布两周后，关于 Sora 的一些冷思考

两周前的今天，北京时间 2 月 16 日，OpenAI 、谷歌、Meta、Stability 都在这一时间节点前后发布文生视频模型成果，但只有 OpenAI 的 Sora 在这场角逐中破圈而出，成功抢占全球的注意力。可以说，Sora 打响了文生视频大模型行业 2024 年的第一炮。面对 Sora 着实优异的视频生成效果，短时间内 AIGC 行业内掀起一轮又一轮讨论，一方面，没人想到 OpenAI 的动作如此之快，令人激动兴奋的同时也来不及招架，另一方面，也都在为其 “60秒超长长度”、“单视频多角度镜头”和“世界模型”的等炸裂的效果震惊，并声称会迎来行业洗牌。

3/4/2024 11:48:00 AM 林军

大一统视频编辑框架：浙大&微软推出UniEdit，无须训练、支持多种编辑场景

随着 Sora 的爆火，人们看到了 AI 视频生成的巨大潜力，对这一领域的关注度也越来越高。除了视频生成，在现实生活中，如何对视频进行编辑同样是一个重要的问题，且应用场景更为广泛。以往的视频编辑方法往往局限于「外观」层面的编辑，例如对视频进行「风格迁移」或者替换视频中的物体，但关于更改视频中对象的「动作」的尝试还很少。 UniEdit 视频编辑结果（动作编辑、风格迁移、背景替换、刚性 / 非刚性物体替换）本文中，来自浙江大学、微软亚洲研究院、和北京大学的研究者提出

3/4/2024 11:43:00 AM 机器之心

微软37页论文逆向工程Sora，得到了哪些结论？

一篇论文回顾 Sora 文生视频技术的背景、技术和应用。追赶 Sora，成为了很多科技公司当下阶段的新目标。研究者们好奇的是：Sora 是如何被 OpenAI 发掘出来的？未来又有哪些演进和应用方向？Sora 的技术报告披露了一些技术细节，但远远不足以窥其全貌。在最近的一篇文章中，微软研究院和理海大学的研究者根据已发表的技术报告和逆向工程，首次全面回顾了 Sora 的背景、相关技术、新兴应用、当前局限和未来机遇。论文标题：Sora: A Review on Background, Technology, Limit

3/1/2024 3:17:00 PM 机器之心

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

作为 2024 开年王炸，Sora 的出现树立了一个全新的追赶目标，每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 OpenAI 披露的技术报告，Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式，并通过 Transformer 和扩散模型结合，展现了卓越的扩展（scale）特性。在报告公布后，Sora 核心研发成员 William Peebles 和纽约大学计算机科学助理教授谢赛宁合著的论文《Scalable Diffusion Models with Transform

2/29/2024 3:06:00 PM 机器之心

重磅发布！Stable Video 零基础使用教程及应用案例

前言上周 Stable Video 开放公测，可以生成 4s 视频，我第一时间体验了一波。相比 Sora 可生成 60s 多角度多机位多角色的视频，Stable Video 效果没有那么惊艳。但是相比市面上主流的 AI 视频 Runway、pika 等还是有一定优势的，下文中我也会进行效果对比。目前 Stable Video 对所有用户都可以免费开发，每天可领 150 积分，图生视频每使用一次消耗 10 积分，文生视频消耗 11 积分，还可以付费升级。接下来让我们一起来试一试吧。关于 Sora：一、初步体

2/28/2024 7:39:34 AM yaoyao

从 Sora 的发展史，聊聊设计师如何面对 AI 焦虑

经过春节小休整，很多朋友都鼓起信心重新出发，因为吉祥话听多了还是会受用，没想到返岗途中还没来得及跟大家道句开工大吉，资讯话题就被Sora的发布信息填满。关于这款神器的详细介绍：Sora的发布让人感叹科幻电影都不敢这样拍，而且很多权威平台都认为奥特曼的大招还没亮出来，几句话做60秒视频只是前戏，先吊吊大家胃口，为他后面融资铺垫。此图最近已经符号化了 Sora这个名字据说来自日文中的“空”（そら sora），象征“无限创造力”，众所周知，空也是佛家用语，以我的无知只能找来《道德经》的“无”来应战，无中生有，有生于无，

2/27/2024 12:40:44 AM 设计史太浓

Sora 面世，视频生成的 GPT-3 时刻来了

2月16日凌晨，正值中国春节法定节假日期间，OpenAI 毫无预兆地发布了 AI 视频生成大模型 Sora。看过视频效果后，网友纷纷感叹「现实，不存在了。」不夸张地说，Sora 的技术结果直接碾压了过去世界范围内所有文生视频的探索结果，颠覆了 AI 短视频生成的现状。

2/26/2024 7:05:00 PM 林军

国内公司有望做出Sora吗？这支清华系大模型团队给出了希望

在 Sora 代表的视频生成路线上，国内公司其实已有一定的技术储备。2023 年年底，很多人都预测，未来一年将是视频生成快速发展的一年。但出人意料的是，农历春节刚过，OpenAI 就扔出了一个重磅炸弹 —— 能生成 1 分钟流畅、逼真视频的 Sora。它的出现让很多研究者担心：国内外 AI 技术的差距是不是又拉大了？ Sora 生成的新视频根据 OpenAI 披露的技术报告，Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表示形式，并通过 Tr

2/26/2024 6:51:00 PM 机器之心

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 大语言模型字节跳动 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

Sora

从直观物理学谈到认知科学，Sora不是传统物理模拟器盖棺定论了？

美图创始人吴欣鸿：Sora 给行业较大心理冲击，原本以为 2-3 年后才能实现

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

OpenAI 首席技术官：文生视频工具 Sora 数月内将公开发布，拟支持生成音频

Sora 团队负责人称 Sora“还不是一个产品”，短期不会向公众开放

OpenAI 视频生成服务 Sora 引发隐私担忧，意大利数据监管机构展开调查

Sora 竞争对手融资数千万美元，目前可免费“薅”

Sora 时代的 AI 视频生成何去何从？

怒斥Sora之后，LeCun放出「视觉世界模型」论文，揭示AI学习物理世界的关键​

0.5秒，无需GPU，Stability AI与华人团队VAST开源单图生成3D模型TripoSR

Sora 发布两周后，关于 Sora 的一些冷思考

大一统视频编辑框架：浙大&微软推出UniEdit，无须训练、支持多种编辑场景

微软37页论文逆向工程Sora，得到了哪些结论？

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

重磅发布！Stable Video 零基础使用教程及应用案例

从 Sora 的发展史，聊聊设计师如何面对 AI 焦虑

Sora 面世，视频生成的 GPT-3 时刻来了

国内公司有望做出Sora吗？这支清华系大模型团队给出了希望

怒斥Sora之后，LeCun放出「视觉世界模型」论文，揭示AI学习物理世界的关键