Sora
OpenAI 一年亏 50 亿美元,高盛报告乌龙引 AI 股“地震”
刚刚,外媒曝出:Sora 陷入了研究困境!背后原因,就是安全风险以及与好莱坞的合作。另外,最近高盛的报告错误解读了 ChatGPT 流量下降,直接引爆市场的恐慌情绪,导致 AI 股票纷纷被抛售。Sora 深陷研究困境?Sora 在今年二月发布后,至今还是「期货」,为何迟迟不开放呢?就在最近,外媒 CNBC 曝出,OpenAI 的 Sora 模型之所以鸽了这么久,原因在于「和政策制定者的对话」。早在 2 月底,彭博社就曾报道,考虑到今年的美国大选,OpenAI 希望竭力避免安全风险。此外还有一个原因,就是当时的 So
9/9/2024 5:21:53 PM
清源
在海外,Sora 正在被可灵替代
从没想过中国第一个让国外网友求着开放会员订阅通道的AI应用居然是出自快手。 在经历一个多月的狂奔吸引上百万人排队内测之后快手可灵终于全面开放,最有意思的是直到开放测试之前还有网友表示自己没排进去内测。 狗BEE 提示词:长着小狗身体的蜜蜂在花丛中飞而在内测过程中,中外网友则经历了身份互换,外网用户也体验了一把之前国内网友求手机号注册chatgpt的辛酸。
7/30/2024 6:36:00 PM
林杰鑫
人刚毕业,颠覆整个AI界:扒一扒Sora两带头人博士论文
看看这个时代最伟大 AI 学者的研究脉络。2024 年是生成式 AI 元年,才到 2 月,OpenAI 就用 Sora 把竞争推向了视频生成的新高度。我们都还记得初见 Sora 作品时受到的震撼,感叹其他竞争对手想要赶上 OpenAI,至少也得需要个半年到一年的时间。Sora 发布后,其开发团队自然也成为关注焦点,人们都想知道具有跨时代意义的 AI 技术是如何被开发出来的。DiT 模型作者谢赛宁曾表示:「他们每天基本不睡觉高强度工作了一年」。随着时间推移,答案正被慢慢揭晓。以下是 OpenAI 技术报告中,Sora
7/1/2024 3:29:00 PM
机器之心
首个类 Sora 开源复现方案,Open Sora 可在英伟达 RTX 3090 显卡上 AI 生成视频:最高 4 秒 240P
作为全球首个类 Sora(OpenAI 的文本生成视频模型)开源复现方案,Open-Sora 可以在英伟达 RTX 3090 GPU 上基于文本生成视频,最高可以生成 240P 分辨率、时长最长 4 秒的视频。处理 AI 任务的 GPU 云服务提供商 Backprop 展示了基于 Open-Sora V1.2 的 AI 环境,展示 4 个基于提示词生成的视频。Backprop 表示:“在 RTX 3090 GPU 上,用户可以生成最高 240p、时长 4 秒的视频,生成 2 秒视频大约需要 30 秒,4 秒视频大约
6/28/2024 2:11:17 PM
故渊
视频大模型能制片了,全球首部 Sora 生成宣传片《玩具反斗城的起源》亮相
当地时间 6 月 24 日,全球知名的玩具店“玩具反斗城”发布了全球首部利用 OpenAI 视频生成大模型 Sora 制作的宣传片《玩具反斗城的起源》。 据介绍,《玩具反斗城的起源》影片由四次艾美奖获奖制片人、玩具反斗城工作室总裁 Kim Miller Olko 担任执行制片人,Native Foreign 的 Nik Kleverov 担任导演。Sora 可以生成长达一分钟的视频,这次生成的视频包含逼真的场景和多个角色,所有内容均基于用户输入的指令。这部品牌宣传片讲述了玩具反斗城创始人 Charles Lazar
6/26/2024 3:42:44 PM
清源
徐图智能徐东:文生视频创业,要用坚定信仰对抗 fomo 的大厂
在 GPT-4 发布一年多后,OpenAI 推出 GPT-4o,是有史以来第一个真正实现「多模态输入—多模态输出」的多模态模型。 GPT-4o 的出现所传递的信息是:在底层模型并没有变得更智能的情况下,能够跨多种模态进行推理的模型必然是更加通用的。 因为其不仅具备多种功能,还能以不同模态传递知识。
6/20/2024 3:28:00 PM
王悦
又一Sora级选手来炸街!我们拿它和Sora、可灵PK了下
当Sora「千呼万唤」不出来时,OpenAI 的对手们却纷纷祭出大杀器来炸街。Sora 再不开放使用,真的要被偷家了!今日,旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine。人人免费可用。据介绍,该模型能够根据简单的文本描述生成高质量、逼真视频,效果堪比 Sora。消息一出,大量用户挤进官网尝鲜。尽管官方声称该模型能在短短两分钟内生成 120 帧视频,但由于访问量激增,许多用户在官网中苦苦等待数小时。Luma 的产品增长主管 Barkley Dai 不得不在
6/14/2024 11:48:00 AM
机器之心
全流程拆解!手把手带你制作AI视频短片
2024 年是多模态人工智能 AI 技术爆发飞跃的一年,尤其是 AI 视频迎来了快速发展的阶段,以及随着今年年初 Open AI 突然发布的首个文生视频大模型——Sora,AI视频在极短时间内受到了公众的广泛关注,AI视频为广大创作者和相关从业人员,在创意表达和内容创作领域上开辟了新的可能性,也预示着AI视频未来将持续融入更先进的技术,推动该领域发展至新高度。
6/14/2024 7:21:33 AM
团队新浪MDC
AI 电影来袭:翠贝卡电影节将展映 5 部使用 OpenAI Sora 制作的短篇
由著名演员罗伯特・德尼罗 (Robert de Niro) 创立的纽约翠贝卡电影节 (Tribeca Festival) 即将迎来历史性时刻,生成式人工智能将首次登上这个已有 20 年历史的电影盛会。6 月 15 日,翠贝卡电影节将携手 OpenAI 公司首映“Sora 短片”,届时将展映五部使用人工智能创作的短片作品,这标志着 OpenAI 的文本转视频工具 Sora 首次在电影节上亮相。根据电影节发布的声明,创作者们承诺遵守去年与导演、演员和编剧工会达成的有关人工智能使用的相关条款。主办方为这些电影人提供了 O
6/3/2024 11:42:26 AM
远洋
「Sora平替」来了!一键生成5秒视频,还免费,我们实测:很顶!
机器之能报道编辑:山茶花人家主打一个免费,还要啥自行车。自 Sora 发布以来,AI 圈掀起一场轰轰烈烈的文生视频革命。例如,Lightricks 推出生成式 AI 视频讲故事平台 LTX Studio,Genmo 融资 3000 万美元躬身入局,还有上周谷歌兴奋发布的 Veo…… 无一例外,都打着「对标 Sora」的旗号。最近,AI 文生视频领域又迎踢馆者 ——Viva,号称「让每一刻都栩栩如生」。该应用不仅可以文生视频、图生视频,还支持 4K 分辨率放大功能。其中文生视频可生成 5 秒视频,图生视频则为 4 秒
5/21/2024 5:19:00 PM
机器之能
Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果
「不怕 AI 消灭人类,就怕用 AI 的人太聪明。」今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。据悉,这
4/29/2024 2:53:00 PM
机器之心
Sora 大片真相:人工特效参与,被指误导大众
啊?Sora 火爆短片《气球人》,也“造假”了???背后艺术家团队的最新揭秘,可谓一石激起千层浪:原来,视频画面并非完全由 AI 生成,其中有大量视觉效果需要人类后期实现。be like:这下网友不干了,合着大家伙儿跟 OpenAI 玩真心,OpenAI 背后却耍起心眼子来了:他们含糊其辞,就是希望观众认为短片完全是 AI 生成的,这是不是有点不诚实了啊。这不是人工智能生成的视频,而是使用了一些 AI 技术的视频。还有网友直接开喷:误导性营销!这是误导性营销!究竟是怎么个事儿,咱们还是具体捋一捋。揭秘 Sora 大
4/29/2024 12:13:52 PM
远洋
Adobe Premiere Pro 将支持 AI 视频编辑功能! 可接入 Sora、Runwa 等模型
大家好,这里是和你们一起探索 AI 的花生~
AI 技术目前在视频生成领域有广泛应用,出现了很多成熟的工具,比如 Sora、Runway、Pika、Stable Video、Dreamina 等,它们都可以直接通过文本或图像生成动态视频。与此同时,AI 技术在视频编辑方面的应用也越来深入,Runway 早就在其视频编辑工具中加入了智能抠图、动态追踪、局部重绘、智能调色的功能,我们熟悉的剪映已经支持智能字幕、音色克隆、视频无痕翻译、数字人等功能。
相关推荐:这两天,Adobe 也宣布将为其旗下的专业视频编辑软件 Pr
4/17/2024 8:44:22 AM
夏花生
超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片
北大团队联合兔展发起的 Sora 复现计划,现在有了新成果。OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初,北大团队联合兔展启动了 Sora 复现计划 ——Open Sora Plan,该项目希望通过开源社区的力量复现 Sora。项目上线一个月,星标量已经达到 6.6k。项目地址
4/8/2024 2:50:00 PM
机器之心
攻陷短视频后,Sora将需要72万块H100 GPU
在被大规模采用后,Sora 的推理成本将很快超过训练成本。OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频,吸引了全世界的目光。近日,投资机构 factorial funds 发表了一篇博文,深入探讨了 Sora 背后的一些技术细节,并对这些视频模型可能产生影响进行了探讨。最后,文中还讨论了对用于训练 Sora 等模型的算力的看法,并对训练计算与推理计算的算力比较进行了预测,这对估计未来 GPU 需求具有重要意义。机器之心对此文进行了整理。本报告的主要调查结果总结如下:Sora 是一个建立在扩
4/6/2024 11:51:00 PM
机器之心
YouTube CEO 点名 OpenAI:若利用其平台视频训练 AI 模型属违规行为
感谢YouTube 首席执行官尼尔・莫汉(Neal Mohan)近日在采访中公开表示,尽管没有直接证据表明 OpenAI 使用 YouTube 视频来训练 Sora(文本生成视频的 AI 模型),但警告称这种行为违反了 YouTube 现行的平台服务条款。莫汉在接受彭博社采访时强调,下载 YouTube 视频,然后用于训练 Sora 等 AI 模型显然违反了平台的相关条款。莫汉表示:“从创作者的角度来看,当创作者将他们的辛勤劳动上传到我们的平台时,他们有一定的期望。其中之一就是符合 YouTube 的服务条款,不允
4/6/2024 9:20:33 AM
故渊
OpenAI 展示 Sora AI 生成的首支音乐短片《Worldweight》
感谢OpenAI 近日在其 YouTube 官方频道发布视频,介绍了由 August Kamp 参与制作,完全由文本转视频 AI 模型 Sora 生成的首支音乐短片《Worldweight》。 这支音乐短片(Music Video)完全由 Sora 生成,然后 Kamp 再拼接相关片段形成时长为 2 分 19 秒的音乐短片,宽高比为 8:3,展现了各种环境的模糊镜头。Kamp 并未透露《Worldweight》具体使用了哪些提示词,IT之家翻译该视频描述如下:身心融合,完全沉浸、徜徉在艺术世界中的那个时刻至今仍萦绕
4/4/2024 4:29:28 PM
故渊
全日程发布|Sora之后的视频生成技术与应用
说起 Sora,相信大家都不陌生。近一个多月内,关于 Sora 的讨论延伸到了各个角落,这个一直没有对外开放的视频生成模型,不仅让人惊艳,更让人焦虑。作为持续关注 AI 技术前沿的团队,机器之心特别策划了「视频生成技术与应用 — Sora 时代」的技术论坛。本次活动聚焦 Sora 发布后的技术创新、思考与应用实践,希望能帮助大家构建一个完整的视频生成知识图谱。面对扑面而来的 AI 视频生成,积极拥抱学习并敢于尝试,才能抓住技术潮流,破局而生。期待 2024.04.13,在北京海淀区,和你相遇。活动全日程论坛报名通道
4/1/2024 11:41:00 AM
机器之心
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊