AI在线 AI在线

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

刚刚,字节的火山引擎的发布会基本结束了。 我现在有点过于激动。 虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。 字节正式发布了他们全新的两款 AI 视频模型: 豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。 他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。 真的,如果要给这个豆包 PixelDance

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

刚刚,字节的火山引擎的发布会基本结束了。

我现在有点过于激动。

虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。

字节正式发布了他们全新的两款 AI 视频模型:

豆包视频生成-PixelDance 模型和 Seaweed 模型。

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。

他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。

真的,如果要给这个豆包 PixelDance 模型,做一个总结,那就是三个词:

人物的复杂连续动作,多镜头组合视频,极致的运镜控制。

听着感觉有点难理解是不是?不用急,我一会详细来解释。

我先放几个 case,给大家感受一下这玩意的震撼:

真的,影视行业在之前,几乎没法用 AI,就是因为,人物表演太垃圾,还有场景和人物一致性太差,运镜说实话也不咋地。

现在,字节出手,将 AI 视频推上了全新的高度。

行业颠覆的奇点,就在今天,就在这个发布会上,正式到来了。

而我,在憋了整整 4 天后,也终于可以发出这篇文章。

对,4 天前,我就受字节邀请,提前测过了这个豆包 PixelDance 模型,当时给我震惊的无以复加,你知道,作为一个博主,测完了这么屌的东西,自然就是想第一时间分享出去,但是因为保密协议,我只能只字不提。

所以你就知道,我这 4 天,憋的有多难受。

而现在,一切都来了。我终于可以特么的说话了。

说回那三个最重要的特点:

人物的复杂连续动作,多镜头组合视频,极致的运镜控制。

一、可以做连续动作的人物表演

过往,AI 视频有一个很致命的点,就是看起来像 PPT 动画。

不管是 Sora 展示出来的视频、还是 runway、还是可灵等等,运动幅度再大,也只是镜头幅度大,从来没有人的复杂动作。

顶天了,转个身,或者快速跑个步,或者挥个手,或者拥抱一下。说实话,就单拥抱这个,都没几个 AI 视频能做出来的。

而如果让图里这个女生,摘下墨镜,站起身,然后走向雕像呢?

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

所有的 AI 视频,全部阵亡。

而这一次豆包 PixelDance,做到了,真的。

除了手上的表有一些些闪动,人物比例、动作、肢体、光影等等,几乎毫无瑕疵。

一个戏好看,人的动作表演,才是最重要的啊。

比如在《喜剧之王》里,在最后一幕,周星驰饰演的尹天仇,在对着柳飘飘喊出那句经典的“我养你啊”的台词之后,柳飘飘坐在离去的出租车里,哭的非常伤心,看了一会手上的钱和表,然后把他们放进包里,拿出尹天仇视为信仰的那本《演员的自我修养》,伤心的抱在胸口。

这段表演,是连续的。连续的东西,才有张力。你才能感受到,那痛彻心扉的情绪。

而现在,用 AI,生成可以做连续动作的人物表演,不再是空谈。

再看一个 case,男人喝了一口咖啡,然后放下,一个女人从背后走来。

还有,人物表情也很屌,老人笑着笑着,就哭了。

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

我也想哭,真的。

去年 8 月我做《流浪地球 3》预告片的时候,我就幻想过无数种关于 AI 做人物表演的可能。

仅仅一年后的今天,豆包就帮我圆了这个最大的梦。

二、多镜头组合视频

一张图+Prompt,就能生成风格、场景、人物一致的多镜头视频,这个能力,我只在 Sora 的宣传片里面看到过。

就是那个著名的一只狼对着月亮嚎叫的视频。

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

其实说实话,这个视频当时看,非常的震撼,但是现在看其实也还好,风格、角色和场景都太简单了,所以一致性很好保持,也没啥复杂的故事和分镜。

但就这样,现在,依然没有任何一个 AI 视频,能做到单视频多镜头,而且还能保证完美的一致性。

别跟我说 LTX studio 那种玩意,那个做做故事版还行,做正片?洗洗睡吧,别说场景了,人物保持全景、中景、特写统一都难。而且真的丑的出奇。

但是现在,豆包 PixelDance 做出来了,而且一致性简直无敌,真的。

而且,只需要一张图+Prompt 就行。

比如,这个。

Prompt:拿着镰刀的死神朝女人走近。特写女人的脸,她惊恐地尖叫。

或者,一场战斗。

Prompt:白色机器人抬起双手拿着一把步枪对着画面左侧不断射击。枪口射出一道绿色的能量光线。镜头变化成画面左侧是一个黑色的机器人,一道绿光从画面右侧快速射入,击中了它的身体,黑色机器人被击倒并爆炸。画面变了,白色机器人望向爆炸,它望向远处的爆炸,转身走出了画面。

又或者,看一个离奇的克苏鲁故事。

一张图和 Prompt,就能生成单视频多镜头,屌爆了,真的。 对于影视和广告行业来说,几分钟能瞬间调度后面两三个镜头的分镜,直接出成片。

普通人的使用门槛,也巨幅降低,人人都是导演,人人都可以做故事的时代。 如今,真的到来了。

三、极致的运镜控制

豆包 PixelDance 模型的运镜,是我见过最离谱,最牛逼的。

现在的 AI 视频的运镜控制,还基本集中在摄像机+运动笔刷两个功能的组合拳上,但是说实话,上限真的有限,很多大运镜和变焦,根本做不出来。

而豆包 PixelDance,效果真的就特娘的离谱。

什么鸟瞰缩放上移旋转这种基操我就不说了,关键是,直接一句话,各种 360 度围绕主体环绕、前后景变焦、摇摄、目标跟随、升降镜头什么玩意都行。

效果出奇的好,我第一次见到,在 AI 视频,运镜能这么牛逼,这么炫酷的。

直接看 case。

Prompt:女人微笑着低下头,镜头拉远,一个白人男人注视着这个女人。

变焦的极度自然顺滑,无敌,太无敌了。

还有这个,360 度大幅度环绕运镜。

Prompt:黑白风格,镜头环绕着戴墨镜的女人拍摄,从她侧面移动到正面,最后聚焦于女人的面部特写。

这是一张图,然后一句 Prompt 干出来的,你敢信?这动作幅度,这稳定性,比特么建模出来的还离谱,我真的服了。

你这让摄影们还怎么玩,疯了啊...

写在最后

Sora 一个巨型期货,从 2.16 号到如今,迟迟不见任何踪影。

而后,6.6 号,可灵默不作声,正式上线,代表了中国 Sora 的输出。

而今天,9.24 号,字节再把 AI 视频,推向一个全新的高度,是一个在 Sora 的宣传片里,都看不到的高度。

至此,中国不需要 Sora,豆包模型就是天。

豆包 PixelDance 也不需要什么中国版 Sora 的外号,豆包 PixelDance 就是豆包 PixelDance,他就是现在 AI 视频的天。

也至此,AI 视频不再是玩具,而是真正的,可以进入到影视、广告、动漫工作流中,带来一些全新的想象。

这一枪,由我们打响。

今天这个豆包 PixelDance 模型,就会优先对企业开启邀测,过几天上线火山方舟,至于啥时候上线即梦向 C 端用户全员开放,可能还得等一段时间,毕竟太新,他们说还想再优化优化模型能力,稳定了以后,就直接上线即梦,给全员开放了。

真的,也从来没有什么奇迹,一切都是沉淀多年的积累,一切都是如约而至。 今天,我也可以喊出那句台词:

字节,No.1!

相关资讯

字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”

据界面新闻3日消息,字节跳动旗下AI助手豆包现已上线图片理解功能,豆包App及豆包PC新增照片及相机按钮,上传图片后可识别图片内容。
12/4/2024 8:11:40 AM
清源

字节跳动豆包电脑版上线视频生成功能,内测用户每日可免费生成十支视频

字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
12/10/2024 3:36:14 PM
沛霖(实习)

字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品

豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。
12/18/2024 11:33:56 AM
清源

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力

字节跳动旗下豆包大模型今日对外公布了2024年全领域的技术进展,宣称自5月15日首次亮相的7个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。
12/30/2024 9:31:32 PM
清源

字节跳动豆包全新上线 AI 编程功能:支持一键上传多个本地代码文件、实时引入 GitHub 开源仓库

豆包官方公众号显示,豆包电脑版和网页版全新上线AI编程功能。该功能支持一键上传多个本地代码文件、实时引入GitHub开源仓库,快速获取项目的完整上下文,不需再逐段复制代码。
1/17/2025 9:01:37 AM
浩渺

DeepSeek 反思潮:AGI 既被重新审视,又被持续低估

2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
2/28/2025 11:45:00 PM
陈彩娴

字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%

字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
3/10/2025 5:42:41 PM
远洋

字节跳动豆包新版深度思考开启测试,支持边想边搜

据介绍,和之前的深度思考不同,新版功能将推理过程的思维链与搜索深度结合,支持边想边搜。思考过程中,豆包可基于推理多次调用工具、搜索信息,提供更加全面、准确的结果。
3/28/2025 9:30:23 AM
浩渺

字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型

字节跳动发布豆包1.5深度思考模型,采用MoE架构,总参数200B,激活参数20B,推理成本低于业界50%。新模型在数学、编程、科学推理及创意写作等任务中表现突出,还能结合视觉理解技术提供更多功能。#AI大模型##字节跳动#
4/17/2025 10:50:40 AM
远洋

火山引擎,「出击」Agent

作者 | 陈为锐编辑 | 陈彩娴2025 年已到年中,大模型的生死战已经进入下半场,其中一个鲜明的标志就是:今年除了 Agent,大模型领域几乎静悄悄。 一方面,下一代基础模型的技术壁垒已将具备竞争可能的团队逐渐收敛至中美数家,同时创新门槛在提高,“仅追随”而非“实际超越”难以吸引关注量,因此比拼底层技术的声量在降低。 以 Meta 为例,近日彭博社等媒体披露,由于扎克伯格对 4 月发布的 Llama 4 效果不满意、认为其在竞争中掉队了,计划在内部设立新的“超级智能小组”,准备下一轮冲刺。
6/13/2025 6:30:00 PM
陈为锐

告别代码恐惧症!豆包推出可视化AI编程,拖拽即可创建网页应用

字节跳动旗下AI助手豆包近日推出重磅功能更新,其AI编程"应用创造1.0"正式上线,为用户带来了前所未有的可视化编程体验。 豆包在6月16日的官方更新日志中宣布,"AI编程"功能已支持可视化编辑。 这一创新功能允许用户在生成网页应用后,可以直接在预览界面进行编辑操作,包括修改文字内容、智能更换图片,以及精准选择局部元素进行调整,操作便捷程度堪比编辑PPT文档。
6/24/2025 3:00:41 PM
AI在线

字节Seedream 4.0将全量开放!抢先评测来了,我们摸索出AI生图20种「邪修」玩法

打开多模态自由创作的大门。 谷歌 Nano Banana 掀起的全球创作狂欢尚未消退之际,字节又玩了把大的。 近日,字节跳动开始内测最新的豆包・图像创作模型 Seedream 4.0。
9/8/2025 5:26:00 PM
机器之心

设计师的文案加速器:5个超好用的AI写作助手工具测评

今天我要给大家介绍几款超级宝藏的 AI 写作助手工具,其中或许有大家所熟悉的产品。这些工具不仅精通语言艺术,更能在创作风格、语调和内容上提供专业的指导和支持。在接下来的章节中,我将介绍每个 AI 写作助手工具的简介、主要功能、使用场景以及使用示例。无论你是专注于视觉设计、用户体验设计,还是产品设计的专业人士,这些工具都将为你的工作流程带来显著的增益和创新灵感。让我们一起启程,探索这几款设计文案加速器吧~ 一、讯飞星火 简介:讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有 7 大核心能力,即文本生成、语言理解、
5/13/2024 1:00:42 AM
团队58UXD

输出效率拉满,体验全面进化!深度测评豆包超能创意2.0

嗨大家好! 周末愉快! 今天是豆包的铁粉阿真!
7/14/2025 1:48:05 AM
阿真Irene

游戏素材生成哪家强?6大AI神器深度测评!

随着游戏开发对效率和创意的需求提升,AI 生成工具成为行业趋势。 下面依据国内 AI 平台聚焦 豆包、即梦、可灵、魔触 AI、星流、Holopix AI 六大平台,从 生成模式、风格覆盖、适用场景、成本等展开深度测评,帮你精准选工具! 更多AI工具测评:AI 提示词示意:一、平台核心能力与游戏场景适配性1.
7/23/2025 1:00:11 AM
五月的枫叶

万字教程!10个保姆级案例教你速通全新AI模型Seedream 4.0

最近,火山引擎上线了豆包・图像创作模型 Seedream 4.0,我提前试了一下,应该各位也看到了各种非常强的玩法。 简单来说就是一个支持图片生成、连续图片编辑、多图参考的全能图像创作模型。 藏师傅玩了两天跑了上千张图片之后基本摸清了这个图像创作模型的能力,优秀的美学表现、世界知识、提示词遵循、一致性保持、精准的编辑能力、完美的中文支持,而且还能自定义生成比例,还有直出 4K 图片的能力,对于中文用户来说毫无疑问这就是当前 T0 级别的图像创作模型。
9/11/2025 2:27:06 AM
歸藏

Google、Meta又放大招!用嘴做视频的时代也要来了

大家好,这里是和你们聊设计的花生~ 近段时间 AI 工具发展势头越发迅猛,在为大家介绍过的 AI 模型中,DALLE·2 和 Midjourney 在文本生成图像的质量和精准度上有了大幅度优化提升,后起之秀 Stable Diffusion 则将 AI 模型的操作门槛降低到普通人都能轻松入门的高度。除了这些着力发展文本-图像(text-image)模型的科技公司,我在 8 月份也向大家概括地介绍过 Google、微软、Facebook 这些我们熟悉的互联网科技巨头在文本-图像 AI 模型上的研发成果,也同样有不凡的
10/11/2022 7:47:58 AM
夏花生

Runway!AI技术+视频制作的新一代视频内容生成工具

大家好,这里是和你们聊设计的花生~ 之前和大家聊过不少 AI 图像生成工具,有的可以根据文本生成图像,有的则是将 AI 技术运用到图像处理中,让扣除背景、消除画面元素成为非常轻松快速的事情,大大提升了设计师的工作效率。既然 AI 技术在图片处理的应用上如此成熟,那如果用到视频的剪辑制作上会有什么效果呢? Runway 官网: AI 技术的快速消除图像内容 比如在视频里实现一键抠图,将人物从背景中分离出来,进行背景更换或者插入文字图层:或者在视频里实现快速修图,用画笔一抹,就能去除视频中不需要的部分:甚至在视频里也
1/5/2023 7:04:55 AM
夏花生
  • 1