嗨大家好!我是阿真!
最近Grok也是发布了Grok Imagine v0.9,v0.9 引入语音优先界面、音频同步与图像转视频,仅需10-15秒生成6秒视频,支持多个模式。
上链接:https://grok.com/imagine
APP:Grok
简单小结(个人体验):
- 速度非常快,目前生成视频里我感觉真的是最快的,和即梦生成一组图片的速度差不多。
- 音画同步,视频品质在音画同步方面也是中上级别;文生图质量良莠不齐,有时候很好看
- 有时候比较丑,文生图比例限制3:4,图生视频会遵循原图比例。
- 上传更好的图片可以提高视频质量。
- 目前可以图生视频不能首尾帧,生成视频普遍为6-7秒。
- 导出视频无水印。
- 目前免费限量使用。
- 人声说话不太行,不如Wan 2.5,总体质量来说打不过Sora。
关于最新的Sora 2:
一、视频效果
把之前做测试存的图都给了Grok Imagine,剪了个不带脑子纯好玩的视频
当视频在手机上无法加载,可前往PC查看。进入到Grok生图视频的Imagine页面后,可以进行文生图或者直接上传图片生成视频。我发现这里发送提示词+上传图片有bug,从这里图生视频不能遵循视频提示词,可以上传图片生成视频后再在视频下方对话框中重新输入提示词
如果我们直接输入提示词然后生成图片后,会看到这个界面,点击满意的图片的右下角的图标即可一键生成视频,可以选择多张(无需提示词)
生成视频以后有4个模式,Normal(正常模式,生成安全、通用且高质量的图像或短视频)、Fun(趣味模式,更注重创意和幽默元素,能添加夸张、卡通化或意外的趣味效果)、Custom(自定义模式,通过提示词精细要求并点击生成视频)和 Spicy(辣度模式,18+ 需验证,主体不是人的时候可能没有这个选项)。
这里有个点注意,如果遇到了待定的视频,记得先保存下来再继续调整进行下一次视频生成,否则前一次生成的视频会被覆盖。
APP操作也很简单,上方选择Imagine即可,下方可以语音快速输入要求,然后选择合适图片点击右下方「Make Video」即可。
本文所有素材均为AI生成,图片素材使用的造点AI(链接:https://zaodian.quark.cn/r/ai-studio-pc/main/)的MJ V7模型, 本次图片素材大部分的 sref code 统一为--sref 1244374507,这个风格简单来说是巴洛克场景 + 70年代胶片电影剧照感 + 温暖金调与微颗粒。
之所以统一sref code 是因为我想整合为一个完整视频,所以就有了最前面那个视频。
视频生成全部使用的Grok imagine。
这里主要对比一下Normal、Fun、和Custom模式。比如让捣蛋猫做一下示范。下方的Normal、Fun模式不需要提示词
再测试一组3D风格的Normal / Fun / Custom,Custom做3D匀速旋转展示动画效果很不错,稳定性也好
多帧序列稳定性,Normal模式这方面整体都很不错,但是运动幅度都不会很大,细节很好
Normal模式,无提示词图生视频
运动质量方面也不错,运动轨迹也比较自然,没有五官乱飞,肢体也基本正常
Normal模式,无提示词图生视频
Fun模式动作更大,有时候会比较抽象,但是也挺逗的
Fun模式,无提示词图生视频
Custom模式就是自己给到提示词控制画面,这个模式生成速度会稍微慢一点。我们看一下提示词遵循效果和整体叙事合理性,来一组延时摄影效果
之前提示词按照10秒写的,不过实际生成视频目前我测试输出的都是6-7秒。
切换角度
增加新内容也可以,效果也比较和谐,比如让一只小海豚跳到船上,适合超现实大脑洞的衔接
一只小海豚刚好跳进宇航员的怀里。
静态海报变视频,文字稳定性也还可以
也可以虚空写字(中文不可以)
云朵在天空中组成文字“IRENE”
二、元提示词分享
前面我的那些看起来比较唬人的6秒提示词是用下方我自己整理的元提示词生成的(修改调整成其他秒数也可以),使用方法就是发送下面的元提示词后再发送图片,或者图片+自己的简短要求。我的提示词的出发点是让AI从图片可能的整体发展趋势去写提示词,没有硬控分镜。
不过注意,元提示词仅供参考,我认为提示词只要描述清楚了想要的动作一样可以得到很不错的效果,有时候尽信提示词不如无提示词。
完整提示词(使用AI进行了优化)
使用方法:
发送上面的元提示词后再发送图片,或者图片+自己的简短要求
小结
Grok的视频生成速度快,过渡流畅、视觉效果和音效设计也都很好,提示词可控性也比较强,上传图片质量好的话视频上限会更高。
马斯克之前透露,Grok Imagine 很快将升级,支持超过 15 秒限制的更长视频序列,包括多场景过渡和自动相机角度集成,未来将会更适合电影级创作。
现在免费中,大家感兴趣的话可以体验一下。链接在最前面啊最前面。
最近几乎每期我都在感慨工具都很强了重要的还是创意,多看多听多思考多体验,多输入才能有更多输出。
另外,虽然我分享了很多工具,但是对大家来说,自己亲自用过的觉得好用的工具才是最好的,我写的仅供参考,主要是便于大家进行工具的快速了解。
如果今天的内容给大家带来了灵感或者快乐,欢迎猛击三连鼓励阿真,有更多想法创意,欢迎评论区一起讨论交流!
一起进步!共勉。