前言
上周Stable Video 开放公测,可以生成4s视频。
相比 Sora 可生成60s 多角度多机位多角色的视频, Stable Video 效果没有那么惊艳。但是相比市面上主流的AI视频Runway、pika等还是有一定优势的,下文中我也会进行效果对比。
目前 Stable Video 对所有用户都可以免费开发,每天可领150积分,图生视频每使用一次消耗10积分,文生视频消耗11积分,还可以付费升级。
接下来让我们一起来试一试吧。
一、初步体验
1.1 登录网址
打开官网:https://www.stablevideo.com/
进入 Stable Video 主页,点击图片上蓝色的「Start with image」按钮或者白色的「Start with text」按钮,就会跳转到 Stable Video 的主操作界面啦。
1.2 主操作界面
操作界面很简洁,顶部为「两种指令场景」,分别为图生视频、文生视频。中间为输入文字或上传图片的区域,跟runway界面类似。
二、文生视频创作
2.1 写提示词
输入提示词「A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.」(一部电影预告片,讲述了这位30岁的太空人的冒险故事,他戴着红色羊毛针织摩托车头盔,蓝天,盐沙漠,电影风格,用35毫米胶片拍摄,色彩生动。)这次我使用 sora 相同的提示词进行对比,看看 Stable Video 生成的效果,更多 Sora 视频可查看我的主页。
2.2 选择尺寸和风格
输入提示词后,可以选择比例和想要的画面风格,这边我选择默认的 16:9 ,比例有三种尺寸分别为:16:9、9:16 和 1:1。
Stable Video 提供十七种风格可供选择,这边给大家全部列出来,真实电影感以及适合动画的风格化效果还是很丰富的。这次我选择「Analog Film (胶片)」风格效果。
2.3 选择图片
等待一会,会像 Midjourney 一样会生成4张图片,选择一张你喜欢的继续生成视频。可以看到提示词中「戴着红色羊毛针织摩托车头盔」没有识别出来,「蓝天,沙漠,电影风格,用35毫米胶片拍摄」都表现的很不错,其中我选择的风格参数「胶片感」表现的也很好,整个生成的图片质量很高,果然 Stable.AI 很强。
2.4 生成视频与sora对比
刚开放测试出视频很慢,可能会直接挂掉,所以,心态要崩住。下面看一下 Stable Video 给我们生成的4秒视频,与王者 sora 相同关键词生成的17s视频做一个对比(官网素材)。
2.5 多种风格测试
使用相同提示词测试不同风格的文生视频效果如下。第一组「粉色豹子」「a jaguar walking through a pink forest, in the style of nightmarish illustrations, dark black and green, detailed illustrations, fluorescent colors 」提示词过于细致,出的图片质量效果很高,但是对于各种风格表现差异不大,生成视频多倾向提示词中的豹子行走的视频,视频在后期崩的情况较多,更多视频效果可查看公众号「姚十八设计」。
第二组提示词提示词我就选择了较为简单的「海豚,大海」,风格效果就更为明显,同样也是在海豚动态效果较为明显的时候视频容易崩,在仅仅是镜头移动和环境移动画面更稳定。
三、图生视频创作
3.1 Midjourney出图
首先,在Midjourney中生成需要「宇航员」图片。接下来我们就实际体验一下图生视频的步骤和方法。
3.2 点击按钮
在主操作界面中,可以选择直接上传图片,把我们的「宇航员」图片上传进来。
3.3 选择参数
Stable Video 提供很多相机的运动参数,比如倾斜、旋转、平移、镜头推进等,根据需要选择运动镜头。
3.4 生成视频
基本参数对比
这边我测试了同个「宇航员」图片情况下,选择 Stable Video 相机运动的不同参数的生成效果。分别为:锁定 (Locked)、抖动 (Shake)、向下 (Down)、旋转 (Orbit)、平移 (Pan)、变焦 (Zoom in)。画面主体人物基本没有变化,在整体画面和背景发生了相应的镜头变化。生成得6个视频,可以更好的理解以上几种镜头运动效果。
参数介绍
图片上传 (Image Upload):上传图片以生成视频。请上传分辨率为1024x576px、576x1024px或768x768px的图片以获得最佳结果。
相机运动 (Camera Motion):向你的场景中添加相机运动。锁定 (Locked)抖动 (Shake)倾斜 (Tilt):向上 (Up)向下 (Down)
旋转 (Orbit):旋转 (Orbit)
平移 (Pan):平移 (Pan)
变焦 (Zoom):放大 (In)缩小 (Out)
滑动 (Dolly):推进 (In)拉出 (Out)
移动 (Move):向上 (Up)向下 (Down)
高级设置 (Advanced)
种子 (Seed):为随机生成设置一个起点。
步骤 (Steps):选择更多步骤以获得更高质量的输出,或选择更少的步骤以更快生成视频。
运动强度 (Motion Strength):鼓励AI增加或减少运动量。
平衡 (Balance):150
生成 (Generate):点击生成按钮,旁边的数字10可能表示生成视频的数量或者是生成的效果强度。
四、 Stbale Video、Runway、Pika、PixVerse 对比
春节时候用 Runway、PixVerse、Pika 做了一个视频《恭喜发福》,图片都是Midjourney 做的图,可以看到下面跑的图。接下来使用相同图片试一下 Stbale Video 的效果。
首先,先对比主流的几款AI视频软件一些基础参数,每个都有自己的特点,这些AI视频我之前也都有写一些操作教程,可查看公众号「姚十八设计」。
运动强度对比
在 Stbale Video 镜头 Locked 参数下,选择运动强度数值为 127、190、以及最大的数值255,测试不同的效果如下。运动强度数值为127时,画面基本上动作微小,255数值最大时后面1秒直接模糊崩坏,190数值效果最为稳定幅度适合。
Stbale Video与PixVerse对比
当时在使用PixVerse时候做的效果和现在使用Stbale Video制作的效果对比。PixVerse也可以设置画面运动幅度,我设置过5、7、10的效果。这次选择PixVerse motion5,和Stbale Video Motion 190做对比。效果都很好,画面没有出现崩坏的效果,Stable Video 效果画质更加稳定清楚。
Stbale Video与Pika对比
Stable Video和pika这组效果,同时是镜头推进拉伸,Stable Video画面稳定性更强,pika由于角色比较多画面中角色的脸直接崩了。
Stbale Video与Runway对比
最后一组测试是Stable Video和Runway。由于我希望画面中的财神摆出恭喜发财的手势,由于Stable Video目前只有镜头参数,没有更多功能,所以使用Runway的运动笔刷更具有优势,可以直接涂抹要修改的地方,把方向更改向下,就出现恭喜发财的手势了,效果还不错。
当然 Stable Video 有时候也有翻车的时候,毕竟目前AI绘画和AI视频还是像抽卡。
五、后记
实话实说,抛开王者 Sora 不说,Stable Video 基于的画面稳定性和画质细节都很强,目前每天可领150积分,简直是大羊毛赶紧薅。而且文生视频效果也很强。当然几款主流的AI视频软件 Runway、Pika、Stable Video 各有各自的优势,配合midjourney 的王炸组合还是要大家自己结合使用。