摘要
一句话总结 作者综合使用Runway、Midjourney、Stable Diffusion和DALL-E 3等多款AI工具,克服了单一工具在语义理解和画面质感上的局限,成功制作了一部《三体》科幻预告片。
核心要点
- 制作契机:Runway近期更新了画质和一致性,促使作者决定再次制作科幻预告片并选定《三体》为题材。
- 核心难点:制作的最大难点不在于4秒视频的处理,而在于如何生成具备电影质感的静态图。
- 场景复杂性:《三体》中的特殊场景(如人体计算机、太阳系二向化等)超出了大部分常规AI工具的直接生成能力。
- 解决方案:采用“三者一体”的混合工作流,通过DALL-E 3进行初步出图,再结合Midjourney垫图等方式,综合各工具优势完成画面。
- 最终成果:经过多重工具的配合与调整,最终成功还原了原著场景,达到了作者满意的电影级预告片状态。
风险/不足
- Midjourney的不足:电影质感强,但语义理解能力太差,无法直接画出复杂的科幻镜头。
- Stable Diffusion的不足:可控性强,但画面质感太差,几乎无法用于电影质感的画面。
- DALL-E 3的不足:语义理解能力极强,但生成的画面缺乏电影质感。
正文
自如Runway画质和一致性更新以后,一直想再用AI做一部科幻的预告片。
所以,我就把手伸向了《三体》。
话不多说,直接放视频吧。
《三体》的难度比之前的所有AI视频都要难,难点其实不是4s视频的处理。
而是电影质感的静态图。
三体的场景,大部分AI都画不出来。
MJ的电影质感很强,但是语义理解能力太差,很多镜头包括人体计算机、太阳系二向化等等根本画不出来。SD虽然可控性很强,但是质感太差,在电影质感的画面上几乎就没法用。Dalle3语义理解虽然超神,但是电影质感一样不太行。
只能三者一体,Dall3出图,MJ强行垫图之类的方式去做…
总之,一路坎坷,尽全力去还原了,好歹也是做到我自己还比较满意的状态了。
希望大家喜欢。
。