摘要

一句话总结 作者综合使用Runway、Midjourney、Stable Diffusion和DALL-E 3等多款AI工具,克服了单一工具在语义理解和画面质感上的局限,成功制作了一部《三体》科幻预告片。

核心要点

  • 制作契机:Runway近期更新了画质和一致性,促使作者决定再次制作科幻预告片并选定《三体》为题材。
  • 核心难点:制作的最大难点不在于4秒视频的处理,而在于如何生成具备电影质感的静态图。
  • 场景复杂性:《三体》中的特殊场景(如人体计算机、太阳系二向化等)超出了大部分常规AI工具的直接生成能力。
  • 解决方案:采用“三者一体”的混合工作流,通过DALL-E 3进行初步出图,再结合Midjourney垫图等方式,综合各工具优势完成画面。
  • 最终成果:经过多重工具的配合与调整,最终成功还原了原著场景,达到了作者满意的电影级预告片状态。

风险/不足

  • Midjourney的不足:电影质感强,但语义理解能力太差,无法直接画出复杂的科幻镜头。
  • Stable Diffusion的不足:可控性强,但画面质感太差,几乎无法用于电影质感的画面。
  • DALL-E 3的不足:语义理解能力极强,但生成的画面缺乏电影质感。

正文

自如Runway画质和一致性更新以后,一直想再用AI做一部科幻的预告片。

所以,我就把手伸向了《三体》。

话不多说,直接放视频吧。

《三体》的难度比之前的所有AI视频都要难,难点其实不是4s视频的处理。

而是电影质感的静态图。

三体的场景,大部分AI都画不出来。

MJ的电影质感很强,但是语义理解能力太差,很多镜头包括人体计算机、太阳系二向化等等根本画不出来。SD虽然可控性很强,但是质感太差,在电影质感的画面上几乎就没法用。Dalle3语义理解虽然超神,但是电影质感一样不太行。

只能三者一体,Dall3出图,MJ强行垫图之类的方式去做…

总之,一路坎坷,尽全力去还原了,好歹也是做到我自己还比较满意的状态了。

希望大家喜欢。

关联主题