摘要

一句话总结 Google新发布的Veo 3.1视频模型主要增加了部分控制功能,但在画质、原生时长、复杂物理规律及自动分镜等方面未达预期,整体表现不及Sora 2 Pro。

核心要点

  • 测试背景:作者在Lovart及官方平台Flow上消耗约7000积分,将Veo 3.1与Sora 2 Pro(均使用最高级模型)进行了深度对比测试。
  • 画质与分辨率:画面质量相比Veo 3无明显提升,视觉效果更显油腻和虚假,且不支持1080p分辨率。
  • 新增功能:增加了视频首尾帧控制、多图参考生成等功能,但属于业内已有常见功能。
  • 生成时长:未实现传闻中的原生30秒至1分钟生成,原生仅支持8秒,需通过延长功能才能达到30秒。
  • 物理规律:基础物理模拟(刚体、流体、布料)表现较好;但在涉及人物表演和复杂调度时表现不佳,远不如Sora 2 Pro。
  • 提示词与分镜:缺乏优秀的自动分镜能力,需要极其精确的提示词(Prompt),而Sora 2仅需简单提示词即可生成较好故事。
  • 商业应用表现:在电商、广告、时尚等领域的约10个测试案例中,分镜、审美和真实感均未超越Sora 2 Pro。

风险/不足

  • 音频断层问题:使用视频延长功能时,延长的片段与前一片段的音频(背景音乐和音效)差距极大,无法直接使用,必须下载后重新剪辑。
  • 画面衔接失败:在进行视频延长操作时,画面经常出现衔接不上的情况。
  • 复杂场景生成崩坏:在有人物表演和复杂调度的场景中,经常出现凭空产生道具或违反物理规律的现象。
  • 宣发与实际不符:官方宣称支持的“自动化原生分镜”能力在实际测试中未能体现。

正文

Veo3.1大家一直还是期待蛮多的,拖了蛮久,昨晚深夜,终于发了。

我其实从下午7点就开始测,先是在Lovart上,他们上的比官方还要快,夜里Google官宣以后,我就又去他们的官方创作平台Flow上跑,因为我是Ultra会员,有25000积分。

跑到了凌晨4点,在烧了大概7000积分以及和Sora2对比以后,坦诚的讲,还是比较失望的(我测试的都是Veo 3.1和Sora2 Pro,两边都用的最好的模型,没有跑Fast)。

  1. 在模型质量上,我不知道是我prompt问题还是测试问题,我真的没有感觉比Veo3好多少,而且画面感觉比Veo3更油更假了,只是多了一些控制功能,其实都是国内大家玩烂的,比如视频首尾帧、多图参考生视频等等,而且也没有1080p,确实符合这0.1版本的小更新。

  2. Veo3.1之前一直被传,会比Sora2更强,有原生分镜能力,并且能生成30s到1分钟的视频,所以大家一直觉得非常的期待。

结果最后放出来的版本,是跟Veo3一样,只能生成8s,可以靠延长视频撑到30s。

这一下子给我整不会了,而且在Flow里进行延长,虽然画面可以衔接(还经常衔接不上),但是致命的问题是,Veo3.1是能生成背景音乐和音效的,视频画面你是延长,但是你音频根本就没管啊,延长的片段跟前一个片段声音差距极大,根本没法用,还是要一个一个片段下载下来重新剪辑。

  1. 物理规律和表演上,在单纯的物理规律上,是要好不少的,比如刚体模拟、流体模拟、布料模拟等等,但是一旦涉及到人物表演和复杂调度,物理规律一下子差了不少,经常凭空出现道具或者违反物理规律,有人物的表演的时候,在我同样的测试下,远不如Sora2 Pro。

  2. 自动分镜上,Sora是可以自己给出很棒的分镜的,可以简单给个prompt他就能给你生成还不错的小故事,但是Veo3.1还是需要你把Prompt写的比较精确才行…

之前Google说支持了自动化原生分镜,感觉也加了个寂寞。

而且在一些电商、广告、时尚领域,整个的分镜和审美、还有真实感,跑了10个左右的case,几乎没有比Sora2 Pro好的。。。

总结一下,Veo3.1,更多的是模型功能的增加,但是模型质量,并没有太大的提升,肯定达不到所谓的超越Sora2的地步。

最后,只能说。

让我们期待,Gemini3扳回一城。

关联主题