简单聊聊一下Google新发的视频模型Veo3.1。

摘要

一句话总结 Google新发布的Veo 3.1视频模型主要增加了部分控制功能，但在画质、原生时长、复杂物理规律及自动分镜等方面未达预期，整体表现不及Sora 2 Pro。

核心要点

风险/不足

Veo3.1大家一直还是期待蛮多的，拖了蛮久，昨晚深夜，终于发了。

我其实从下午7点就开始测，先是在Lovart上，他们上的比官方还要快，夜里Google官宣以后，我就又去他们的官方创作平台Flow上跑，因为我是Ultra会员，有25000积分。

跑到了凌晨4点，在烧了大概7000积分以及和Sora2对比以后，坦诚的讲，还是比较失望的（我测试的都是Veo 3.1和Sora2 Pro，两边都用的最好的模型，没有跑Fast）。

在模型质量上，我不知道是我prompt问题还是测试问题，我真的没有感觉比Veo3好多少，而且画面感觉比Veo3更油更假了，只是多了一些控制功能，其实都是国内大家玩烂的，比如视频首尾帧、多图参考生视频等等，而且也没有1080p，确实符合这0.1版本的小更新。
Veo3.1之前一直被传，会比Sora2更强，有原生分镜能力，并且能生成30s到1分钟的视频，所以大家一直觉得非常的期待。

结果最后放出来的版本，是跟Veo3一样，只能生成8s，可以靠延长视频撑到30s。

这一下子给我整不会了，而且在Flow里进行延长，虽然画面可以衔接（还经常衔接不上），但是致命的问题是，Veo3.1是能生成背景音乐和音效的，视频画面你是延长，但是你音频根本就没管啊，延长的片段跟前一个片段声音差距极大，根本没法用，还是要一个一个片段下载下来重新剪辑。

物理规律和表演上，在单纯的物理规律上，是要好不少的，比如刚体模拟、流体模拟、布料模拟等等，但是一旦涉及到人物表演和复杂调度，物理规律一下子差了不少，经常凭空出现道具或者违反物理规律，有人物的表演的时候，在我同样的测试下，远不如Sora2 Pro。
自动分镜上，Sora是可以自己给出很棒的分镜的，可以简单给个prompt他就能给你生成还不错的小故事，但是Veo3.1还是需要你把Prompt写的比较精确才行…

之前Google说支持了自动化原生分镜，感觉也加了个寂寞。

而且在一些电商、广告、时尚领域，整个的分镜和审美、还有真实感，跑了10个左右的case，几乎没有比Sora2 Pro好的。。。

总结一下，Veo3.1，更多的是模型功能的增加，但是模型质量，并没有太大的提升，肯定达不到所谓的超越Sora2的地步。

最后，只能说。

让我们期待，Gemini3扳回一城。