wsl-docs

❯

❯

数字生命卡兹克

❯

Vidu Q2的参考生视频，是AI视频多参党的胜利。

Vidu Q2的参考生视频，是AI视频多参党的胜利。

发布日期：2025-10-22来源：微信公众号原文链接：https://mp.weixin.qq.com/s?__biz=MzIyMzA5NjEyMA==&mid=2647675896&idx=1&sn=498749abd8ef2a7cf8d572248481938c&chksm=f1440fdf3c4da9dcf733356e357df16df63e420bb58e2e47a9e57754db2905684bf4b750986f16分钟阅读

摘要

1) 一句话总结 Vidu Q2 上线了全新的多图参考生成视频功能，通过在多主体一致性、角色情绪表演及动漫风格表现力上的大幅提升，构建了替代传统“图生视频”的新工作流范式。

2) 核心要点

工作流革新：多图参考生视频功能允许用户直接使用多图保持人物、物品和场景一致，取代了过去“先生图、再图生视频”的繁琐流程。
多主体一致性大幅提升：相比Q1，Q2能够稳定处理超多主体同框（如6个不同特征的人物）以及“人物+特定物品”（如精准保持饮料罐上的品牌文字不变）的复杂场景。
高级一致性玩法：支持在保持主体一致的前提下，实现人物变身（如镜内外同步变化）以及人物不变仅切换背景场景。
便捷的“@”交互与主体库：用户可上传同一角色的多角度图片建立并保存为“主体库”，后续通过简单的“@”指令即可直接调用人物、物品或场景（Sora2目前仅支持@人物）。
细腻的真人情绪表演：模型能够根据简单的规定情境提示词，自主生成包含复杂微表情（如脆弱、悲伤、克制、恨意）的高质量真人表演片段。
卓越的动漫风格表现力：精通二次元视觉表达（如通过去除眼部高光来表现阴暗情绪），支持泡面番、热血战斗等多种动画风格，且具备极强的动态运镜与特效生成能力（如刀光剑影、狂风特效）。
极具竞争力的定价：标准版月度会员59元（含800积分），生成一条8秒视频消耗20积分，折合成本约1.475元/条（0.184元/秒），为目前最便宜的AI视频模型之一。
移动端生态：已上线官方APP，支持类似Sora2的交互方式，并推出了基于多图参考的“合拍”等新玩法。

正文

昨天，Vidu Q2的多图参考生视频上线了。

测了几个小时以后，先说结论，确实是多图参考生视频的王。

也是一种，做AI视频工作流的，新范式。

我花了一个下午的时间做了一个小短片，完全用的多图参考生视频，没有用传统的生图-图生视频的工作流，基本上没roll多少次，就实现了这样的效果。

很酷，很有意思。

说实话，自从Veo3、可灵2.5、Sora2以后，我自己，越来越不喜欢用图生视频了。

最开始的时候，23年，我那个预告片总共肝了693张图片，185个镜头，最终选出来60个镜头。

那个时候，其实是没办法的办法，先生图，再用图生视频的方式，对于流程还是挺蛋疼的，需要你强行来回跳转不同的产品。

而且图片本身，很多时候是个静帧，会影响很多动态的发挥，如果不是为了一致性，很多时候，我真的喜欢用文生视频去做。

后来，去年11月，Vidu第一次上线了多图参考生视频，可以用几张图，就能保持人物、物品、场景一致性，开启了多参党的时代。

那个时候，我也写过Vidu。

体验完Vidu划时代的新功能，我觉得可以正式抛弃3D渲染了。

比如当时，随手拍了我非常喜欢的Dimoo，之前的熊猫款的三视图。然后扔到Vidu里。

然后不到1分钟，一段Dimoo在森林里的视频就做完了。

不过这个效果，其实已经是Vidu去年基模还是1.5的时候的效果了，对甚至连Q这个开头前缀都没有。

而现在，在经历了Vidu 1.5、Vidu 2.0、Vidu Q1之后，新的Vidu Q2，确实给多图参考，带来了一些以前达到不了的效果。

而图生视频这个工作流，就好像曾经的SD一样，可能确实会越来越被我，封印在历史的尘埃里了。

今天，我是一个光荣的多参党。

我觉得这次的Q2和多参升级，可以体现在3个方面：

大幅进化的一致性，更强的表演能力，以及更棒的多风格表现力。

一个一个来说。

一. 一致性

参考生视频的，我们很多时候最看重的，就是一致性，

三个月前，Vidu Q1的多参生图其实已经很强了，但是遇到超多主体的情况还是会歇菜。

而这次，Q2更新以后，就牛逼了很多。

比如，让文艺复兴的新三杰和旧三杰同框出现。

这是Q2的效果，镜头依次出现六个画家，每个人的特征都基本保留，实现了这个挑战。

而如果你返回去，看Q1的话，会发现还是会失败的。

比如会出现人物不全，或者人物突然从地里钻出来的情况。

用多图参考生视频也特别简单，就是把你的图片都传上去之后，直接按@键，@任何人和任何物品，超级简单，比Sora2的那个@还要丝滑，因为Sora2只能@人物，但是没法@物品或者场景。

这是6个人的，再来看一下主体+物品的case。

比如让范德彪穿着草裙在沙滩上晒太阳。

然后就得到了一个晒到七成熟的德彪。

再让川普先从冰箱里拿出来一罐百事可乐，再拿出来一瓶可口可乐。

生成出来的结果，川普、百事可乐和可口可乐，都保持了原状。

特别是百事上的字，也保持的非常好。

还有一个，我觉得很有趣的case，也是一个之前没玩过的玩法，就是你可以通过多主体，让主人公实现变身。

提示词是这样的：

最惊喜的是，镜子里和镜子外的变化非常同步，这个是真的是有点东西的。

还有一个玩法，就是人物不变，场景变化。

提示词也非常简单：

在一致性上，表现的非常完美。

二. 情绪表演

表演这一块，也是Q2的重头戏。

拿我喜欢的演员基里安墨菲来举例，我从他演过的英剧《浴血黑帮》里找了几张图，做了一个叫Tommy的主体。

这个主体其实也是多图的的升级功能。

就是比如一个角色，我们为了它更稳定，就可能要传三张不同角度的图上去，而传统的做法，就是写男人靠在XX地方，让AI视频自己去脑补，哦这三张图片是这个男人啊。后续的复用上，也不好管理。

现在，你可以用主体的方式，命名，然后，直接@它就完事了，还能保存成主体库，后续随便用，很方便。

这些小细节，Vidu做的确实是蛮好的。

我们在看看上面那个Prompt和主体跑出来的效果。

瞬间，得到了这个非常细腻的表演。

基里安的眼睛是真的有戏啊，把脆弱感展现的淋漓尽致。

相比之下Q1的演技就完全没开窍，就是眼睛转了几下，你也看不出到底要表达什么情绪。

末了嘴里还变出一根烟。。。

你也不知道它到底在干啥。

再来看一有趣的case。

就是你只是给它一个规定情境，没有很详细的提示词，Vidu Q2也能完成一段很优质的表演。

比如下面这个。

提示词真的非常简单，就是一个情境，用的主体是德尼罗老爷子。

出来的效果，就很有故事感，除了白发人送黑发人的悲伤和无奈，年长者努力控制情绪的克制，还能看出丝丝的不甘和恨意，似乎想给孩子复仇，很好品。

而如果说，Vidu Q2的真人表演已经很不错了，那么二次元领域的表演更是Vidu的拿手好戏。

毕竟，动漫，很多时候，都是Vidu的代名词之一。

先来一个经典的日剧跑段落。

出来的效果真的很有那味儿，可以直接配一首《你的名字》了。

让我想起那年夕阳下的奔跑，那是我逝去的青春。。。

除了这种大开大合的表演情绪，做小表情也很有活人感。

比如下面这个情侣吵架的case。

表情和动作都很自然，真的有点像某一部番的片段了。

在测试情绪的过程中，我还发现，Vidu非常懂动漫中常见的情绪表现手法。

比如下面这个case，它会通过眉眼边上的线条抽动、瞳孔骤然缩小、眼白布满红血丝，来展现一个人极致恐惧的情绪。

但说实话，大部分情况下我都不会给这么细的提示词。

我在这一段，只规定了三个点，男人极度惊恐的表情，半明半暗的光影，和推镜头的运动。

而Q2能凭借自身的技法积累，在我的提示词框架里面完善细节，最后得到一个，有表现力的效果。

我只能说，他们动漫的效果，是真的强啊。

再比如下面的这个case。

提示词非常简单，但Vidu就能做的很对味儿。

仔细一看，秘诀原来是，Vidu把女孩眼睛里面的高光给去掉了。。。

有高光，看起来就比较清澈，没有高光，就很阴。

真的非常细节。。。

三.多风格表现力

刚才那一趴大家也看到了，Vidu Q2做出来的动漫视频效果很出挑。

所以这一趴，我做了更多不同动画风格的case，让大家感受一下，Vidu的动画风格表现力。

真的，Vidu无愧于AI视频动漫之王的称号。

后面这些，我就不放截图了，但是和生成方法和前面还是一样的。都是贴上参考图，或者贴上主体，然后写提示词，生成视频。

先从最日常的泡面番风格开始。

热血战斗番，亦正亦邪的反派既视感，一时间幻视了不少角色。

还有追求音乐梦想的美少女，在空荡的礼堂里独自练习。

超典型360度环绕运镜。

或者更加风格化一点，比如下面这些。

不要忘了，这些都是用Vidu Q2的多参考生视频生出来的。

所以，不仅有超棒的角色一致性，还有特别棒的风格一致性。

还有一个更酷的，就是我测下来发现，Q2真的很适合生成一些中二动漫场面，因为它的运镜和特效，给的真的太足了。

比如下面这个男人舞剑的case。

镜头拉近拉远再拉近，还有挥剑形成的狂风，效果直接拉满了。

再比如这个打斗。

刀光剑影，飞檐走壁，人物和镜头的运动都很丰富，也只抽了两次卡。

写在最后

Vidu Q2这次的参考生视频，确实要比之前的质量好太多了。

超多主体同框一致性的稳定，以及Q2基模所带来的效果提升。

再加上参考生视频能带来更牛逼的运镜和自然的表演。

确实，是多参党的胜利，也是新的工作流范式，进化的前夜。

最后，再来说说大家最关心的价格问题。

以标准版月度会员为例，59元800积分，20积分就能生成一条8s视频，折合下来1.475元/条，约0.184元/s。

几乎就是现在最便宜的AI视频模型之一了。

整体来说，这次Vidu Q2的多参还是让我很惊喜的。

而且他们也上了APP，跟Sora2那样的交互，也能玩合拍，不过是用多参做的，也挺有意思的，感兴趣的可以去玩玩。

我也还是很相信，多图参考生视频，是未来的共识。

Vidu，未来可期。

wzglyay@virxact.com

关联主题

数字生命卡兹克
AI
llm

关系图谱

摘要
正文
关联主题

反向链接

最近更新（第3页）

Created with Quartz v4.5.2 © 2026

GitHub