摘要
1) 一句话总结 创作者海辛和阿文通过组合使用Google Whisk生成初图、Photoshop精修细节以及可灵1.6进行图生视频,成功制作了在X平台上获得百万播放的“巨物宝可梦”爆款AI短视频。
2) 关键要点
- 爆款数据:该“巨物宝可梦”AI视频在X平台上迅速走红,获得了100万次播放和1.5万次点赞。
- 核心工作流:视频的制作流程分为三步:“AI生成初始图像 → 人工后期精修 → 图生视频”。
- 图像生成工具(Whisk):初始图像使用Google的AI绘图产品Whisk生成,用户只需上传主体和场景图片,并输入简单提示词即可完成融合。
- Whisk技术原理:Whisk底层利用Gemini 2大模型将图片转化为提示词,再通过Imagen 3直接生成图像,无需参考图即可保持极高的主体与场景一致性。
- 人工精修(Photoshop):创作者使用PS对AI生成的初图进行抠图、调色、光影和构图调整,并增加大气透视(如云层、沙尘)以强化“巨物感”和写实度。
- 视频生成工具(可灵1.6):精修后的图像被导入可灵1.6(Kling 1.6)中,通过输入直白的动作描述提示词(如“卡比兽倒雪”、“可达鸭惊醒”)生成最终的动态视频。
- 核心结论:真正的流量密码是“AI+专业者+好想法”,AI仅作为辅助工具,优质的内容创造和情感共鸣才是核心。
3) 风险/不足
- AI直出图像存在瑕疵:AI(如Whisk)直接生成的图像通常存在细节缺失和瑕疵,无法直接达到专业级标准,必须依赖人工后期精修才能保证最终质量。
正文
这两天,X上一个贼可爱的视频爆火了。
截止到我发文,100w的播放,1.5w的赞。
最关键的是,这个视频来自国人,也是我一直以来在AI领域的两位偶像:
海辛和阿文。
直接放一下这个视频。
作为一个老任死忠粉,又是从红蓝宝石就开始入坑的骨灰级宝可梦玩家,看到这个视频的一瞬间,心里的某根弦就动了。
按那句话说,就是打在了我的心趴上。
最核心的是,海辛和阿文还做了一系列,也都在圈里疯狂刷屏。
“一觉醒来,罗马塌了。
罗马虽然不是一天建成的,但可以一天塌掉!”
我太太太太太太太喜欢了。
而且数据也非常好看。
一夜之间,模仿者也开始涌现。
因为效果太好, 很多朋友,都在在疯狂的问是怎么做的。
所以, 在征得海辛和阿文的同意和授权后 ,我就来,给大家拆解一下,这个视频的做法。
其实蛮简单的。
就是先出图,然后图生视频。
视频部分反而是最简单的,图生视频谁好用谁, 海辛这个质量很明显的就是可灵1.6,上周我也发过可灵1.6的评测,在图生视频领域现在就是断层式的领先。
最核心的其实是最开始的图片部分,要让图片融合的天衣无缝栩栩如生,还要保证主体和场景的一致性,才能达到完美的效果。
所以,图片部分,要祭出的是上周Google更新的一个很有趣的AI绘图产品:
Whisk。
网址在此:https://labs.google/fx/zh/tools/whisk
虽然它上手极度简单,小白也是有手就行上手就会,但是效果却好的令人发指。
使用逻辑非常简单,给主体、场景、风格,然后Whisk就能给你完美的拼合在一起。
比如我们想做一个跟海辛类似的,一个皮卡丘抱着埃菲尔铁塔。
你只需要找到皮卡丘和埃菲尔铁塔的图,然后传上去。最后样式风格空着就行。
写一句贼简单的Prompt:
巨大的皮卡丘抱着埃尔菲铁塔。
然后点击生成,大概只需要十几秒钟,一张贼可爱的图,就诞生了。
就是这么迅速。。。
就是这么无脑。。。
海辛还做过更多的例子。
真的,酷毙了好嘛。
而且Whisk最屌的点是,它并没有用图片参考,而是把这些图,用大模型Gemini 2的能力,硬生生转成Prompt,再用Google的AI绘图产品 Imagen3,硬生生的直接生成。
比如我给朋友做的这个图。
上面有一段超长的Prompt。
而我给的原图是这样的:
只能说一句,Google的硬实力却是还是太猛了。。。
不用参考图,就能把一致性保持的这么好,这要是到时候原生多模态的Gemini 2上了还得了。。。
不过如果直接把Whisk出的图拿过来直接用,其实效果也还达不到海辛和阿文的那种级别。
因为,AI的图,总归是有些瑕疵和细节缺失。
比如文章一开始的那个视频,卡比兽还有一个之前的版本,Whisk直出的图是这样的:
一个对细节要求不那么高的人,可能会觉得已经很好了。
但是阿文觉得不行。
于是,他直接扔到PS里,扣了很多细节,调了颜色、调了光影、调了构图,特别是还加了一些大气透视和云层,让这个卡比兽,更有巨物感,更写实。
效果直接立竿见影,瞬间真实可信多了。
这,就是职业玩家,和普通人的区别。
也所以,才有了最开始视频的,大爆特爆。
这真的,就是专业者和创意者,最好的时代。前路AI已经为你尽情铺好,而你,只需要肆意挥洒你的灵感就行。
而后一步,图生视频,就非常简单了,直接无脑可灵1.6的图生视频。
我也找海辛和阿文把他们两个图生视频的prompt给要来了,供大家参考(其实很简单,说明白你的想法就行)
Prompt: 巨大的卡比兽,把一碗雪倒扣在富士山上,富士山瞬间被雪覆盖。
Prompt:巨大的可达鸭在斗兽场上熟睡并打呼,肚皮缓慢起伏,马路上的车在行驶,突然斗兽场塌了,冒出滚滚沙尘,可达鸭突然惊恐地睁大眼睛。
最终,配上音效,就成了一段创意极佳、制作精良的超级有趣的短视频。
AI+专业者+超棒的想法,等于真正的好内容。
而这,才是我认为的,真正的流量密码。
所以, 流量的尽头从来不是跟风,而是创造。
创造让人眼前一亮的世界,创造能引发情感共鸣的瞬间,创造属于你自己的语言和故事。
AI只是助力。
而内容,才是永恒的灵魂。