摘要

1) 一句话总结 本文总结了作者在 AI 绘图(nano banana pro)中获得数百万流量的提示词编写经验,强调以想法和审美为核心,通过大白话起步、多模型 AI 辅助优化、反复测试,最终将稳定提示词转化为多变量模板的系统化流程。

2) 关键要点

  • 核心理念:提示词仅是实现想法的手段,无需过度纠结结构、长度或格式(如 JSON),创作者的想法和审美判断力(知道什么是好/坏)最为重要。
  • 起步策略:无需复杂技巧,直接使用大白话描述画面需求(如“大熊猫在巨型裸眼 3D 屏幕外”)进行初步测试。
  • AI 辅助优化:将初步提示词发给 AI,并提供明确的优化方向(如指定现实中的知名地标),让 AI 补足专业细节。
  • 逆向工程:当正向提示词效果不佳时,可向 AI(如 Gemini)提供优质的真实参考图,让其反向推导并生成新的提示词。
  • 多模型交叉测试:不同模型各有所长且存在随机性,建议在 Gemini 3 Pro、GPT-5.1、GPT-4.5 等多个模型间反复测试和对比。
  • 系统化迭代(抽卡):提示词工程是一个设计、测试、优化的循环过程,需要基于较好的生成结果不断微调和重试,直至效果稳定;同时可接纳 AI 生成过程中的意外惊喜(如时空交汇演变为古今人物交互)来调整创作方向。
  • 构建提示词模板:当单场景效果稳定后,通过设定一个或多个“变量”(如 {场景}、{现实}、{内心映射}),将提示词转化为可复用的模板,以衍生出更多样化的作品。

3) 风险与不足

  • 生成稳定性风险:部分提示词可能难以达到稳定效果(如作者在 3D 裸眼屏测试中发现有一半结果不佳),经过反复优化仍无效时可能只能选择放弃或依赖大量“抽卡”。
  • 模型能力限制:提示词的最终效果受限于当前模型的技术水平,部分复杂场景(如半年前的裸眼 3D 屏)可能需要等待模型迭代升级后才能实现逼真效果。

正文

最近一段时间,沉迷于 nano banana pro 画图,也写了一些颇受欢迎的提示词,X 上的浏览量加起来有几百万。但你要说我写画图提示词水平多年,这我可不敢认,因为我写画图提示词水平其实一般,写不出那些专业的参数,绝大部分提示词都是让 AI 帮我写的。

写画图提示词,没有你想的那么复杂,拿我最近写过的一些提示词来讲一下。

首先,提示词是手段不是目的

提示词是为画图服务的,所以最重要的是你的想法,你想呈现什么,至于提示词,只不过是为了实现你想法的手段,有很多种写法都可以让你得到不错的结果,所以不必太纠结提示词的细节,什么结构、关键字、长短、是不是 JSON,都没那么重要!

比如说 4 月份的时候,我就想用 GPT-4o Image 帮我画一张巨型裸眼 3D 屏幕的图,提示词很简单,就是大白话:

一只超写实大熊猫半个身子在成都繁华商街巨型弧形裸眼 3D 屏幕外边,肚皮朝上,脑袋吊着,嘴里咬着竹笋,憨态可掬

Image 1

提示词大部分时候就是这样,你都不需要多么复杂的技巧,就先大白话发过去看看效果。

然后我把提示词发给 Gemini,得到了一张这样的图:

Image 2

也还行,但效果不算太好。

写提示词不难,难得是你得有一点审美,知道什么是好的,什么是不好的,最好还能知道哪不好!

我水平不够好,只能看得出它不好,但说不上不好在哪里。这时候专业水平就能起作用,要是你专业的话,马上能知道哪不好,怎么调整。

我不专业但我有 AI,于是把这个提示词(有时候我还会把生成的图片结果一起)发给 AI,让 AI 优化。最好不要只是让它优化,而是给个方向,比如我就去搜索了一下现实世界中哪几个建筑的裸眼 3D 屏幕最有名,这样 AI 训练的最多最熟悉,更容易明白我想要什么。

Image 3

注意我会同时问 Gemini、ChatGPT(GPT-4.5、GPT-5.1),一方面每个模型擅长的不一样,另一方面这里面有很大的概率因素。所以多试几个总没错。

后面就是去测试,根据测试结果让 AI 进一步调整。

比如第一次测试,效果不怎么样!

Image 4

我干脆换了个思路,找来一张真实的看起来还不错的图片,然后让 Gemini 根据图片给我写提示词。

Image 5

再让 Gemini 帮我生成几个场景。

Image 6

拿新提示词测试了一下,效果惊艳!

Image 7

再测试几个其他场景也不错,那基本上就可以了。

Image 8

所以写提示词的过程就是不停的变换思路不停的“抽卡”重试,你可以不知道怎么调整,但是至少你得知道什么是好的,这样当偶尔“抽卡”到一张好的,你就可以基于那张好的不停的微调,直到可以稳定的生成。

真不稳定也没关系,那就多“抽卡”好了。比如那个 3D 裸眼屏的,得一半结果不怎么好,我后续又尝试优化了好一会,实在改进有效,干脆放弃了。

所以我不止一次提到“提示工程”:

提示词工程是一个过程,系统化地设计、测试、优化提示词的过程——宝玉

Image 9

让 AI 帮你写提示词,有时候还会有意外惊喜。

比如我在创作时空交汇的提示词的时候,最初的想法只是简单的时空交汇。但无意中生成了一张古今人物交互的,我一看,这比我原本的想法还要好一些,于是调整了一下创作方向,让画面中融入了古今人物的交互。

Image 10

上面其实只是我提示词创作的第一个步骤,也就是针对一个场景生成一张满意的图片。当提示词能稳定的产生一个效果后,下一步就是基于这套提示词,把它变成一套提示词模板,让它可以产生各种不同结果的图片,这样其他人也能参与其中。

比如说四季变换的图,最初的版本只有一棵树。虽然这棵树效果很好,但是大家都来画树就没意思了。最好是能基于同一场景四季变化的设定,让场景可以变化。

Image 11

我把这条提示词发给 AI,让它帮我变成提示词模板。把提示词变成模板,最重要的是设定好“变量”,你希望提示词中哪些是固定不变的,哪些是可以变换的。

比如四季变换的提示词模板,我希望它变换的是场景,不局限于一棵树,还可以是一座城市、一个园林等等,每个人都可以代入自己喜欢的场景。参考提示词:

帮我把下面的提示词变成提示词模板,变量是场景,根据场景在一张画面中显示四个季节的变化,同一个场景,但是每个季节显示场景的一部分同时又融为一体。

超写实数字插画风格,画面以一棵树为核心,从左到右均匀划分为冬春夏秋四个季节区域。树木和背景随季节依次渐变变化,每个季节区域内的树叶颜色、枝条状态和背景元素均应精准呈现相应季节特征。树冠、树干、枝叶以及背景中的植被与天气等自然景观,都应根据季节的典型表现进行细致调整和过渡,确保四个区域间衔接自然流畅、色彩丰富且富有象征意义。画面比例为 4:3。

Image 12

提示词模板的变量也不用局限一个,可以有多个变量,比如这张“现实vs内心映射”的图,{现实}是一个变量,{内心映射}是另一个变量。

Image 13Image 14

这一步仍然是要反复测试,直到有一个稳定的效果

Image 15

所以说,写提示词,没有那么难,你有一个想法,先用大白话去试试,不行就让 AI 帮你调整,告诉它你哪里不满意,希望哪里更好,根据 AI 调整后结果再去试,再调整,反复“抽卡”,耐心一点总能成。

当然模型也很重要,真不行就等一段时间再重新试试,就像我的裸眼 3D 显示屏的提示词,半年前还画不好,现在这就挺逼真了。让 AI 优化,也可以试试不同的模型,比如我会反复在 Gemini 3 Pro、GPT-5.1、GPT-4.5 之间重试,并没有绝对答案谁最好,保不准谁的结果就让你满意了。

如果你想更进一步,让你的提示词能适应不同的场景、人物,还可以把它变成提示词模板,衍生出更多好玩的作品。

关联主题