摘要

1) 一句话总结 本文介绍了如何通过让 AI 提取文章要点来反向编写提示词,从而为知识类文章生成高质量的信息图风格配图。

2) 关键要点

  • 核心工作流:先将文章内容发给 AI,要求其输出一段用于画图的提示词,再使用该提示词生成图片。
  • 内容输入规范:需提供完整的文章内容或手动整理的要点,并建议使用 XML 标签(如 <article>)包裹内容,避免与系统指令混淆。
  • 图像风格设定:明确指定为“横版”、“信息图(infographic)”形式,并搭配卡通图像,以实现核心观点的视觉化。
  • 提示词生成模型推荐:作者测试认为 GPT-4.5 和 o3 编写画图提示词的效果最好,Gemini 2.5 Pro 表现也不错。
  • 图像生成工具推荐:建议在 sora.com 上进行图像生成(支持一次生成多张),也可直接在 ChatGPT 中生成。

3) 风险与不足

  • 中文文字生成缺陷:当图片中需要包含较多文字时,使用中文会导致生成效果不佳(建议图片内文字使用英文)。
  • 适用场景局限:信息图(包含大量文字信息与其他元素)主要适用于知识类文章,其他类型的文章未必合适。
  • 指令混淆风险:若不使用 XML 标签将文章内容与提示词指令隔开,AI 可能会无法准确识别用户需求。

正文

给知识类文章配一张信息图,可以让读者快速抓住重点,现在 GPT-4o 的画图能力很强,可以生成形象的图片和比较准确的文字,但是怎么写提示词呢?

Image 1

我也不会,所以每次我都问 AI,我是这么问的:

<article>
{文章内容}
</article>
如果我要基于上面的文章画一张文章的横版配图,信息图的形式,文字使用英文,搭配卡通图像,清晰、生动且富有吸引力,能够很好地概括并视觉化文章中的核心观点,那么提示词该怎么写?

Image 2

这里有几个要点:

  1. 要把完整文章内容或者手动整理的要点发给 AI,否则它不知道你想要什么,另外最好用 XML 标签包裹起来,避免跟指令混淆

  2. 类型是“信息图(infographic)”,就是图片中有很多文字信息,搭配一些其他元素,所以比较适合知识类文章,其他类型的未必合适

  3. 如果文字多建议用英文,中文文字一多就生成不好

  4. 我觉得 GPT-4.5 和 o3 写的画图提示词效果最好,Gemini 2.5 pro也不错

  5. 生成好的提示词,在 sora.com 上生成比较方便,一次可以几张,当然也可以在 ChatGPT 中生成

关联主题