CLIP Interrogator - 用 AI 分析图片获取生成图片提示词

在用 AI 生成图片时最令人头痛的就是输入提示词 Prompt 吧，好的图片描述有助于生成更贴近用户想象、也更细腻的结果，但对中文用户来说要写出英文的提示词并不容易。

「CLIP Interrogator」是协助用户生成图片提示词的免费在线工具，将图片上传、AI 会分析图片后生成良好的提示词 Prompt，方便用户在其他 AI 图片工具生成类似结果〔尽量看起来很像但肯定不会完全一样〕。

CLIP Interrogator 2.1 使用 Stable Diffusion 2.0、ViT-H-14 OpenCLIP 模型以分析、生成好的图片提示词，也有不同模式和生成的细节可选择，分析图片时需要一些时间，不过可以得到相当优异的提示词结果，必要时还能自行修改、交给其他 AI 图片生成器优化生成。

教程

CLIP Interrogator 2 – a Hugging Face Space by fffiloni

Discover amazing ML apps made by the community

打开 CLIP Interrogator 网站〔目前架设在 Hugging Face 空间〕，直接把要转换的图片拖曳到网页上。

CLIP Interrogator – 用 AI 分析图片获取生成图片提示词

下方有几个不同的分析模式：best、classic 和 fast，best 速度最慢、可以分析出最多细节；反之 fast 是速度最快、但可能就没有那么多细节，最下方有示例可以测试。

另外还有一个「best mode max flavors」应该是调整模式下可生成的形容词数量，维持默认值即可。

分析时右下角会有个时间预测，不过不太准确，等待工具的分析和生成流程结束后就会有图片描述，例如我在写这篇文章时尝试上传了一张「咖啡」照片，生成提示词如下：

a cup of coffee sitting on top of a table, by Adam Chmielowski, shutterstock, photorealism, volumetric backlighting, paper cup, close up food photography, stock photo