在用 AI 生成图片时最令人头痛的就是输入提示词 Prompt 吧,好的图片描述有助于生成更贴近用户想象、也更细腻的结果,但对中文用户来说要写出英文的提示词并不容易。
「CLIP Interrogator」是协助用户生成图片提示词的免费在线工具,将图片上传、AI 会分析图片后生成良好的提示词 Prompt,方便用户在其他 AI 图片工具生成类似结果〔尽量看起来很像但肯定不会完全一样〕。
CLIP Interrogator 2.1 使用 Stable Diffusion 2.0、ViT-H-14 OpenCLIP 模型以分析、生成好的图片提示词,也有不同模式和生成的细节可选择,分析图片时需要一些时间,不过可以得到相当优异的提示词结果,必要时还能自行修改、交给其他 AI 图片生成器优化生成。
教程
CLIP Interrogator 2 – a Hugging Face Space by fffiloni
Discover amazing ML apps made by the community
打开 CLIP Interrogator 网站〔目前架设在 Hugging Face 空间〕,直接把要转换的图片拖曳到网页上。
下方有几个不同的分析模式:best、classic 和 fast,best 速度最慢、可以分析出最多细节;反之 fast 是速度最快、但可能就没有那么多细节,最下方有示例可以测试。
另外还有一个「best mode max flavors」应该是调整模式下可生成的形容词数量,维持默认值即可。
分析时右下角会有个时间预测,不过不太准确,等待工具的分析和生成流程结束后就会有图片描述,例如我在写这篇文章时尝试上传了一张「咖啡」照片,生成提示词如下:
a cup of coffee sitting on top of a table, by Adam Chmielowski, shutterstock, photorealism, volumetric backlighting, paper cup, close up food photography, stock photo
将 CLIP Interrogator 生成的图片描述丢到其他 AI 图片生成器就能生成相似、但又不太一样的图片,例如我曾介绍过的 Stable Diffusion 网页版或是 Midjourney ,真的超方便!