利用 AI 绘图工具时,最困难的地方是什么呢?我觉得要设置一个「准确的风格」最难。尤其当我们不是专业设计师时,用来用去可能就是那几种风格的提示语,甚至描述得也不够清楚,于是无论是用 Midjourney、 Bing 绘图,还是 ChatGPT 的 DALLE-3 ,可能生成了一大堆图像,其实都是那几种风格。
如果在最近推出的 ChatGPT 的 DALLE-3 中,我会尝试类似这样提示:「请帮我挑选两种不同的风格」,让 AI 直接提供风格建议给我,比较能够跳出我自己的舒适圈〔参考:ChatGPT DALL-E 3 的 7 个特殊 AI 绘图应用教程,胜过 Midjourney〕:
Style Tuner
而这两天, Midjourney 推出了一个全新功能:「Style Tuner」,可以更有变化弹性、更精准细致的解决我们「不会设计风格」的烦恼。
Midjourney on X (formerly Twitter): “We’re now testing V1 of our Midjourney “Style Tuner”. Type /tune and render a custom web tool that controls our model’s personality. Everything from colors to character detail. Explore aesthetics like never before and share resulting style codes and tuning URLs with friends. / X”
We’re now testing V1 of our Midjourney “Style Tuner”. Type /tune and render a custom web tool that controls our model’s personality. Everything from colors to character detail. Explore aesthetics like never before and share resulting style codes and tuning URLs with friends.
这个功能解决了以下问题:
- Midjourney 可能隐藏了无数种风格的参数,但我们如何有办法快速有效率的找出自己想要的风格呢?
- 我的脑袋里根本没有任何风格设计关键词,如何能够把图片设计成我想要的风格呢?
- 有些风格根本是文字难以描绘的,这时候如何让 AI 调整出我想要的那种「感觉」呢?
只要利用「Midjourney Style Tuner」,上述问题都能得到一定程度的解答。
教程
让我们来看看「Midjourney Style Tuner」实际上如何操作?以下是他的快速步骤清单:
- 第一步:使用 /tune <prompt> 命令来启动 Style Tuner。
- 可以选择一次生成 16、32、64 或 128 种对比的视觉风格。
- 同意 GPU 使用成本〔一次生成愈多风格,就要花掉愈多每月花钱买的运算时间〕,并准备等待几分钟以生成基于提示的风格样本。
- 第二步:在生成的视觉风格中,挑选接近自己想要风格的样本,可以一次挑选多个。
- Midjourney 针对我们挑选出来的风格样本,生成一个最符合我们微调出的风格的参数 –style <code>。
- 第三步:之后可以利用这个风格代码,开始生成符合我们想要的特殊风格的正式图像。
实测
下面是我的一个实际的测试示例。
首先,利用 /tune 指令进行风格调音,在 /tune 后面先输入正常的提示语。
但是接下来,会询问你要生成多少组风格对比样本,例如 32 组的意思,就是会有 64 张风格对比图像让我们挑选。〔当然,这些都会花掉大量的运算时间,我试过生成 128 组样本的话要花掉一个多小时运算时间!〕
确认后,开始生成风格样本,虽然看似要生成很多张图,但时间通常都在 1~2 分钟内就可以完成。例如我尝试生成 128 组〔 256 张图片〕也是在 2 分钟内就完成。
接着,Midjourney 会提供我们一个「链接」,打开这个链接,就可以在风格样本中,挑选自己真正想要的风格。
生成的风格样本库,其实可以提供给他人参考,这边有两个我测试生成的风格样本库,有兴趣的朋友可以玩玩看:
- 128 组风格样本测试结果: https://tuner.midjourney.com/giKTYR7
- 32 组风格样本测试结果:https://tuner.midjourney.com/4dLazKV
进入生成的风格样本库,要做的就是挑选我们真正想要的风格。
例如下面这个风格样本库中,我想要生成的是「台北 101 的夜景照片」,这时候 Midjourney 帮我生成了各种风格的图像,有些很亮丽,有些很写实,有些则有阴郁的电影感。
而我们要做的就是,在两两对比的组合中,「勾选」自己真正想要的风格是哪几张。
例如下图中,我朝着写实的、阴郁的、电影感,不要太亮丽的方向,去挑选我想要的风格。
挑选好后,滑动到下方,会看到一段可以复制的提示语,提示语中也根据我上面的风格样本挑选,生成了一组专属的「风格代码」。
例如我这边有产出两组风格代码,有兴趣的朋友可以用它们来玩玩看:
- 简洁清爽,白色基调,有点过曝的风格:–style raw-3hanJ7b9UNZPiaKdXgOOGxLGJHkAFpU0OL
- 阴郁电影般写实照片的风格:–style raw-1obkEy7jqMFw0Ivt
上面那两组风格代码,分别产出下面这两种图像的结果。
这时候,利用「Midjourney Style Tuner」,就算我们不能准确描绘风格术语,现在也可以通过风格挑选,最后让图像走向我讲不出来,但是我想要的风格面貌。
然后,我要产出其他图像时,如果要采用跟之前用过的风格,就只要把之前生成的「风格代码」,加入到提示语中即可。例如:一张非洲草原狮子的照片,加上阴郁写实电影风格的代码 –style raw-1obkEy7jqMFw0Ivt,就变成下图。
一张办公室照片,加上阴郁写实风格的代码,就变成下图。
是不是可以看到风格的一致性,可以套用到之后不同的图像生成中了!
总结
「Midjourney Style Tuner」还有很多进阶的参数可以利用,有兴趣的朋友可以参考官方教程文件。
但是上述的利用方式,让我可以直观的挑选、微调出我真正想要的风格,已经是对我来说最有用的帮助了。
这样一来,我到底要不要退掉 Midjourney 呢?〔因为之前说 ChatGPT DALLE-3 确实也很好用。〕