保姆级入门教程
- 科学上网。
- 注册网站〔www.midjourney.com〕,注意,由于 Midjourney 并没有自己官方的客户端,而是搭载在 Discord 上的,所以过程中,没有 Discord 账号的话也要注册一下。
- Discord 可以简单理解为微信群,Midjourney 在群组里放置了机器人〔bot〕。我们画图的过程,就是把 prompt 发给 bot,它会回复给我们。所以加入大的群组〔社区〕后,可以看到各种小群组。对于新用户,有免费的画图名额,要进入新人画图群组,是这几个 newcomer rooms:进入之后,你会发现很多人已经在画图了:
画图的方式是,在对话框里输入
/imagine
对话框会变成这样:
在 prompt 的框里输入英文的描述,敲回车即可。
- 你会发现每次生成 4 个不同的图片,这样每张都不算高清。这其实算是 demo,低成本地让你判断有没有合适的,然后可以再做 upscale 〔升级,或者扩大篇幅〕的操作。每个图片下面也有快捷按钮,U1-U4 指的就是按顺序的图片。注意,upscale 的操作也是耗费额度的。具体 upscale 的操作技巧,下一节我们再聊。
- 免费会员有 25 次的使用额度,用完后就没了。付费会员则分为几类:10 美元/月,每个月 200 张的额度;30 美元/月,fast 模式大概有 900 张的额度,relax 模式额度不限;60 美元/月,fast 模式大概有 1800 张额度,relax 模式额度不限,同时可以私密模式下使用〔其它模式下你画的图是公开在个人主页的〕。一般推荐的还是前两种。付费可以用国际货币信用卡。
查看付费页面的方式是在输入框里使用语句:
/subscribe
付费会员会有自己的 bot,不用在群组里发了:
几个补充:
- fast 模式和 relax 模式顾名思义,就是速度不同,fast 基本会确保 3-4 分钟出图;relax 不一定,但个人体验下来也还好,很少有超过 10 分钟的,因为是排队的模式,在有时差、外国人都睡觉的时段,速度也很快。切换 fast 和 relax 的方式是直接在输入框里输入语句:
/fast
/relax
- 英语不熟悉的朋友,推荐用这个:deepl.com
- 用 Midjourney 画出的图片,创作者可以拥有版权,这两种情况例外:
- 是免费会员;
- 用于年收入超过 100w 美元公司的使用。
更详细的可参考:docs.midjourney.com
- 对于付费会员来说,Midjourney 的 feed 社区是发掘好的 prompts 的绝佳圣地:www.midjourney.com
描述词及绘画控制
Midjourney 的 prompt 的结构可以拆分成三个基础组成部分:
- 内容描述:就是主体内容,表达我们到底想画什么。是骡子是马,是猴子是兔。他们是什么形象、穿着什么衣服、在干什么,等等。
- 风格描述:包括曾经讲过的艺术家、画笔风格、艺术风格等等,甚至包括打光、视角、拍照相机的牌子等等。
- 属性描述:最基本的图片属性,比如尺寸、使用的 Midjourney 版本。
显然,内容描述是各位在画每个图的时候各自去创作的;风格描述,就是这个创意库接下来要探讨的;而属性描述,是相对最基础也容易掌握的部分。这篇文章就探讨几个最基本的属性描述词。
对了,强调一下,内容描述和风格描述都是可以用 , 或者 + 隔开的。而属性描述是要用两个短横线隔开的,要严格遵循:–[属性名][空格][属性值]
比如:rabbit, white –v 4
版本号 –v 1/2/3/4
前文提到过了,去年底发布的 v4 是效果最震撼的,而之前的三个版本还没有达到如此写实的程度。2023 年,这个专栏更新的过程中,Midjourney 预计会发布 v5,又会有一轮优化。
v 1-4 的区别,可以用同样的关键词来体会,比如:
cat –v 1
cat –v2
cat –v3
cat –v4
直观的感受,自然是默认都用 v4 即可,效果是最好的。但在画不同艺术风格的图片时,也未必。有时候觉得过于写实了,用一下 v2、v3 画抽象的风格,可能会有奇效。
另外,每次输入 –v 4 是比较麻烦的,想要默认都是 v4,可以输入语句:
/settings
这里面可以选择各种默认的语句。每次输入完,会自动给你添加上的。
扩幅相关 upscale
upscale 是把 4 in 1 的 demo 图片扩大篇幅成为更高清的图片。默认的扩幅一般就能用了。
还有几个特殊的扩幅操作:
–uplight
轻量级的扩幅,不代表是「不用心」的,指的是添加少数细节。对于平滑和简单的图片,效果更好。
这一项也可以在 settings 里设置成默认。
–upbeta
这是 beta 扩幅,增加更多额外的细节,图像像素大小也会翻一倍。
另外,还有一个特殊的操作,就是当你用了 upscale 之后感觉还是不行,想要重做,是可以用 light 重做和 beta 重做的,逻辑类似。方式就是点击图片下方的按钮:
这里还有一个 Make Variations,也容易理解,就是根据这个图重新做一份 4 in 1 的 demo,效果是这样的:
对于扩幅的图片像素大小,官方有一个完整的图表:
负面提示词 –no
如果不希望图片里出现什么内容,可以用这个描述。
比如:
–no hands
不要出现手。
质量 –q .25/.5/1/2
这是很量化的图片渲染时间,默认是 1。如果用更短的时间,消耗的额度更少,图片效果可能略差;反之亦然。
注意,渲染时间也跟额度有关。q 设置为 2,差不多就消耗两倍的额度。
图片比例 –ar 2:3/3:2
v4 版本只支持三种比例:
默认的 1:1,2:3 和 3:2
要调整比例,使用语句 –ar,如:
cat –ar 2:3
v3 支持更多比例。但这里不展开说了。
有多飞 –c 0-100
chaos 指的是画得有多飞,默认值是 0。如果数值较大,会画得特别飞〔少数场景才比较合适〕。
比如这是:
cat fighter –c 0
这是:
cat fighter –c 100
参考图片
Midjourney 是支持参考图片的。比如如果想依据自己的照片画图,可以直接把图片网址放在 prompt 里面。例如:
s.mj.run iron man
如果图片还没有上传到什么图床,可以直接在对话框里发送,发送完后点击右键——复制地址。
增加语句重制 Remix
跟普通的重新制图不一样,高阶版的增加语句重制,可以在原构图/基本结构上,画别的主题。
具体操作是要去 settings 里打开 Remix Mode,然后再已经 upscale 的图片下点击 Make Variations,就可以另行输入 prompt 了。
这是我画的中国古镇:
这是用同一张图片在 Remix 模式下绘制的北欧古镇:
细分样式 –style 4a/4b
在 v4 中,Midjourney 还提供了有细微差别的 style,把 4 分为了 4a 和 4b。如果不输入 style,默认都是 4b。具体的区别,官方没有说明,可以用图片感受下〔4b 的在前面有过了〕:
cat –v4 –style 4a
动漫风格 –niji
官方跟麻省理工的 ai 团队 spellbrush 合作推出的 niji 风格。
cat –niji
更多相关的属性描述词
可以参考官方手册:
掌握了以上这些,可以说已经掌握 90% 的参数了。
下一节开始,我们将进入正文主题,开始我们的创意之旅。
2 分钟快速上手版
点击下方进入 Midjourney 官网,注册之后,可以点击左侧newbies-*进入新手频道
https://www.midjourney.com/
之后在下方输入/imagine
,后面接关键词即可
- 推荐关键词
- 效果增强
- 尺寸关键词〔譬如指定 2:3 尺寸〕
- 使用最新渲染引擎
然后回车,我们可以看下效果
之后,有 2 排按钮,U 代表的是放大尺寸。V 代表是喜欢这个版本,再生成四个类似的;
如果你觉得不喜欢也可以点击蓝色的刷新按钮
譬如,我们现在觉得第三个效果最好,那你可以选择 V3 再生成四个与之风格相似的图片。你需要聊天窗口往下移动,就可以看到新生成的图片了
这里我们认为第二个效果最好,则可以使用 U4,对其进行放大!
然后再往下看,就能找到清晰的图片了
进阶思路
当然,你也可以使用 chatgpt 让他帮助我们来提取关键词,进行输出
你可以像我这样输入
你现在是一个提示词生成器,请根据接下来我的描述生成英文提示词,使用逗号隔开,听清楚了吗?并在提示词最后添加`hyper realistic,4k,-- v4`
然后我们整理 ChatGPT 给的提示词,放到 Midjourney 里试下
realistic and clear cheeks, beautiful and captivating, double ponytails, schoolgirl style short skirt, white stockings that accentuate the alluring long legs, blurred street background with passing vehicles to highlight the character,hyper realistic,4k,-- v4
看下效果
看起来还是可以的
当然,如果不喜欢也可以重新刷新
然后就可以看到新的图片了
当然,还可以进行细节的提升,这里我们就不再演示了,大家可以自己添加更多详细的描述!