你拍下一些照片,却觉得照片的背景不够完美?你是内容创作者,但找不到文章合适的配图?你是电商卖家,想位产品设计更吸引人的配图?你是老师,需要为教材找出一系列搭配的示范图片?以前,我们修图可能需要 学 Photoshop,需要花很多时间调整细节,或是要下载各种修图 App,还要在图库中翻找适合自己的图片文件。
但现在,只要一个 AI 指令,就能让我们需要的照片「瞬间改造完成」。
如果你想体验看看类似的工作流程,可以试试看前两天推出的 Google Gemini 免费 AI 修图!只要「一句话」,你就能改变图片,换背景、改风格、添加新元素,甚至创造连续漫画。
〔类似功能,在 Google Pixel 系列手机的 Google 相册中也能部分实现,Adobe、Canva 等的 AI 修图也能实现部分功能。〕
这篇文章,我会实测 Gemini 的 AI 修图能力〔而且免费即可使用〕,看看它怎么帮助我们「一句话变出想要的修图效果」!
- 改变照片背景,让天气变成晴天
- 转换照片风格,变成水墨画、铅笔手绘
- 增加新元素,例如让街道上多几个人
- 生成一连串的图片,做出漫画或食谱
我将分成三种应用角度来介绍,这些全部都能在 Gemini 中用自然语言下指令,便可以把照片生成或改造:
-
基础照片修图:让拍坏的照片变完美
-
替换背景、增加物品、改变颜色光线、调整风格。
-
-
进阶场景创作:为文章制作主题插图、让商品看起来更吸引人
-
搭配原始照片,制作特殊场景图
-
搭配原始照片,重新设计房间或产品
-
-
连续系列照片生成:根据文章、教材内容,生成一系列互相搭配的图片
-
模拟图文食谱
-
说故事的连续漫画、图画
-
文章中搭配的系列配图
-
教程
首先,这个功能目前〔2025/3/14〕尚未开放在正式版的 Gemini 中,但可以通过免费账号即可登入的「 Google AI Studio 」来使用。
用 Google 账号注册登入后,进入一个新的对话框,并在右边控制列的「Model」菜单,切换到「Gemini 2.0 flash experimental」,就可以利用其 AI 来创作图片、修改图片,最大的特色是:
这个 Gemini 模型可以上传自己的图片,用「自然语言」下指令,请 AI 在图片上修图或生成新内容。
就如同 experimental 所说的「实验性」,实际测试结果,这个 AI 修图功能确实很神奇,也能够看到一些未来修图、创作图片的新可能性,不过可下载的图片质量等限制,目前还是不足以真正用在商业用途上的。
用 Gemini 完成基础照片修图:
在「Gemini 2.0 flash experimental」的对话框中,我们可以先上传一张原始照片,如果想要替换背景,只要简单的说一句这样的指令:「把照片的背景换成草地。」
就可以在 10 几秒的处理后,完成下图的成果。可以看到,Gemini 的「修图」是真的可以保留原始照片中的内容,只修改我要修改的部分。所以是真的 AI 修图,而不是 AI 重新生成图片。
我也可以上传一张风景照片,然后下指令:「把照片的天空改成大晴天。」Gemini 同样可以处理这样的调整。〔在 Google Pixel 手机的 Google 相册中就有类似功能可用〕
如果想要替换照片风格,套用艺术滤镜,也可以用 AI 下指令:「把照片变成中国水墨画风格。」就能轻松转换风格。
不过当然跟真正的艺术滤镜还是有落差,例如下图中我要 AI 把照片改成「彩色的铅笔绘画风格」,看起来还可以,不过专业的艺术滤镜一定会处理得更好。
用 Gemini 进行进阶场景图创作:
除了可以用「Gemini 2.0 flash experimental」的 AI 修图外,也可以在原始照片上进行创作。
例如延续上面的图片案例,我对 AI 下指令:「拓展成一幅横幅的中国水墨画。」十几秒后,照片就变成了一幅新的水墨风景画。
或是我的书籍封面,上传后,下指令说到:「我想把原书的图片,摆在一张高雅的书桌上。」结果还真的可以顺利生成新的产品摆拍图。
不过如果细看,书籍封面上有些小字其实是有瑕疵的。
因为 Gemini 是对话的模式,所以在原始照片的改造上,我们可以通过多次讨论,让 AI 在原始照片上陆续添加内容,制作出自己需要的场景图。
例如下面原本只是单纯公园照片,我先请 Gemini:「在这张照片的草地上,加上一对正在野餐的男女朋友。」于是生成了下面的图片。
然后我继续追问:「让两人旁边有一只小狗在奔跑。」
然后再下指令:「旁边的道路上,也有零星的路人在散步。」
最后说「让天空变得更晴朗。」于是我要的最终场景图,就通过 AI 创作完成了。
我还做了一个尝试,先上传一张原始的房间照片〔某家旅馆〕。
然后我陆续对 AI 下了下面这些指令:
- 窗帘要更透明,有大片落地窗。
- 沙发换掉,改成有北欧风格的沙发。
- 房间的壁纸、地板、桌子也改成更现代北欧家具的风格。
结果 AI 生成了下面这样的图片,第一张是原图,第二张是最后生成的图片,改造的图片还是保有原图的空间格局,只是风格焕然一新。
用 Gemini 生成连续系列照片:
Google Gemini 本来就可以生成图片,但「Gemini 2.0 flash experimental」比较厉害的是可以分析文章内容,生成适合的配图,或是一系列的连续漫画、故事图片。
例如,我对「Gemini 2.0 flash experimental」下了这样的指令:「你是意大利面专家,提供给我一道海鲜意大利面的食谱,请一步一步处理,用文字具体列出关键步骤,并在步骤后搭配图片。」
结果他「一次」就生成了下面的连续图文教程内容,这是在一次的问答后就完成的结果。
我假设自己写了一篇游记,于是请 AI「设计一系列素描画,展现一个人在京都街头散步的故事,请一步一步分析,以京都的场景,搭配素描画风格,设计有意思的散步故事,创作一连图画。」
结果「Gemini 2.0 flash experimental」也在一次的生成中,提供给我下面连续故事图,比较神奇的是这些连续图片中都有类似的人物,保持图片连贯性,虽然风格上有点跳跃。
还可以这样问 AI,我让 Gemini 自己思考如何设计一系列进入书店场景的图片,Gemini 自己写了一大篇分析内容后,才开始设计并产出图片。
但效果看起来还不错。
所以,在功能上,利用现在〔2025/3/15〕在 Google AI Studio 中的「Gemini 2.0 flash experimental」,你可以上传原始照片请 AI 修图、改图。也可以让 AI 读一篇文章、思考一个主题,生成一系列连续图片。
未来这个功能越来越成熟,或许有下面这些应用可能性:
- ✔ 喜欢拍照片又爱修图的朋友:比如让阴天变成晴天、移除背景干扰,让照片更完美。
- ✔ 内容创作者〔博主、YouTuber、社交经营者〕:为文章快速生成适合的配图,或将文章内容转换成连续插画,提升可读性。
- ✔ 电商卖家 & 运营人员:让产品图片更吸睛,例如自动生成商品摆拍图、背景优化,或者创建广告素材。
- ✔ 教育工作者 & 教材编写者:利用 AI 自动生成教程图解、示范图片,让课程内容更直观。
现在,你也可以通过免费账号即可登入的「 Google AI Studio 」来试试看。