最近 ai 人工智能工具正在急速发展,想是 ChatGPT 聊天机器人、Midjourney AI 绘图工具等,都能通过在线快速解决人类日常生活问题。。
DID 在线制作能让人像照片说话,主要是利用最新 AI 结合拟真人视频技术,让照片中的人像或亲人照片动起来,还能够替照片加上录音档或文字稿内容,进行人像照片与声音的结合,人物也会自动开口说话。此服务支持中文和英文语音,相当强大且易于使用。
DID 免费一键生成人物照片动起来视频
D-ID 是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,就能利用 AI 语音机器人自动转换成音讯,甚至还能上传录音文件,就能快速获得一部非常逼真会开口合成视频。这些可用于亲人照片、虚拟讲师、主持人、AI 机器人或视频特效等场景,应用于教育或各种服务场合都非常适合。
底下就来分享,如何使用 DID 在线制作会说话人物照片,并且搭配 ChatGPT 聊天机器人和 midjourney AI 绘图工具,如果想将人像照片和声音合成,可以先看底下这部最终示例成果,这是通过一张 AI 绘图生成的平面照片,并且搭配 AI 语音合成后的视频,你会发现画面内的嘴巴会搭配语音自动动起来,脸部还会有些动作,像是眨眼睛、微笑、摆头等,看起来就如同真人一样。
如何用 DID 制作人像照片开口说话
首先打开 DID 在线将照片动起来和配音网页,并且点击右上角「FREE TRIAL」开始免费体验试用。
进入 Video Library 画面后,直接点右上角「CREATE VIDEO」开始建立新合成视频。
设置国家语言与 AI 语音
在 AI 合成照片编辑画面内,先设置中文语音,从右侧先选择国家语言,目前繁体中文 AI 语音和口气选择比较少,要是想要更多元化声音,可以使用简体 Chinese 语言,就能够看见更多样化语气和年龄层声音。
底下 Voices 可以选择男生或女生 AI 声音,有多种可以选择。
选择或加入人像照片
再来可以设置人像照片,默认会提供不同的人物模板,要是你想要设置照片,就可以点击「ADD」按钮上传人像照,在上传照片要注意底下几点:
- 人物要在照片正中央位置,头部不要被裁掉一半
- 脸部完全朝前,不要露出牙齿
- 图片最低分辨率需要 200×200 像素
- 照片内光线稳定,不要偏暗或模糊
- 上传照片容量最大只能 10MB
上传时,显示需要注册登录 DID 账号提示,可以直接用 google 或 Email 免费注册。
输入文稿内容与上传录音档
接下来,要设置语音文稿部分,可以自行输入想打的内容,或是直接利用 ChatGPT 聊天机器人快速生成,例如想要制作一段自我介绍视频,可以要求 AI 机器人以自我介绍说明目前工作和兴趣。
最后将文字贴在 Script 框内,点击底下喇叭按钮,确认 AI 声音是不是你想要的,如果不喜欢可以通过 Voices 调整声音,时钟按钮可以调整语音速度,要是想上传录音文件也可以,只要点击「Audio」后将录音档上传,就能通过 DID 平台将照片与语音进行合成。
设置合成视频标题
最后点左上角设置合成视频标题,直接输入中英文都可以,主要是方便后续要继续生成其他 AI 人像语音视频时,比较好辨识项目名称。
输出会说话的照片人物视频
最后点击右上角「GENERATE VIDEO」开始输出视频文件。
每次输出视频会消耗 5 credits,账号注册后会有 20 credits 能够免费使用,等于每组账号可以免费输出 4 次,要是照片和语音文字都确定后,就点「GENERATE」开始转换输出。
下载 DID 人物视频
过一段时间合成完成后,就会看见 Video Library 内会显示人物图像略缩图,想要下载和观看成品就直接点入。
就可以点击视频开始播放,就会看见照片内的人物开始动起来,同时也会搭配声音有不同的表情、嘴形与摆动的动作,只要点「DOWNLOAD」就能够将视频下载下来。
总结
DID 算是一款非常便利免费在线合成拟真人视频平台,能够让一张看似很平凡的照片,通过 AI 技术将语音和声音进行合成,就能快速完成一部非常逼真的人物说话视频,目前免费版最多可以输出 4 次视频,要是超过就需要付费才能解锁和去除水印,要是有需求可以先免费体验输出,感觉实用需要大量使用建议可以付费。