ChatGPT 之前让许多人惊艳的「进阶语音模式」功能,今天开始陆续针对 Plus 与 Team 用户推出。这个模式最大的特色,就是可以用更加自然〔接近于真的跟一个人聊天〕的对话方式,让用户通过语音与 AI 进行交流。
相较于旧版的功能,新的语音交谈过程更加流畅、AI 反应迅速、接话过程几乎没有等待,也能随时打断 AI、插入新话题,除了可以支持多国语言在同一个对话中自由切换外,还能让 AI 模仿或调整各种对话风格等等。
那时候在 OpenAI 推出的官方视频中,这个 AI 进阶语音不只是更自然流畅而已,他还可以结合看的功能〔摄影镜头〕来回答用户问题,或是在语音中识别出用户的情感而提供对应的回应,这些跟原本拟人化的语音结合在一起,效果确实令人惊艳。
不过目前的「进阶语音模式」功能,似乎还没有当时视频中「完成体」的样子,在我实际的测试中,目前的〔2024/9/25〕的「进阶语音模式」有下面这些特点与限制:
- 优点:
- AI 的语音回答确实更即时、快速、流畅、更像是两人同步对话。〔不再像是之前需要等 ChatGPT 先生成内容后,AI 才会念出来〕
- 对话过程中,可以随时打断、插入话题,过程都很自然。
- 对于语调、语速,可以通过对话调整。〔也有自带的多种语音风格可以选择〕
- 支持多国语言,可以在同一次对话中自然切换,可以听与说闽南语。
- 限制:
- 付费版本也会有使用的「时数」限制,每天限量使用。
- 但目前进阶语音功能,还不具备上网查找、镜头识别图像等等功能。
- 一旦讨论串中出现不是语音的问答〔例如自己打字提问〕,这个聊天室就无法再使用进阶语音功能〔讨论串必须全部使用进阶语音〕。
- 目前似乎还无法很明显的识别对话中的情感,要求做出情绪反应时 AI 还是比较生硬一点。
我测试了几个 ChatGPT「进阶语音模式」的应用情境,下面跟大家分享「纯心得」,之所以叫做纯心得,就是因为我没有时间录制成视频再剪辑,所以真实过程其实是手机 App 上的语音对话,但我就用事后图文的结果来说明。
请 ChatGPT 假装成采访者,引导我说出报告与文章草稿:
首先,我之前就尝试过,利用跟 ChatGPT 进行一来一往的语音对话,一起构思一个企划案、文章草稿,例如,请 ChatGPT 假装成一个采访者,采访我对某个主题的想法,引导我把想法说出来,最后我就可以把这些内容转换成报告或文章。
旧版本的时候,其实我就已经觉得满好用的,只是那时候 ChatGPT 的每一次回应「要等很久」,所以对话过程相对生硬很多。
但使用新版的「进阶语音」模式,整个对话讨论过程完全不需要等待,AI 几乎都可以立即回应、接话,而当我发现 AI 说的东西走偏时,我也可以立即打断他,重新拉回主题。
最大的改变就是整个过程会更迅速,更节省时间,而脑中的想法可以更顺畅地说出,更有头脑风暴的感觉。
我喜欢用这种来回对话的方式,把很多想法激发出来。
经过完整的语音讨论后,请 AI 统整前面的讨论,整理成报告、文章的草稿。
不过,最后这一段我用的是文字的指令,当我这样做之后,这个聊天室就不能再进入进阶语音模式了。
请 AI 当一个冥想、放松引导教练,或是语言家教:
其实现在有很多 App 可以做类似的事情,无论是真人还是 AI,有一个在线家教,通过语音来教我们学习一些事情。
于是我试试看让 ChatGPT 通过「进阶语音模式」,当一个冥想教练。
首先,我先试试看在对话中让他调整语调。〔毕竟冥想教练的语调应该更缓和、舒服一点〕
然后我请他当一个冥想教练,通过进阶语音模式,引导我进行深呼吸的练习,或是引导我做大脑放松,效果还可以,这看起来也是一个适合 ChatGPT「进阶语音模式」做的事情。
当然,在这种特别需要情感的情况下,AI 的声调听起来还是比真人的语调生硬一点点。
或者,我也请 ChatGPT 通过「进阶语音模式」当一个英文家教,带我练习口说。
相较于旧版本,因为现在对话过程更流畅,所以更有面对面家教的感觉。例如我先跟他说明想要学习的背景,通过讨论,我们决定一起来练习旅行中的英文。接着 AI 提示我可以先练习餐厅中使用的英文,于是他先说几句如何点餐的用语,然后要求我照着念一次,并且会给我即时回馈。
这部分的过程非常顺畅也满有用的,而且可以通过对话随时调整成自己想要学习的内容,比很多固定的英文学习 App 更好用。
请 AI 当一个即时口译协助者,支持多国语言:
我也尝试看看把这样的「进阶语音」当作翻译工具来使用看看,以后如果有旅行、会议场合,可否帮我更快速、流畅的翻译双方沟通的内容呢?
首先,我进入语音对话后,先做一些设置,请 ChatGPT 充当即时口译的角色,并告诉他听到什么语言时,要口译成什么语言。
然后我说了一段中文,他很顺畅地直接翻译成正确的日文内容,当然,是用说的说出来。
然后我尝试在不同的语言之间切换,ChatGPT 的 AI 语音都可以即时口译成我需要的另一种语言。
而且当使用台语〔闽南语〕沟通时,ChatGPT 的 AI 语音也能听得懂,并且也会用台语回答。
整体来说,昨天初步测试,上述几个应用情境,对我来说就可以生成很大帮助:
- 利用 ChatGPT 进阶语音模式做头脑风暴,完成报告、文章草稿。
- 利用 ChatGPT 进阶语音模式担任学习助手,练习外文口说、冥想运动教练。
- 利用 ChatGPT 进阶语音模式做即时口译,翻译多国语言内容。
使用 ChatGPT Plus 或 Team 版本的用户,值得试试看。