2023 年年底的时候,英文等少数语言版本的 Google Bard 升级到 Gemini Pro 模型,号称在许多评比上都能达到 ChatGPT 的水平。而来到 2024 年,google 在 2 月初终于宣布 Google Bard 全球 40 多国语言的版本都升级到 Gemini Pro 模型,其中也包含中文版本,现在用户免费就可以获得升级版的 AI 能力,其中包含「图像生成」、「长文分析」、「内容查证」等功能,以及更好的逻辑、理解与创造分析能力。今天这篇文章,想分享我实际测试几天的心得与比较。
简单说说目前的心得,下面三种情况,建议可以考虑试试,甚至切换到 Google Bard〔 Gemini Pro 版本〕:
- 原本使用的是免费的 ChatGPT 〔GPT-3.5〕版本。
- 有时使用 ChatGPT 却卡住的时候〔例如常常在推出新功能那几天特别不顺畅〕。
- 想要有一个可以跟 ChatGPT 对比答案的 AI 工具〔例如想组合出更好的内容〕。
这时候新版的 Google Bard 〔Gemini Pro 版本〕会是一个非常适合的选择。
Google Bard 〔Gemini Pro 版本〕优点与目前限制:
以下是我的初步测试心得,不是结论,也可能跟着 AI 的更新而持续修正,并且下面的心得都是以「中文问答」的效果而论〔2024/2/6 前测试〕:
- Google Bard 〔Gemini Pro 版本〕免费版就能做到的优点:
- Google Bard 〔Gemini Pro 版本〕可能的限制:
如果你目前 ChatGPT 使用的是免费账户〔提问长度短、无法生成图片、没有上网功能等等〕,那么或许 Google Bard 〔升级 Gemini Pro 后〕会是一个可以考虑的替换选择。
或者当 ChatGPT 达到一个使用量限制,变得不可用时,Google Bard 〔升级 Gemini Pro 后〕目前看起来也可以应付工作需求。
至于 Bing 〔以免费版来说〕,虽然他背后的引擎也是 GPT-4,但是因为目前提问的长度、对话次数都有许多限制,在使用上很容易卡住〔例如要针对一个工作连续提问时〕,我自己都比较少使用,这时候也会推荐使用 Google Bard。
实测一:AI 绘图〔免费版即可使用〕
Google Bard 〔Gemini Pro〕升级后,成为另外一个目前可以免费使用的 AI 图片生成工具。只不过目前 Bard 的图片生成还有一些限制:
- 〔似乎〕只能生成 1:1 正方形图片。
- 只支持英文提示语。
- 有比较多的版权与生成限制,Google 似乎更想避免生成使用上有疑虑的图片。
所以有时候某些人像、某些场景会无法生成。但毕竟是免费就可使用,而且看起来没有特别的使用数量限制,还是值得试试看。
而在生成图片的质量上,目前的成果是:
- 没有超越 DALL-E-3〔教程:ChatGPT DALL-E 3 的 7 个特殊 AI 绘图应用教程,胜过 Midjourney〕,当然更没有超越 midjourney,但也已经堪用
- 图片上瑕疵比较多〔例如手指等细节〕
- 还无法结合文字
- 提示语如果比较复杂时,对提示的理解力没有 DALL-E 3 那么完整与精确
所以目前如果要使用 Google Bard 来生成图片,使用简洁扼要的英文提示语,生成出可以搭配的图片素材,会是较为适合的用法。
下面就来比较一下三种 AI 绘图工具在同样提示语下生成的图片结果。
Bard | ChatGPT | Midjourney |
提示语:A dog run on the beach. | ||
平实的照片 |
氛围有强化 |
最接近真实照片 |
提示语:Create a image in a style that resembles a realistic photograph, depicting a professional working swiftly in a non-traditional work environment, like a coffee shop, park bench, or home living room. The scene should have scattered sticky notes with quick sketches and notes around them, capturing the idea of seizing inspiration and making progress in brief moments. The atmosphere of the image should convey a sense of calm and serenity, moving away from a cartoonish style to one that is more lifelike and tranquil. | ||
普通画风 |
更接近提示语 |
艺术画风 |
实测二:自动内容查证的应用
这是一个很有用、很方便的功能,伴随 Google Bard 〔Gemini Pro〕全球推出,「内容查证」按钮也在中文版中可以使用了。
当 AI 生成回答后,我们点一下「G」的查证按钮图标,就会自动利用 Google 查找可以证明回答或提出疑虑的网络资料。并且,会自动用不同颜色标明可否信任的段落。
例如我们询问一个近期的新闻相关问题。
按下 G 图标,进行内容查证。
显示查证结果:绿色表示有接近的信息,橘色表示有不同意见的信息,光标移过去,也会看到相关延伸信息的卡片,或是点开网址查看完整资料。
实测三:一次分析长篇文章
在 Google Bard 〔Gemini Pro〕中允许一次贴上很长的文章进行摘要分析或资料整理,我实际测试贴上 6000 多字的文章也没问题。
如果你常常被 Bing 或 ChatGPT 免费版的字数限制搞得很烦,那么 Google Bard 可以避免这个问题,我们可以贴上完整博客文章进行分析。
而且提问的次数目前看起来也没有特别的限制。
下图是 Bard 分析一篇长文章的成果,整体上比免费的 GPT-3.5 要好。
但是如果和 ChatGPT 付费版本的长文分析对比,GPT-4 在面对长文处理时,还是能够更仔细的抓出更多细节,摘要的内容也更有逻辑。
实测四:问答对话模式
当然我们也能够把 Google Bard 〔Gemini Pro〕设计成可以一问一答,连贯上下文,辅助引导的工作助理。新的语言模型可以一定程度理解稍微复杂的提示语,并在后续讨论根据提示语逐步作出回答。
不过如果助理提示语〔中文〕更复杂时,Google Bard〔 Gemini Pro 版本〕目前还是无法全面的掌握,相较来说 ChatGPT 的 GPT-4,甚至 GPT-3.5 对「更复杂的」提示语的理解度都更好。
实测比较五:和 ChatGPT 的常用提示语做对比
初步看起来,Google Bard 〔Gemini Pro〕生成结果不输 ChatGPT 的 GPT-3.5,也有些免费版 ChatGPT 所没有的功能〔图片生成、长文分析〕。
我实际把自己过去一年多来常常在 ChatGPT 使用的案例与提示语,丢到 Google Bard 〔Gemini Pro〕实际测试看看,下面就是这些应用案例的比较心得。
- 整理资料
- Bard 把杂乱资料汇整成表格、列表的处理能力已经很不错。
- 也很适合把字幕转成通顺的文章,如果不是要改成优美的文案,只是理顺资料,这部分 Bard 已经很实用,而且速度飞快。
- 文案能力
- Bard 目前写出来的文本〔中文〕没有 ChatGPT〔GPT-3.5、GPT-4〕 优美,不过用来生成草稿,像是报告开场白、电子报介绍词、邮件内容等等,还是很实用的。
- 搭配 AI 专属提问方法:提供文案或报告让 Bard 模仿,然后再生成内容,也可以产出不错的成果。
- 分析主题
- Bard 规划基本项目、任务流程,或是展开一个知识介绍的能力也足够达到 GPT 3.5 的水平。
- Bard 也可以有很好的项目、任务拆解建议。
- 生成报告
以上就是我的 Google Bard〔 Gemini Pro 〕版本的测试心得,分享给大家参考。