人人都是产品经理 04-08
ChatGPT vs. Microsoft Copilot vs. Gemini,到底哪个好?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在过去一年里,AI 工具的出现一定程度上改变了我们的工作和生活方式,那么,这些 AI 工具,谁更靠谱?不妨来看看本文的一个测评结果。

人工智能(AI)在过去的一年里彻底改变了我们的工作和娱乐方式,几乎任何人都能够编写代码、创造艺术甚至进行投资。

不管是对于专业还是业余的使用者,生成式 AI 工具,如 ChatGPT,给我们提供了从简单提示到创建高质量内容的高级能力。

随着 Microsoft 将 GPT-4 添加到 Bing 并将其更名为 Copilot,OpenAI 为 ChatGPT 增加了新功能,以及 Bard 被整合进谷歌生态系统并重新品牌为 Gemini,AI 工具的更新迭代越来越快了。

那么:Microsoft Copilot Pro 与 OpenAI 的 ChatGPT Plus 以及谷歌的 Gemini:你认为哪个值得你每月花 20 刀?我测试了这三个 AI chatbot,一起来看看结果。

测试 ChatGPT、Microsoft Copilot、Gemini。

首先我用了一个简单的逻辑问题来对比:

我今天有 5 个橙子,上周我吃了 3 个橙子。我还剩下多少个橙子?

答案应该是五个,因为我上周吃了多少个橙子并不影响我今天有多少个橙子,可以用这个来测试一下三个 AI 工具的逻辑能力。

一、首先是 ChatGPT 测试

ChatGPT 于 2022 年 11 月发布。自发布开始,这款 AI chatbot 迅速获得了超过 1 亿用户,仅网站每月就有 18 亿访问者。也一直是舆论的焦点,几乎每个新的 AI 工具发布出来都声称 " 远超 ChatGPT ",ChatGPT 俨然已成为行业的标杆。

我几乎每天都在使用 ChatGPT,帮我解决了很多棘手的问题。

ChatGPT 3.5 的结果:

ChatGPT 3.5 给出了一个错误的答案

二、ChatGPT 4.0

ChatGPT 4.0 给出了正确的答案

ChatGPT 4.0 正确理解了问题的完整上下文并给出了正确答案。免费的 3.5 版本的逻辑能力确实不如 4.0。GPT-4 据说拥有超过 100 万亿条数据;GPT-3.5 有 1750 亿条数据。更多的数据本质上意味着模型是基于更多数据进行训练的,这使得它更有可能准确地回答问题,减少错误的可能性。

如果用 GPT 的话,更推荐使用 4.0 版本,不管是在功能上还是在回答的结果质量上都甩 ChatGPT3.5 好几条街。不过需要注意的是 ChatGPT 有条数限制是三个小时 40 条,如果超出了这个条数就需要等。

目前 GPT4(ChatGPT Plus)账号支持的功能还包括:海量插件 实时联网 语音对话 图片识别 文件上传 数据分析能力 绘图功能 代码解析功能 自定义指令。

三、Microsoft Copilot 测试

接下来,我们来测试一下 Microsoft Copilot(原名 Bing chat),它其实相当于免费的低配版 ChatGPT 4.0,已经把 ChatGPT 整合进了它的新 Bing 模型中。

与 ChatGPT 3.5 相比,Copilot 可以联网来提供更当前的信息并附带信息来源。另外,Copilot 由 GPT-4 驱动,是 OpenAI 的 LLM,并且可以完全免费使用。美中不足的是,一次对话中只能有五个回答,并且每个提示最多只能输入 2000 个字符。

Copilot 的精确对话风格准确回答了问题

Copilot 的用户界面不如 ChatGPT 那样直观,但它也比较易于导航,Bing Chat 可以联网,可以得到比 ChatGPT 3.5 更新的结果,但我发现它比起 ChatGPT 更容易卡顿,有时候会漏掉一些指令。

如果你喜欢有更多的视觉特性,可以选择 Copilot。

通过对平台的一系列升级,Microsoft 在 Copilot 中添加了视觉特性。当问 Copilot 问题的时候,比如我问它 "Tasmanian devil 是什么?",它给我的回复是一个信息卡片,包括照片、寿命、饮食等,这比起一大堆文字更容易让人理解。

Copilot 的回复

它还可以生成图片,你只需要给它一个指令,就可以得到四张图像。

Microsoft Copilot 可以选择不同的对话风格,包括 Creative、Balanced 和 Precise,这些风格都会影响沟通交流的对话风格。

Creative 风格的回复结果

Balanced 风格的回复结果

但是很明显,Microsoft Copilot 中的 Balanced 和 Creative 对话风格的逻辑能力更弱一些,都没有准确回答我的问题。

最后,让我们来看看谷歌的 Gemini,以前的 Bard,它使用了不同的 LLM,并在过去几个月中进行了大力升级。

如果你想要一个快速、几乎无限制的体验,你可以试试 Gemini。

现在 Gemini 相较于 Bard 有了巨大的改进。Gemini 的回答速度很快,并且可以根据深入的沟通给出更加精确的答案,它的响应速度比 ChatGPT Plus 慢,比 Copilot 要快。

Bard 的回答:

Bard 的回答

Gemini 准确地回答了问题,说明它的逻辑能力还是很不错的。

而在此之前的 Bard 版本的答案是剩下 2 个橘子,由此可见 Gemini 的更新在逻辑上的进步很大。

Gemini 没有回应数量的限制。你可以与谷歌的 Gemini 进行长时间的对话,而 Bing 和 ChatGPT 4.0 都有条数的限制。

如果你想要完整的谷歌体验,可以选择 Gemini。

谷歌还将更多的视觉元素纳入了 Gemini 平台,比目前在 Copilot 上可用的要多。用户还可以使用 Gemini 生成图像,可以通过与谷歌镜头的整合上传照片,并享受 Kayak、OpenTable、Instacart 和 Wolfram Alpha 插件。

另外,Extensions 将广泛的谷歌应用程序整合进了 Gemini,Gemini 现在正在逐渐增强完整的谷歌体验。Gemini 用户只需要在 Gemini 的对话框 @对应的谷歌工具,比如谷歌工作区、YouTube、谷歌地图、谷歌航班和谷歌酒店等,从而享受更加个性化的体验。

调用谷歌 maps

本文由 @AI 魔法学园 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

ai 谷歌 准确 艺术
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论