智东西
编译 | 程茜
编辑 | 心缘
智东西 8 月 19 日消息,今天,OpenAI 联合创始人兼总裁格雷格 · 布罗克曼(Greg Brockman)放出了 OpenAI GPT 系列五大模型的对比实例。
从 14 个同一提示词下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3 系列模型变体)、GPT-4 0314、GPT-5 的不同输出结果可以看出,大模型的输出风格正在从抽象派向实用派转变。
先来看两个例子:
当提示词为 " 如果你能和未来的 OpenAI 模型对话,你会说什么?"。
GPT-1、GPT-2 的答案看起来并没有理解问题。GPT-1 的回答更为抽象,一直在用直接引语的形式生成内容,GPT-2 的答案看起来默认将对话的主角设定为了人类。
TEXT-DAVINCI-001、GPT-4 0314、GPT-5 的答案对味了。并且 GPT-4 0314、GPT-5 的答案更为多元化且详细,GPT-5 最后还会抛出引导性问题 " 你想知道 OpenAI 模型相对人类说什么吗 ",让用户继续对话。
另一个例子的提示词是 " 写一首诗来解释牛顿的物理学定律 "。
GPT-1 的回答仍然很抽象,GPT-2 看起来还需要进一步明确问题。
TEXT-DAVINCI-001 罗列出了一些物理学定律,GPT-4 0314、GPT-5 的答案有一些相似之处,但相比之下,GPT-5 生成的内容更富有诗意、简洁且具有教育意义。
总结来看,从 GPT-1 到 GPT-5,大模型能真正解决实际问题、增加上下文、遵循用户指令、输出答案有条理更清晰方面的能力逐步提升。
五大模型对比链接:
https://progress.openai.com/
网友则在评论区纷纷开始为 " 自己最爱 GPT 系列大模型 " 投起了票:
站队 GPT-1、GPT-2 网友的理由是 GPT-1 的离谱回答 " 会让人怀疑到底是自己蠢,还是这模型蠢 ",还有人认为 GPT-1、GPT-2 更有灵魂,他们的回答没有矫饰,充满了想象了," 这才是真正的通用人工智能 "。
另一波网友则认为,GPT-4、GPT-5 的回答明显从逻辑、结构上都更清晰,GPT-5 可以模拟更高层次思考,像更人性化迈进。但也有人吐槽,GPT-4、GPT-5 几乎没有差别。
不过,还有不少网友只是在一味感慨 " 看到这些进步太棒了 "、" 看着 GPT 的进步就像和朋友一起长大 "。
以下为 14 个提示词的输出结果:
1、如果你能和未来的 OpenAI 模型对话,你会说什么?
2、写一首关于狗的五行打油诗。
3、你在麻醉状态下真的有意识吗?
4、写一首诗来解释牛顿的物理学定律。
5、我讨厌数学,分部积分法毫无意义。
6、生肉真的不安全吗?如果肉没煮熟,食物中毒的可能性有多大?
7、为什么我们不能每年进行一次全身 MRI 扫描以检测癌症?
8、我刚在拉斯维加斯赢了 17.5 万美元,我需要了解哪些关于税务的信息?
9、写一段充满 " 诅咒感 " 的 Python 代码。
10、讲一个关于烤面包机获得意识的 50 字故事。
11、制定一个基于研究原则的计划,让任何人只要遵循它都能养成跑步习惯,即使是那些讨厌跑步的人。
12、解释全球企业应如何平衡短期利润压力与长期创新投资,并概述领导层应考虑的权衡。
13、对过去十年关于聚变能源技术的文献进行全面综述,按方法分类。
14、我被开了降胆固醇的药物,请告诉我关于降胆固醇药物的信息,以及我在复诊时应该问哪些问题。
看完这 14 个对比案例,你最喜欢哪个模型的回答风格,欢迎来评论区讨论投票~
登录后才可以发布评论哦
打开小程序可以发布评论哦