IT之家 7小时前
GPT-5.2生成字母挂图错误频出,“人类专家水平”遭质疑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 12 月 20 日消息,12 月 11 日,OpenAI 发布了 ChatGPT-5.2,并照例将这次更新描述为一次 " 通用智能的重大提升 ",称其是目前最适合现实世界专业使用的模型,甚至表示这是首个在表现上达到或超过人类专家水平的版本。

当地时间 12 月 18 日,据外媒 Futurism 报道,在一个极其基础的测试中,上述说法很快受到了质疑。在实测为小学生生成一张按英文字母顺序排列的动物挂图时,结果漏洞百出。

这一问题最早由 BCA Research 首席全球策略师彼得・贝雷津发现。他在 11 月发布的 ChatGPT-5.1 上提出同样的指令,模型思考了数秒后生成的内容却只包含 25 个字母,而标准英文字母表应为 26 个。

贝雷津对此调侃称:" 看来还需要更多资本支出 ",影射 OpenAI 已承诺在 2025 年投入 1.15 万亿美元(IT 之家注:现汇率约合 8.11 万亿元人民币)用于硬件。

在测试 ChatGPT-5.2 时,问题依然存在。个别字母对应的动物有所改善,但模型仍只覆盖了 24 个字母,遗漏了 "U" 和 "Z",并在 "T" 之后直接跳到 "Y",对应 "Yak"。生成的字母表最终以 "X" 结束,对应 "X-ray fish",插图却是一只斑马

插图本身也存在明显异常,例如肢体结构怪异的袋鼠、长着两条尾巴的鬣蜥、五官混乱的独角鲸,以及带有猫脸特征的刺猬

在后续提示中,情况并未改善。这一次模型生成了 25 个字母,"Y" 再次取代了 "U",并被解释为 "Unicorn"。结尾处出现两个 "X",一个对应 "fish",另一个对应 "X-ray fish",却仍旧使用了一张斑马插图。

此外,模型还开始将提示语本身混入生成内容,"A is for alligator, B is for bear … " 直接出现在海报标题中。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

it之家 汇率
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论