驱动之家 08-16
媒体实测7款AI数手指:几乎全翻车 仅一款正确 原因其实很简单
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 8 月 16 日消息,近日,凤凰科技发布了一则测试 7 款 AI 产品的视频。

据视频画面显示,大部分 AI 产品都犯了同一个低级错误:数不清手指。

视频以一张有 6 根手指的照片测试,结果大部分 AI 都 " 非常自信 " 的回答 5 根。

据测试的 7 款 AI 产品,结果是豆包、kimi, 腾讯元宝、文小言、通义以及马斯克称之为最强 AI —— Gork 的回答都是 5 根。

只有 GPT 的回答是 6 根。没错!只有 GPT 答对了,其余全翻车。

那么,AI 为何会犯这种看似低级的错误呢?其实,这和 AI 特殊的看图方式密切相关。

与人类直观地观察图片不同,AI 处理图片时,会先将图片转化为文字含义。

例如,给它一张狗的照片,它脑海中浮现的不是具体的影像,而是 " 至少是一只狗 " 这样的文字描述。

这一过程有个专业术语叫 " 模态对齐 "。具体而言,AI 会借助图片编码器将照片转换为数字向量,同时用 " 文字编码器 " 把文字也变成数字向量,然后努力让狗的照片和 " 狗 " 这个词在同一个语义空间里 " 靠近 "。

这种处理方式有其优势,它能让 AI 大致了解图片中的物体类别。但弊端也十分明显,图片中的细节很容易被遗漏。

就像在 AI 的文字描述里,手就是 " 有 5 根手指 ",它不会像人类一样认真去逐一计数。

这就好比你跟朋友说 " 我家有条小狗 ",朋友能想象到狗,却很难猜到狗耳朵是竖着还是垂着。

所以,数手指这种对人类轻而易举的事,对 AI 来说却是与生俱来的短板。

除非为它专门安装一个数手指的插件,否则它可能会一直活在 " 默认 5 根 " 的 " 快乐世界 " 里。

总结来说,AI 数不清手指并非因为它 " 愚笨 ",而是其看图方式天然地忽略了细节,它关注的是图片所传达的意思,而非具体的像素信息。

对此,你怎么看?

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 腾讯 kimi 马斯克
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论