新浪财经 23小时前
后厂村码农集体猜错榜首:12个AI世界杯预测准确率仅35%,人类“瞎猜”反而更准
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

" 我以为 AI 怎么也能猜对七成。"6 月 16 日,在北京后厂村联想咖啡车活动现场,一位程序员在得知 AI 实际预测成绩后这样感慨。而他的想法,代表了现场绝大多数人的心声。

6 月 12 日至 16 日,联想、咪咕、新浪财经在北京西二旗、郎园 Station 和联想集团全球总部三地开展 " 联想咖啡车城市巡游 " 活动。核心玩法是 " 世界杯预测人机大战 " —— 12 个国内主流大模型同台竞猜世界杯赛果,过往行人可随时参与 " 人机对战 ",每轮比赛结束后准确率即时刷新。16 场小组赛战罢,一份出人意料的成绩单出炉了。

AI 排行榜:百度文心领跑,DeepSeek 跌出前五

截至 6 月 16 日,12 个 AI 模型的预测成绩单如下:

百度文心以 15 场命中 7 场的成绩暂列第一,成为唯一突破四成准确率的模型。联想天禧、中移九天、腾讯混元、MiniMax 紧随其后,均命中 6 场。而备受关注的 DeepSeek 仅命中 5 场,排名第六。

码农集体 " 看走眼 ":猜谁都行,就是没猜中它

现场随机采访暴露出一个有趣的现象:绝大多数受访者未能猜中当前排名第一的模型。

当被问及 " 截止到目前准确率最高的是哪个 AI" 时,受访者的猜测集中在 DeepSeek、Kimi、千问等几个名字上。百度文心目前领先的战绩,让多数受访者感到惊讶。

准确率预期方面,偏差更为显著。  多数受访者估计 AI 整体预测准确率在 60% 至 80% 之间,部分人甚至给出 90% 的判断。工作人员告知目前实际准确率约为 35% 后,多位受访者明确表示——该数值低于自身预期。

人 vs 机器:老球迷的 " 经验 " 赢了算法

关于 " 人准还是 AI 准 " 的讨论,受访者观点不一。

有人认为:" 老球迷的经验 AI 学不来。"

也有人表示:"AI 能综合历史数据和球员状态。"

16 场比赛结束,数据给出了答案:参与预测的人类整体准确率超过 45%,略高于 AI 平均水平。

在足球这个充满爆冷、黑马和意外剧本的舞台上,普通人的直觉暂时跑赢了算法的精密计算。

最尴尬一幕:12 个 AI 集体翻车

6 月 16 日伊朗对阵新西兰的比赛,成为整场活动的 " 名场面 " —— 12 个 AI 模型均预测伊朗取胜,实际结果为 2:2 平局,12 个 AI 无一命中。

全员一致的预测方向,与完全错误的结果形成讽刺性对比。这也暴露出 AI 在应对冷门赛果时的集体盲区:当训练数据来源和算法逻辑高度同质化,一个模型 " 想错 ",其他模型也跟着 " 跑偏 "。

截至发稿,该排行榜仍在随比赛进程持续更新。这场发生在 " 中国硅谷 " 后厂村的街头实验,用实打实的数据揭开了公众对人工智能的 " 滤镜 " ——技术当然在进步,但对 AI 的过度神化,或许才是当下更该警惕的 "bug"。

下一轮,AI 能翻盘吗?还是继续被人类 " 碾压 "?答案就藏在绿茵场上。

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 联想 百度 世界杯 成绩单
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论