后厂村码农集体猜错榜首：12个AI世界杯预测准确率仅35%，人类“瞎猜”反而更准

炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

" 我以为 AI 怎么也能猜对七成。"6 月 16 日，在北京后厂村联想咖啡车活动现场，一位程序员在得知 AI 实际预测成绩后这样感慨。而他的想法，代表了现场绝大多数人的心声。

6 月 12 日至 16 日，联想、咪咕、新浪财经在北京西二旗、郎园 Station 和联想集团全球总部三地开展 " 联想咖啡车城市巡游 " 活动。核心玩法是 " 世界杯预测人机大战 " —— 12 个国内主流大模型同台竞猜世界杯赛果，过往行人可随时参与 " 人机对战 "，每轮比赛结束后准确率即时刷新。16 场小组赛战罢，一份出人意料的成绩单出炉了。

AI 排行榜：百度文心领跑，DeepSeek 跌出前五

截至 6 月 16 日，12 个 AI 模型的预测成绩单如下：

百度文心以 15 场命中 7 场的成绩暂列第一，成为唯一突破四成准确率的模型。联想天禧、中移九天、腾讯混元、MiniMax 紧随其后，均命中 6 场。而备受关注的 DeepSeek 仅命中 5 场，排名第六。

码农集体 " 看走眼 "：猜谁都行，就是没猜中它

现场随机采访暴露出一个有趣的现象：绝大多数受访者未能猜中当前排名第一的模型。

当被问及 " 截止到目前准确率最高的是哪个 AI" 时，受访者的猜测集中在 DeepSeek、Kimi、千问等几个名字上。百度文心目前领先的战绩，让多数受访者感到惊讶。

准确率预期方面，偏差更为显著。多数受访者估计 AI 整体预测准确率在 60% 至 80% 之间，部分人甚至给出 90% 的判断。工作人员告知目前实际准确率约为 35% 后，多位受访者明确表示——该数值低于自身预期。

人 vs 机器：老球迷的 " 经验 " 赢了算法

关于 " 人准还是 AI 准 " 的讨论，受访者观点不一。

有人认为：" 老球迷的经验 AI 学不来。"

也有人表示："AI 能综合历史数据和球员状态。"

16 场比赛结束，数据给出了答案：参与预测的人类整体准确率超过 45%，略高于 AI 平均水平。

在足球这个充满爆冷、黑马和意外剧本的舞台上，普通人的直觉暂时跑赢了算法的精密计算。

最尴尬一幕：12 个 AI 集体翻车

6 月 16 日伊朗对阵新西兰的比赛，成为整场活动的 " 名场面 " —— 12 个 AI 模型均预测伊朗取胜，实际结果为 2：2 平局，12 个 AI 无一命中。

全员一致的预测方向，与完全错误的结果形成讽刺性对比。这也暴露出 AI 在应对冷门赛果时的集体盲区：当训练数据来源和算法逻辑高度同质化，一个模型 " 想错 "，其他模型也跟着 " 跑偏 "。

截至发稿，该排行榜仍在随比赛进程持续更新。这场发生在 " 中国硅谷 " 后厂村的街头实验，用实打实的数据揭开了公众对人工智能的 " 滤镜 " ——技术当然在进步，但对 AI 的过度神化，或许才是当下更该警惕的 "bug"。

下一轮，AI 能翻盘吗？还是继续被人类 " 碾压 "？答案就藏在绿茵场上。

新浪声明：新浪网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

宙世代

一起剪

相关标签