AI猜中了胜负，却没猜中世界杯：12个AI、明星嘉宾、贴砖小哥同场交卷，真正赢下这场"考试"的，是足球

来源：新浪财经

一、16 强落定，AI 交卷

7 月 4 日，历时六天、十六场生死战之后，2026 年美加墨世界杯 16 强名单终于落定：加拿大、巴西、巴拉圭、摩洛哥、挪威、法国、墨西哥、英格兰、比利时、美国、西班牙、葡萄牙、瑞士、埃及、阿根廷、哥伦比亚。

这是世界杯历史上第一次出现 "1/16 决赛 "。48 支球队、104 场比赛的新赛制，把淘汰赛的闸门提前了一轮，也把偶然性放大了一轮。六天之内，东道主三国携手过关，德国与荷兰两大豪门同日被点球放逐，佛得角把卫冕冠军阿根廷拖进加时，直到最后时刻才被击倒。

球场之外，另一场比赛也在同步计分。

联想集团与咪咕视频发起的 " 世界杯预测人机大战 " 中，由联想天禧 AI 召集的 12 个中国主流大模型——联想天禧 AI、DeepSeek、通义千问、百度文心、腾讯混元、Kimi、智谱、MiniMax、阶跃星辰、讯飞星火、商汤小浣熊、中移九天——对这 16 场比赛交出了整整 192 次预测。

成绩单是这样的：胜平负方向，192 次预测命中 132 次，命中率 68.8%；精确比分，192 次预测命中 41 次，命中率 21.4%。

这不是一个低分。恰恰相反，它说明 AI 已经相当擅长判断强弱、趋势和大概率结果。但这张成绩单里最值得看的，不是 132 次命中，而是剩下的 60 次失手。

那里面，藏着足球不肯被完全计算的部分。

二、两个 0/12：算法最整齐的一次失手

这一轮 12 大 AI 预测，有两个 "0/12"。

德国对巴拉圭。12 个 AI，12 张预测卡，无一例外写着 " 德国胜 "：2：1、3：0、3：0、2：0、2：0、3：1、3：1、3：0、3：1、2：0、3：0、3：1。

这不是荒唐的判断。四届世界杯冠军，对阵南美中游球队；更深的阵容，更稳定的淘汰赛经验，更显赫的历史。按常识、按数据、按概率，这都是一道不难的题。

但比赛没有按概率走。

120 分钟 1：1，点球大战巴拉圭晋级。德国出局。12 个 AI，12 次预测，全部落空。

同一个比赛日，荷兰对摩洛哥几乎复刻了这一幕。12 个 AI 同样全部预测荷兰胜，比赛同样踢成 120 分钟 1：1，同样进入点球大战，同样是传统强队倒下。

两场比赛，24 次预测，0 次命中。

AI 不是败给了无知，而是败给了共识。它们读懂了历史，读懂了实力，也读懂了概率，却没有读到点球点前那几秒钟的迟疑、门将扑出去的一瞬间，和淘汰赛里某支球队突然相信自己可以改写命运的冲动。

所有让世界杯成为世界杯的时刻，几乎都发生在概率的边缘。

三、猜中胜负，却错过了比赛的形状

如果只讲失手，也是不公平的。

16 场比赛里，有八场 12 个 AI 全部命中方向：巴西胜日本、法国胜瑞典、英格兰胜刚果（金）、美国胜波黑、西班牙胜奥地利、葡萄牙胜克罗地亚、瑞士胜阿尔及利亚、阿根廷胜佛得角。对 " 大概率之河 " 的把握，AI 是稳定而有效的。

问题在于，足球最迷人的部分，往往不只在结局。

AI 算得出英格兰会赢刚果（金），却算不出凯恩会在第 86 分钟用一脚时速 94 公里的转身抽射完成逆转，顺手超越贝利的世界杯进球纪录；算得出加拿大是热门，却算不出欧斯塔基奥要等到第 92 分钟，才为这个国家射进队史第一个世界杯淘汰赛进球。

阿根廷对佛得角，则是最典型的样本。

赛前，12 个 AI 全部预测阿根廷胜，方向完全正确。但真实发生的比赛，不是一场轻松的大胜，而是 90 分钟 1：1、加时 3：2。阿根廷两度被追平，佛得角把卫冕冠军拖到最后时刻，直到第 111 分钟才被一次折射击穿。

AI 猜中了胜负，却错过了比赛的形状。

最终，千问和中移九天以 13/16、81.3% 的方向命中率并列领跑；MiniMax 虽然方向命中为 12/16，但精确比分命中 6 场，比分命中率达到 37.5%，在比分维度最突出；此前在 32 强预测中领跑的腾讯混元，本轮只命中 9 场，与 Kimi、讯飞星火同列后段。

预测的王座不是固定的。上一轮领先，不代表下一轮继续领先。世界杯每一轮都是新考卷，上一张卷子的高分，换不来下一场比赛的豁免。

这场实验最诚实的是，它不是为了证明某一个 AI 永远更准，而是把所有模型放到同一个赛场上，让它们一次次接受真实赛果的校验。

在一个由红牌、门柱、点球和第 92 分钟组成的世界里，任何领先都是暂时的。

四、从贴砖工到 12 个 AI：世界杯仍然不可完全计算

这个夏天至今最强的预测者，也许不是任何一个 AI。

在此前的 32 强竞猜中，一位来自重庆彭水的 29 岁家装贴砖工李先生，在超过 2500 万参与者中猜中了 31 个晋级名额。12 个 AI、解说名宿、明星嘉宾同场作答，他的成绩依然高得惊人。

这当然不能证明人类直觉一定胜过 AI。它只能说明，在世界杯这样的系统里，计算和直觉都只能接近答案，却很难完全占有答案。

从 2010 年的章鱼保罗，到今天的超级计算机和大模型，人类从来没有停止过对 " 预知比赛 " 的迷恋。只不过，过去我们把期待寄托在一只章鱼身上，现在则寄托在算法、模型和算力上。

而中国这场 " 世界杯预测人机大战 " 不是一台机器或是 AI 的独角戏，而是 12 个大模型与数千万普通用户、专业嘉宾一起交卷。AI 不再只是替人类做判断的黑箱，它坐到了人类旁边，写下自己的答案，接受同一记终场哨的裁决。

这可能才是 " 首届 AI 世界杯 " 的真正含义：不是 AI 预测世界杯，而是世界杯考验 AI。用点球，用补时，用一个 40 岁门将的十次扑救，用一支不被看好的球队突然爆发出的勇气。

16 强之后，新的对阵已经排开。12 个 AI 很快还会交出下一轮预测。它们大概率会继续保持不错的命中率，也大概率会在某个夜晚再次集体失手。屏幕前的人也一样，会继续熬夜，继续相信自己比机器更懂某支球队。

多数时候，我们错了。

偶尔，像那位重庆的贴砖工人一样，我们对得离谱。

68.8% 属于算法。剩下的 31.2%，属于点球点，属于补时，属于门柱，属于一个不肯倒下的门将。

也属于足球，属于我们熬过的每一个夜晚。

宙世代