新浪财经 5小时前
AI猜中了胜负,却没猜中世界杯:12个AI、明星嘉宾、贴砖小哥同场交卷,真正赢下这场"考试"的,是足球
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_tiyu1.html

 

来源:新浪财经

一、16 强落定,AI 交卷

7 月 4 日,历时六天、十六场生死战之后,2026 年美加墨世界杯 16 强名单终于落定:加拿大、巴西、巴拉圭、摩洛哥、挪威、法国、墨西哥、英格兰、比利时、美国、西班牙、葡萄牙、瑞士、埃及、阿根廷、哥伦比亚。

这是世界杯历史上第一次出现 "1/16 决赛 "。48 支球队、104 场比赛的新赛制,把淘汰赛的闸门提前了一轮,也把偶然性放大了一轮。六天之内,东道主三国携手过关,德国与荷兰两大豪门同日被点球放逐,佛得角把卫冕冠军阿根廷拖进加时,直到最后时刻才被击倒。

球场之外,另一场比赛也在同步计分。

联想集团与咪咕视频发起的 " 世界杯预测人机大战 " 中,由联想天禧 AI 召集的 12 个中国主流大模型——联想天禧 AI、DeepSeek、通义千问、百度文心、腾讯混元、Kimi、智谱、MiniMax、阶跃星辰、讯飞星火、商汤小浣熊、中移九天——对这 16 场比赛交出了整整 192 次预测。

成绩单是这样的:胜平负方向,192 次预测命中 132 次,命中率 68.8%;精确比分,192 次预测命中 41 次,命中率 21.4%。

这不是一个低分。恰恰相反,它说明 AI 已经相当擅长判断强弱、趋势和大概率结果。但这张成绩单里最值得看的,不是 132 次命中,而是剩下的 60 次失手。

那里面,藏着足球不肯被完全计算的部分。

二、两个 0/12:算法最整齐的一次失手

这一轮 12 大 AI 预测,有两个 "0/12"。

德国对巴拉圭。12 个 AI,12 张预测卡,无一例外写着 " 德国胜 ":2:1、3:0、3:0、2:0、2:0、3:1、3:1、3:0、3:1、2:0、3:0、3:1。

这不是荒唐的判断。四届世界杯冠军,对阵南美中游球队;更深的阵容,更稳定的淘汰赛经验,更显赫的历史。按常识、按数据、按概率,这都是一道不难的题。

但比赛没有按概率走。

120 分钟 1:1,点球大战巴拉圭晋级。德国出局。12 个 AI,12 次预测,全部落空。

同一个比赛日,荷兰对摩洛哥几乎复刻了这一幕。12 个 AI 同样全部预测荷兰胜,比赛同样踢成 120 分钟 1:1,同样进入点球大战,同样是传统强队倒下。

两场比赛,24 次预测,0 次命中。

AI 不是败给了无知,而是败给了共识。它们读懂了历史,读懂了实力,也读懂了概率,却没有读到点球点前那几秒钟的迟疑、门将扑出去的一瞬间,和淘汰赛里某支球队突然相信自己可以改写命运的冲动。

所有让世界杯成为世界杯的时刻,几乎都发生在概率的边缘。

三、猜中胜负,却错过了比赛的形状

如果只讲失手,也是不公平的。

16 场比赛里,有八场 12 个 AI 全部命中方向:巴西胜日本、法国胜瑞典、英格兰胜刚果(金)、美国胜波黑、西班牙胜奥地利、葡萄牙胜克罗地亚、瑞士胜阿尔及利亚、阿根廷胜佛得角。对 " 大概率之河 " 的把握,AI 是稳定而有效的。

问题在于,足球最迷人的部分,往往不只在结局。

AI 算得出英格兰会赢刚果(金),却算不出凯恩会在第 86 分钟用一脚时速 94 公里的转身抽射完成逆转,顺手超越贝利的世界杯进球纪录;算得出加拿大是热门,却算不出欧斯塔基奥要等到第 92 分钟,才为这个国家射进队史第一个世界杯淘汰赛进球。

阿根廷对佛得角,则是最典型的样本。

赛前,12 个 AI 全部预测阿根廷胜,方向完全正确。但真实发生的比赛,不是一场轻松的大胜,而是 90 分钟 1:1、加时 3:2。阿根廷两度被追平,佛得角把卫冕冠军拖到最后时刻,直到第 111 分钟才被一次折射击穿。

AI 猜中了胜负,却错过了比赛的形状。

最终,千问和中移九天以 13/16、81.3% 的方向命中率并列领跑;MiniMax 虽然方向命中为 12/16,但精确比分命中 6 场,比分命中率达到 37.5%,在比分维度最突出;此前在 32 强预测中领跑的腾讯混元,本轮只命中 9 场,与 Kimi、讯飞星火同列后段。

预测的王座不是固定的。上一轮领先,不代表下一轮继续领先。世界杯每一轮都是新考卷,上一张卷子的高分,换不来下一场比赛的豁免。

这场实验最诚实的是,它不是为了证明某一个 AI 永远更准,而是把所有模型放到同一个赛场上,让它们一次次接受真实赛果的校验。

在一个由红牌、门柱、点球和第 92 分钟组成的世界里,任何领先都是暂时的。

四、从贴砖工到 12 个 AI:世界杯仍然不可完全计算

这个夏天至今最强的预测者,也许不是任何一个 AI。

在此前的 32 强竞猜中,一位来自重庆彭水的 29 岁家装贴砖工李先生,在超过 2500 万参与者中猜中了 31 个晋级名额。12 个 AI、解说名宿、明星嘉宾同场作答,他的成绩依然高得惊人。

这当然不能证明人类直觉一定胜过 AI。它只能说明,在世界杯这样的系统里,计算和直觉都只能接近答案,却很难完全占有答案。

从 2010 年的章鱼保罗,到今天的超级计算机和大模型,人类从来没有停止过对 " 预知比赛 " 的迷恋。只不过,过去我们把期待寄托在一只章鱼身上,现在则寄托在算法、模型和算力上。

而中国这场 " 世界杯预测人机大战 " 不是一台机器或是 AI 的独角戏,而是 12 个大模型与数千万普通用户、专业嘉宾一起交卷。AI 不再只是替人类做判断的黑箱,它坐到了人类旁边,写下自己的答案,接受同一记终场哨的裁决。

这可能才是 " 首届 AI 世界杯 " 的真正含义:不是 AI 预测世界杯,而是世界杯考验 AI。用点球,用补时,用一个 40 岁门将的十次扑救,用一支不被看好的球队突然爆发出的勇气。

16 强之后,新的对阵已经排开。12 个 AI 很快还会交出下一轮预测。它们大概率会继续保持不错的命中率,也大概率会在某个夜晚再次集体失手。屏幕前的人也一样,会继续熬夜,继续相信自己比机器更懂某支球队。

多数时候,我们错了。

偶尔,像那位重庆的贴砖工人一样,我们对得离谱。

68.8% 属于算法。剩下的 31.2%,属于点球点,属于补时,属于门柱,属于一个不肯倒下的门将。

也属于足球,属于我们熬过的每一个夜晚。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 世界杯 联想 德国 荷兰
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论