新浪财经 06-15
瑞典5:1狂胜突尼斯,12款大模型全部压中赛果,但仅阶跃星辰嗅到进球盛宴
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

来源:新浪财经

北京时间 6 月 15 日,2026 年世界杯 F 组首轮迎来一场焦点战,瑞典队在蒙特雷体育场以一场酣畅淋漓的 5:1 大胜,彻底击碎了突尼斯队的防线。在这场进球盛宴的背后,赛前由联想集团与咪咕视频联合推出的 " 人机大战 "AI 预测环节上演了极具戏剧性的一幕——在参与挑战的 12 款主流国产大模型中,所有模型全部精准命中了 " 瑞典胜 " 的胜负关系。然而,在具体的比分推演上,除了阶跃星辰以外,其余 11 款模型集体陷入了保守的 " 小比分陷阱 ",完美诠释了 AI 在宏观实力判断上的精准与微观进球预测上的局限。

8 场比赛过后,人机大战的数据开始呈现出可追踪的结构性特征。

第一,实力差距越大,AI 越稳定。墨西哥胜南非、美国胜巴拉圭、德国胜库拉索,AIl 命中率接近满分。大数据在确定性区间的表现,依然具有优势。

第二,均势对局中,AI 仍在寻找更好的判断方式。巴西战平摩洛哥,12 家 AI 全部未能命中;荷兰战平日本,仅中移九天一家命中;加拿大战平波黑,也只有少数模型判断正确。当两队实力接近,或者比赛存在明显临场变量时,模型之间的差异会被迅速放大。

第三,不同模型开始展现各自擅长的比赛类型。腾讯混元、Kimi、讯飞星火曾命中加拿大 1 比 1;中移九天独中荷兰平日本;百度文心精准命中科特迪瓦 1 比 0。不同模型在不同类型比赛中轮番闪光,说明各家的训练数据偏好和推理策略确实存在差异。没有 " 万能预言家 ",但 " 专项型选手 " 正在出现。

从赛前的预测数据来看,AI 模型对这场比赛的实力差距有着极其清醒的认知。无论是主打逻辑推理的 DeepSeek、通义千问和中移九天(均预测 2:0),还是更为谨慎的天禧 AI、百度文心与 Kimi(均预测 1:0),亦或是占据最大阵营的腾讯混元、智谱清言、MiniMax、讯飞星火和商汤小浣熊(均预测 2:1),它们无一例外地选择了 " 瑞典胜 "。这一现象生动地反映了当前 AI 在处理强弱对话时的底层逻辑:算法高度依赖历史数据、球队身价和防守预期,倾向于给出一个安全、中庸且符合传统强队 " 经济实惠赢球 " 刻板印象的剧本。

然而,足球比赛的魅力恰恰在于其不可预测性。当瑞典队火力全开时,绝大多数 AI 模型都低估了北欧海盗的进攻上限。在一片保守的预测海洋中,阶跃星辰成为了全场最亮眼的存在。它是 12 款模型中唯一跳出常规思维框架的大模型,大胆给出了 " 瑞典 5:2" 的超高比分预测。虽然最终的实际赛果是 5:1,但阶跃星辰不仅完美预判了瑞典队恐怖的进攻火力,更是全场唯一一个准确捕捉到 " 总进球数超过 4 个 " 这一关键趋势的模型。

本文为 " 世界杯预测人机大战 " 每日战报,由新浪财经联合联想集团、咪咕视频共同呈现。活动详情请关注咪咕视频 APP。

6 月 24 日起,联想集团与咪咕视频联合出品的《人机大战:谁是世界杯预言家》将在咪咕视频正式开播,敬请期待。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

瑞典 ai kimi 荷兰 腾讯
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论