300个AI「算」出了这届世界杯的冠军

文｜阑夕

美加墨世界杯就要打响了，临开赛前，国产模型 Kimi 整了个大活儿：

它要一口气调用包含 300 个子 Agent 的集群，从战术、球员、伤病、赛程、历史、舆情、天气、心理、赔率变动、专家观点等多个维度并行研究 104 场世界杯比赛，并公开预测结果。基于当前的信息，Kimi 预测可能要夺冠的是：

德国。

聊这个我可就不困了，作为一个战绩可查的资深⋯⋯中国体彩消费者，我对 Kimi 敢于立 Flag 的勇气，是深感尊重的。

要知道，从盘口来看，德国的赔率（9.5）并不低，在所有球队里排在第 7 位，所以 Kimi 并没有按照最大概率——也就是最稳妥的方案——去做判断，是真有自己的想法的。

当然，即便是选夺冠热门法国、西班牙，赔率（4.5）的风险仍然很高，说白了，早在开幕前就暴论最后的冠军，本身就是一件吃力不讨好的事情。

所以我才要狠夸 Kimi 的「敞亮」，不光是冠军，Kimi 还要对全部 104 场比赛全都做出公开预测，包括赛后核验以及复盘，一场不落。

这就更硬核了，完全不怕打脸呐⋯⋯（注意，该预测非投注建议、非投资建议、非收益承诺。）

应该无须赘述吧，Kimi 这么兴师动众的「Predict In Public」，并非是为了真的去当那个洞悉神谕的预言家，作为一家注重审美和趣味大模型厂商，它是在用一种奇观的形式，向世界演示 AI 的能力边界和局限性。

· · ·

严格来说，Kimi 并没有笃信德国是最有希望夺得这届世界杯的参赛队伍，而是认为德国的市场定价在强队里过于低了。

在使用了 8 种数学模型——包括 SLO 评级、Sixon-Coles 泊松、XGBoost 机器学习、Opta 蒙特卡洛模拟等等——对 48 支球队逐一分析之后，Kimi 得出了这么一个结论：

德国的模型预测概率，和市场赔率存在最高的偏差值，达到 +3.6pp。

什么意思呢？

就是在判断德国是否有机会捧起大力神杯这件事情上，模型比市场多预测了 3.6 个百分点，所以认定德国，在理性上是回报确定性最高的选择。

就很像量化投资的策略，一家公司好不好并不重要，重要的是它有没有被市场正确定价，一家被高估的好公司，和一家被低估的差公司，显然后者更有买入潜力。

不同的是，量化机构需要雇佣一大票分析师，以及重金采购商业软件，而 Kimi 靠着几百个 Agent 昼夜不息的连轴转，自个儿就把整个项目给做完了。

如果不是亲眼所见，我是万万不敢相信的。

所有的细节，都填在了 Kimi 同时发布的预测报告里，完整版 PDF 超过 200 页，量大管饱。

我帮你们看了⋯⋯好吧，是 Kimi K2.6 帮我帮你们这份报告的重点整理了出来，非常有启发性。

报告的作者，是 Agent Swarm（集群），这不是一个人名，Kimi 把协调多个智能体开会干活的能力，做此称呼。

以及，多个智能体的意思，是上限可达 300 个。

Agent Swarm 用来搭建这次预测工程的组织架构，很有意思：

最上层，是战略组，包括总指挥、质检员和核验者，负责最开始的分配资源以及最后的验收结果；

中间层，是战术组，这个就比较丰富了，有研究赛程发展的，有归纳历史规律的，有分开算小组赛和淘汰赛的，有对黑马球队留心眼的，整个团队分工明确；

最下层，是战场组，主要清洗海量数据，比如球员的伤病、球队的特点、比赛的天气、FIFA 的排名等等；

甚至连反方的「工位」都被预留了，专门寻找反例和翻车风险，交叉对比各种冲突，直到得出大多数 Agent 都认可的结论。

是不是很有五脏俱全的味道？

特别严谨的是，Kimi 还对 2010 年 -2022 年的 4 届世界杯做了回溯演练，在只使用目标年份之前的数据训练这个前提下，用这套协作模式进行预测，然后叠加实际赛果，反思自己犯了哪些错误。

有句话真不知道当讲不当讲：硅基生命的态度，可能超过了 90% 的碳基生物⋯⋯

话说回来，预测世界杯，本质上是一门玄学，非人力所能及的不确定性太高了，也并不存在某种原理，只要算准了，就一定能够保证正确。

所以完全不能排除的画面也包括：一顿操作猛如虎，一看战绩零杠五。

但俗话说得好，过程好，结果不会差，为结果而忽视过程，结果反而好不起来。

醉翁之意不在酒，在乎山水之间也，而 Kimi 的山水之间，就是要告诉大家，Vibe Working 的时代已经到来了。

根据 Gartner 的统计口径，全球大概有 10 亿 -13 亿知识工作者，占到整个劳动力市场的 30% 左右，在发达国家甚至能够达到 40% 以上的占比。

所谓的知识工作，泛指主要通过计算机设备处理各种信息的岗位，包括但不限于写代码、做分析、出报告、设计系统等等，其中的写代码部分，我们都知道已经被 Vibe Coding 给稳稳接住了。

但毕竟编程只是其中的一个子集，在整个知识工作的范畴里，AI 的渗透受阻可以归咎于很多原因，比如不够标准化，或是交付难以验证，但在基座模型的飞速进步下，困难的保质期都不长。

大力出奇迹，一杆可清台。

Coding 依然很重要，或者说，世界是可被编码的，这本身就是 AI 得以成立的底层逻辑。

无论是图灵坚信思考是一个工程问题、而非哲学家心中的灵魂之类，还是香农在上世纪五十年代就用人类受试者去玩猜字游戏、用以论证智能始于对信息的预测，所有的历史研究和前沿走向都并轨于同一个共识：

凡事皆可压缩。

当人类知识的总和被压缩到了极致，就能制造一个通晓万物的机器出来，它能通过模拟已经存在过的和还没有发生的所有过程，去得到每一项任务的最优解。

这听起来很科幻，也足以引起事关自由意志的思辨，但我们正确切的走在这条路上，大模型的运行原理就是预测下一个词元，这是众所周知的，香农的遗憾在于他买不到英伟达的 GPU。

所以能够理解 Kimi 为什么要预测世界杯了么？

面对这种长链路、随机性、没有标准答案的复杂目标，如果 AI 也能完成媲美甚至优于人类表现的任务，那么它在通用性层面的可用，就不再存疑了。

事实上，Kimi 已经把同时调度 300 个 Agent 分工合作的能力，塞进了客户端里，在新增的 Kimi Work 模式下，模型已经实现了把数据源、浏览器、本地文件、Excel、PPT、Word 等工作环境串起来，让那 300 个 Agent 住进用户的电脑里。

而 Kimi Work 的内核，还是源自 Kimi Code 编码助手的能力，程序员继续用 Coding Agent 生成代码，而更广义的知识工作者，则可启用 Kimi Work，在桌面上指挥 AI 做调研、分析、自动化和交付物。

2010 年的世界杯，数以亿计的人类在围观一条名叫保罗的章鱼，用它黏糊糊的触手从闭合的箱子里选择比赛赢家。

16 年后，开箱的角色变成了连生物都算不上的 AI，从克苏鲁的古神符号，到后现代的赛博朋克，如此交替，本身就充满了隐喻。

隐喻那种不可言说的混沌，让渡给了可被测量的科技。

这让我想起在自己投入了无数个通宵的游戏「文明 6」里，解锁信息时代的科技之后，会出现在屏幕上的那句话外音；

「现在天上有 31 颗卫星在地球上空环绕，不为别的，就为了告诉你便利店怎么走。」

取之于硅，用之于碳，这才是 AI 正确的打开方式，对不对？

宙世代

一起剪

相关标签