文 | 阑夕
美加墨世界杯就要打响了,临开赛前,国产模型 Kimi 整了个大活儿:
它要一口气调用包含 300 个子 Agent 的集群,从战术、球员、伤病、赛程、历史、舆情、天气、心理、赔率变动、专家观点等多个维度并行研究 104 场世界杯比赛,并公开预测结果。基于当前的信息,Kimi 预测可能要夺冠的是:
德国。
聊这个我可就不困了,作为一个战绩可查的资深⋯⋯中国体彩消费者,我对 Kimi 敢于立 Flag 的勇气,是深感尊重的。
要知道,从盘口来看,德国的赔率(9.5)并不低,在所有球队里排在第 7 位,所以 Kimi 并没有按照最大概率——也就是最稳妥的方案——去做判断,是真有自己的想法的。
当然,即便是选夺冠热门法国、西班牙,赔率(4.5)的风险仍然很高,说白了,早在开幕前就暴论最后的冠军,本身就是一件吃力不讨好的事情。
所以我才要狠夸 Kimi 的「敞亮」,不光是冠军,Kimi 还要对全部 104 场比赛全都做出公开预测,包括赛后核验以及复盘,一场不落。
这就更硬核了,完全不怕打脸呐⋯⋯(注意,该预测非投注建议、非投资建议、非收益承诺。)
应该无须赘述吧,Kimi 这么兴师动众的「Predict In Public」,并非是为了真的去当那个洞悉神谕的预言家,作为一家注重审美和趣味大模型厂商,它是在用一种奇观的形式,向世界演示 AI 的能力边界和局限性。
· · ·
严格来说,Kimi 并没有笃信德国是最有希望夺得这届世界杯的参赛队伍,而是认为德国的市场定价在强队里过于低了。
在使用了 8 种数学模型——包括 SLO 评级、Sixon-Coles 泊松、XGBoost 机器学习、Opta 蒙特卡洛模拟等等——对 48 支球队逐一分析之后,Kimi 得出了这么一个结论:
德国的模型预测概率,和市场赔率存在最高的偏差值,达到 +3.6pp。
什么意思呢?
就是在判断德国是否有机会捧起大力神杯这件事情上,模型比市场多预测了 3.6 个百分点,所以认定德国,在理性上是回报确定性最高的选择。
就很像量化投资的策略,一家公司好不好并不重要,重要的是它有没有被市场正确定价,一家被高估的好公司,和一家被低估的差公司,显然后者更有买入潜力。
不同的是,量化机构需要雇佣一大票分析师,以及重金采购商业软件,而 Kimi 靠着几百个 Agent 昼夜不息的连轴转,自个儿就把整个项目给做完了。
如果不是亲眼所见,我是万万不敢相信的。
所有的细节,都填在了 Kimi 同时发布的预测报告里,完整版 PDF 超过 200 页,量大管饱。
我帮你们看了⋯⋯好吧,是 Kimi K2.6 帮我帮你们这份报告的重点整理了出来,非常有启发性。
报告的作者,是 Agent Swarm(集群),这不是一个人名,Kimi 把协调多个智能体开会干活的能力,做此称呼。
以及,多个智能体的意思,是上限可达 300 个。
Agent Swarm 用来搭建这次预测工程的组织架构,很有意思:
最上层,是战略组,包括总指挥、质检员和核验者,负责最开始的分配资源以及最后的验收结果;
中间层,是战术组,这个就比较丰富了,有研究赛程发展的,有归纳历史规律的,有分开算小组赛和淘汰赛的,有对黑马球队留心眼的,整个团队分工明确;
最下层,是战场组,主要清洗海量数据,比如球员的伤病、球队的特点、比赛的天气、FIFA 的排名等等;
甚至连反方的「工位」都被预留了,专门寻找反例和翻车风险,交叉对比各种冲突,直到得出大多数 Agent 都认可的结论。
是不是很有五脏俱全的味道?
特别严谨的是,Kimi 还对 2010 年 -2022 年的 4 届世界杯做了回溯演练,在只使用目标年份之前的数据训练这个前提下,用这套协作模式进行预测,然后叠加实际赛果,反思自己犯了哪些错误。
有句话真不知道当讲不当讲:硅基生命的态度,可能超过了 90% 的碳基生物⋯⋯
话说回来,预测世界杯,本质上是一门玄学,非人力所能及的不确定性太高了,也并不存在某种原理,只要算准了,就一定能够保证正确。
所以完全不能排除的画面也包括:一顿操作猛如虎,一看战绩零杠五。
但俗话说得好,过程好,结果不会差,为结果而忽视过程,结果反而好不起来。
醉翁之意不在酒,在乎山水之间也,而 Kimi 的山水之间,就是要告诉大家,Vibe Working 的时代已经到来了。
根据 Gartner 的统计口径,全球大概有 10 亿 -13 亿知识工作者,占到整个劳动力市场的 30% 左右,在发达国家甚至能够达到 40% 以上的占比。
所谓的知识工作,泛指主要通过计算机设备处理各种信息的岗位,包括但不限于写代码、做分析、出报告、设计系统等等,其中的写代码部分,我们都知道已经被 Vibe Coding 给稳稳接住了。
但毕竟编程只是其中的一个子集,在整个知识工作的范畴里,AI 的渗透受阻可以归咎于很多原因,比如不够标准化,或是交付难以验证,但在基座模型的飞速进步下,困难的保质期都不长。
大力出奇迹,一杆可清台。
Coding 依然很重要,或者说,世界是可被编码的,这本身就是 AI 得以成立的底层逻辑。
无论是图灵坚信思考是一个工程问题、而非哲学家心中的灵魂之类,还是香农在上世纪五十年代就用人类受试者去玩猜字游戏、用以论证智能始于对信息的预测,所有的历史研究和前沿走向都并轨于同一个共识:
凡事皆可压缩。
当人类知识的总和被压缩到了极致,就能制造一个通晓万物的机器出来,它能通过模拟已经存在过的和还没有发生的所有过程,去得到每一项任务的最优解。
这听起来很科幻,也足以引起事关自由意志的思辨,但我们正确切的走在这条路上,大模型的运行原理就是预测下一个词元,这是众所周知的,香农的遗憾在于他买不到英伟达的 GPU。
所以能够理解 Kimi 为什么要预测世界杯了么?
面对这种长链路、随机性、没有标准答案的复杂目标,如果 AI 也能完成媲美甚至优于人类表现的任务,那么它在通用性层面的可用,就不再存疑了。
事实上,Kimi 已经把同时调度 300 个 Agent 分工合作的能力,塞进了客户端里,在新增的 Kimi Work 模式下,模型已经实现了把数据源、浏览器、本地文件、Excel、PPT、Word 等工作环境串起来,让那 300 个 Agent 住进用户的电脑里。
而 Kimi Work 的内核,还是源自 Kimi Code 编码助手的能力,程序员继续用 Coding Agent 生成代码,而更广义的知识工作者,则可启用 Kimi Work,在桌面上指挥 AI 做调研、分析、自动化和交付物。
2010 年的世界杯,数以亿计的人类在围观一条名叫保罗的章鱼,用它黏糊糊的触手从闭合的箱子里选择比赛赢家。
16 年后,开箱的角色变成了连生物都算不上的 AI,从克苏鲁的古神符号,到后现代的赛博朋克,如此交替,本身就充满了隐喻。
隐喻那种不可言说的混沌,让渡给了可被测量的科技。
这让我想起在自己投入了无数个通宵的游戏「文明 6」里,解锁信息时代的科技之后,会出现在屏幕上的那句话外音;
「现在天上有 31 颗卫星在地球上空环绕,不为别的,就为了告诉你便利店怎么走。」
取之于硅,用之于碳,这才是 AI 正确的打开方式,对不对?


登录后才可以发布评论哦
打开小程序可以发布评论哦