开源热榜第一轮流做,现在花落 Kimi。
在 Hugging Face 上,Kimi K2.5 登上了 Trending 榜首,下载量超过了 5.3 万。

Kimi K2.5 主打 Agent 能力,在 HLE-Full、BrowseComp 等测试集中,成绩超越了 GPT-5.2、Claude 4.5 Opus 以及 Gemini 3 Pro 等旗舰闭源模型。

而且极具性价比,在 BrowseComp 上达到比 GPT-5.2 更高的表现,Kimi K2.5 的资金消耗仅有不到 5%。

现在,官方的技术报告也已经亮相,Kimi K2.5 怎样练成,我们可以从中窥探一些答案。
原生多模态,15T Token 混合训练
Kimi K2.5 在 K2 的架构基础上,投入了 15T 的视觉与文本混合 Token 进行持续预训练。
它选择了一条原生多模态的技术路线,让同一套参数空间直接处理视觉信号与文本逻辑。
在 15T 这样庞大的数据量级下,视觉理解与文本推理能力实现了同步增强,一改往日 " 此消彼长 " 的局面。
这种统一的参数架构,让模型能够像理解语法结构一样,精准解析像素背后的逻辑语义。
有了这套原生底座,K2.5 解锁了 " 视觉编程 " 能力。
因为能在像素层面进行推理,它具备了从视频流直接逆向推导代码的能力。
面对一段包含复杂滚动触发特效或动态交互布局的网页演示视频,模型能够准确捕捉视觉元素随时间轴变化的规律,并将其直接映射为可执行的前端代码。
这一过程跳过了 " 视觉 - 文本 " 的中间环节,让开发需求能够以最直观的视觉形式传递给模型,实现了从设计演示到代码实现的无损转化,即便是极其复杂的动态交互逻辑也能被精准还原。

为了解决代码能跑但样式不对的问题,K2.5 还集成了自主视觉调试机制,在代码生成并渲染出界面后,模型会调用视觉感知能力对实际运行的页面进行验收。
一旦发现布局错位、样式偏差或动画异常,模型会自动触发文档查询工具,查阅相关技术文档定位问题,并对代码进行修正。
这种 " 生成 - 观察 - 查阅 - 修复 " 的自动化闭环,模拟了高级工程师的调试流程,让模型具备了独立完成端到端软件工程任务的可靠性。
超大规模 " 智能体集群 "
为了能更好地解决复杂任务,Kimi K2.5 还搭载了 Agent Swarm 架构。
这是一套能自主构建百人规模数字化团队的并行系统,让模型获得了 " 分身 " 能力,可以瞬间创建并编排多达 100 个子智能体,并支持调用 1500 个工具的并行工作流。
这种机制将全网深度搜索或海量数据分析等复杂任务,拆解为无数个同步进行的子任务,利用集群算力大幅压缩了处理时间。

指挥这支庞大团队运转的是 PARL(并行智能体强化学习)框架。
该框架建立了一套严密的指挥体系,由核心的调度器和众多子智能体构成。
调度器如同指挥官,负责宏观层面的任务拆解与分发;子智能体则作为执行层,在参数冻结的状态下专注于高效完成具体指令。
这种动静结合的设计,既赋予了系统灵活规划的能力,又保障了大规模并行操作的逻辑严密性。

为了让模型学会高效分工,训练过程采用了一套阶段性奖励塑造策略。
系统在初期会优先激励调度器进行并行化探索,培养其 " 多管齐下 " 的直觉;随着训练深入,奖励重心平滑过渡至任务的最终成功率。
这种循序渐进的训练方式,让模型建立了在保证结果准确的前提下,最大化利用并发优势的思维习惯。
在效率评估上,系统引入了临界步骤作为核心指标,基于并行计算的关键路径原理,聚焦于调度开销与最慢子智能体的耗时。
这种机制倒逼模型在决策时,必须优先考虑如何缩短端到端的实际等待时间。只有在能切实提升响应速度的情况下,系统才会增加并行度,从而在极致速度与计算资源消耗之间找到了最佳平衡。
杨植麟剧透 Kimi K3
K2.5 上线后不久,月之暗面的三位创始人——杨植麟、周昕宇和吴育昕现身 Reddit,来了一场长达 3 小时的 AMA 问答。
面对全球开发者和的提问,他们直接把代码背后的思考、未来的剧透甚至尴尬的 Bug 都摊开来聊了个透。
对于大家最关心的下一代 Kimi K3,团队给出了一个相当硬核的预告——它很可能基于线性注意力机制。
杨植麟更是直言,虽然不敢打包票,但 K3 相比 K2.5 哪怕没有 10 倍的提升,也绝对会有质的飞跃。

针对 K2.5 偶尔会自称 Claude 的趣闻,团队也给出了坦诚的解释——
这是因为 Kimi" 吃 " 了太多高质量的编程训练数据,而这些数据里充斥着 Claude 的名字 。这就像读了太多某位作家的书,说话难免带上对方的口头禅。

此外他们也对算力焦虑问题进行了回应,算法负责人周昕宇抛出了一句 " 创新往往诞生于约束之中(Innovation loves constraints)" 。

在他们看来,堆砌算力不是通往 AGI 的唯一路径,在有限的资源下逼出更高效的算法、更聪明的架构,才是这家实验室真正的 " 登月 " 野心 。
报告地址:
https://www.kimi.com/blog/kimi-k2-5.html
AMA:
https://www.reddit.com/r/LocalLLaMA/comments/1qpewj7/ama_with_kimi_the_opensource_frontier_lab_behind/
— 欢迎 AI 产品从业者共建 —
「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。
一键关注 点亮星标
科技前沿进展每日见


登录后才可以发布评论哦
打开小程序可以发布评论哦