月之暗面最强模型！Kimi K2.6发布：13小时不停写代码对标GPT-5.4

快科技 4 月 21 日消息，日前，月之暗面发布并开源 Kimi K2.6 模型，在代码、长程任务执行和 Agent 集群能力等方面全面升级。

目前，Kimi K2.6 已上线 kimi 官网、最新版应用、API 和 Kimi Code 编程助手。

在多项权威基准测试中，Kimi K2.6 表现亮眼。

无论是高难度的人类最后的考试（Humanity's Last Exam），还是侧重真实软件工程能力的 SWE-Bench Pro，以及评估 Agent 检索能力的 DeepSearchQA，成绩均达到行业领先水平，持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。

作为 Kimi 迄今最强代码模型，Kimi K2.6 长程编码能力大幅提升。

在测试中可以不间断编码 13 小时，编写或修改超过 4000 行代码，完成复杂系统的开发和优化。

同时，通过将代码与视觉能力的深度融合，Kimi K2.6 可以交付极具设计创意的专业级 Web 应用。

在内部代码评测 Kimi Code Bench 中，K2.6 成绩较上一代 K2.5 提升约 20%。

值得一提的是，其泛化能力同样突出。

实测显示，Kimi K2.6 可在 Mac 本地部署模型，并通过 Zig 语言优化推理流程，在 4000 余次工具调用、12 小时连续运行中，将吞吐量从约 15tokens/s 提升至约 193tokens/s，最终实现比 LM Studio 快约 20% 的推理效率。

在 Agent 能力方面，Kimi K2.6 支持多 Agent 协同，可调度不同专长的 Agent 组合完成复杂任务，将搜索、深度研究、文档分析和长文生成等能力整合，整体任务质量显著提升。

同时，其 Agent 集群架构也迎来升级，最多支持 300 个子 Agent 并行运行、执行约 4000 个协作步骤，可一次性完成从文档到网页、再到 PPT 和表格的多产物端到端交付。

宙世代

一起剪

相关标签