快科技 4 月 21 日消息,日前,月之暗面发布并开源 Kimi K2.6 模型,在代码、长程任务执行和 Agent 集群能力等方面全面升级。
目前,Kimi K2.6 已上线 kimi 官网、最新版应用、API 和 Kimi Code 编程助手。
在多项权威基准测试中,Kimi K2.6 表现亮眼。
无论是高难度的人类最后的考试(Humanity's Last Exam),还是侧重真实软件工程能力的 SWE-Bench Pro,以及评估 Agent 检索能力的 DeepSearchQA,成绩均达到行业领先水平,持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。

作为 Kimi 迄今最强代码模型,Kimi K2.6 长程编码能力大幅提升。
在测试中可以不间断编码 13 小时,编写或修改超过 4000 行代码,完成复杂系统的开发和优化。
同时,通过将代码与视觉能力的深度融合,Kimi K2.6 可以交付极具设计创意的专业级 Web 应用。
在内部代码评测 Kimi Code Bench 中,K2.6 成绩较上一代 K2.5 提升约 20%。

值得一提的是,其泛化能力同样突出。
实测显示,Kimi K2.6 可在 Mac 本地部署模型,并通过 Zig 语言优化推理流程,在 4000 余次工具调用、12 小时连续运行中,将吞吐量从约 15tokens/s 提升至约 193tokens/s,最终实现比 LM Studio 快约 20% 的推理效率。

在 Agent 能力方面,Kimi K2.6 支持多 Agent 协同,可调度不同专长的 Agent 组合完成复杂任务,将搜索、深度研究、文档分析和长文生成等能力整合,整体任务质量显著提升。
同时,其 Agent 集群架构也迎来升级,最多支持 300 个子 Agent 并行运行、执行约 4000 个协作步骤,可一次性完成从文档到网页、再到 PPT 和表格的多产物端到端交付。



登录后才可以发布评论哦
打开小程序可以发布评论哦