驱动之家 昨天
月之暗面最强模型!Kimi K2.6发布:13小时不停写代码 对标GPT-5.4
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 21 日消息,日前,月之暗面发布并开源 Kimi K2.6 模型,在代码、长程任务执行和 Agent 集群能力等方面全面升级。

目前,Kimi K2.6 已上线 kimi 官网、最新版应用、API 和 Kimi Code 编程助手。

在多项权威基准测试中,Kimi K2.6 表现亮眼。

无论是高难度的人类最后的考试(Humanity's Last Exam),还是侧重真实软件工程能力的 SWE-Bench Pro,以及评估 Agent 检索能力的 DeepSearchQA,成绩均达到行业领先水平,持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。

作为 Kimi 迄今最强代码模型,Kimi K2.6 长程编码能力大幅提升。

在测试中可以不间断编码 13 小时,编写或修改超过 4000 行代码,完成复杂系统的开发和优化。

同时,通过将代码与视觉能力的深度融合,Kimi K2.6 可以交付极具设计创意的专业级 Web 应用。

在内部代码评测 Kimi Code Bench 中,K2.6 成绩较上一代 K2.5 提升约 20%。

值得一提的是,其泛化能力同样突出。

实测显示,Kimi K2.6 可在 Mac 本地部署模型,并通过 Zig 语言优化推理流程,在 4000 余次工具调用、12 小时连续运行中,将吞吐量从约 15tokens/s 提升至约 193tokens/s,最终实现比 LM Studio 快约 20% 的推理效率。

在 Agent 能力方面,Kimi K2.6 支持多 Agent 协同,可调度不同专长的 Agent 组合完成复杂任务,将搜索、深度研究、文档分析和长文生成等能力整合,整体任务质量显著提升。

同时,其 Agent 集群架构也迎来升级,最多支持 300 个子 Agent 并行运行、执行约 4000 个协作步骤,可一次性完成从文档到网页、再到 PPT 和表格的多产物端到端交付。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi 考试 编程 开源 吞吐量
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论