Kimi最强编程模型来了：Token消耗直降30%，过度思考有救了，附一手实测

智东西

作者 | 陈骏达

编辑 | 云鹏

智东西 6 月 12 日报道，今天，月之暗面发布并开源 Kimi K2.7 Code 编程模型，参数量达 1.1 万亿，提供 256K 上下文窗口。这一模型重点提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现，并且大幅改善了在长程任务中的过度思考倾向，平均 token 消耗减少 30%。

月之暗面公布的基准测试结果显示，K2.7 Code 在多项编程和 Agent 基准测试中较 K2.6 实现大幅度提升，提升比例从 10%-31.5% 不等，不过距离 GPT-5.5（xhigh）、Opus 4.8（xhigh）等模型还有一定差距。

目前，这一模型已经上线 Kimi API 开放平台（platform.kimi.com），其每百万个 token 的标准输入和输出价格与 K2.6 模型一致，分别为 6.5 元和 27 元；命中缓存的输入价格小幅度上调 0.2 元至 1.3 元。

同时，Kimi Code Plan 的默认模型已同步升级为 Kimi K2.7 Code。需要注意的是，使用 K2.7 Code 模型须打开思考模式以发挥最佳性能。Kimi API 和 Kmi Code 均默认开启思考，如果手动关闭思考模式，API 会报错，Kimi Code 会回退到 K2.6 模型。

下周一，月之暗面还在 Kimi API 开放平台推出 Kimi K2.7 Code 高速版，并逐步面向 " 抢鲜体验计划 " 成员和 Kimi 会员开放。这一模型的输出速度约为普通版的 5-6 倍，价格为 2 倍，常规编程场景下输出速度约 180 Token/s，短上下文场景可达 260 Token/s。高速版模型在 Kimi Code Plan 中的用量消耗是普通版模型的 3 倍。

K2.7 Code 上线后，智东西第一时间对其进行了初步体验，实测案例以编程类为主，测试环境为 VS Code+Kimi Code 插件。

我们的首个实测案例，是让 K2.7 Code 做一个轻量级的任务：在单个 html 文件的维度下，复刻一个 mac OS 风味的操作系统 demo。这一任务主要考察 K2.7 Code 的前端能力。

实测过程中，能明显感受到这代 Kimi 模型更加果断了：由于项目不是很复杂，它没有在思考上花太多无谓的时间，迅速进入了开发工作。由于其每次生成的耗时也较短，我可以快速迭代。

最终，K2.7 Code 打造的前端代码效果如下。可以看到，在逐步迭代后，这个 demo 的完成度不错，拥有完整的开机动画和基本功能，像是便签、浏览器都可以正常使用。

美中不足的是，我多次让 K2.7 Code 修改它生成的 SVG 开机动画图，但是最终的效果看起来还是和苹果公司的 logo 没有太大关系。

我们的下一个任务，是用 K2.7 Code 开发一个 " 智能体小镇 " 复刻版。智能体小镇其实是斯坦福大学与谷歌合作推出的一个多智能体交互实验项目，通过大语言模型驱动虚拟小镇中的智能体，模拟人类日常行为、社交互动及社会现象，探索 AI 在模拟人类行为方面的可能性。

不过，在正式开发前，我先让 K2.7 Code 写了份简易的 PRD 文档。可以看到，它的文档中既有对产品的一句话形象概述，也有对市场背景、功能架构、非功能需求和技术方案等细节的界定，能对开发工作起到指导作用。

随后，我要求 K2.7 Code 在 PRD 文档的指导下开发一个最小可行版本（MVP）。K2.7 Code one-shot 生成结果还是存在一些 bug，画面无法正常渲染，于是我让它继续改进，要求它 K2.7 Code 进一步优化这一智能体小镇的美术设计，并将其改造为一个可以本地部署的方案。

最终，在连续开发 30 多分钟后，K2.7 Code 终于交付了完整可用的项目。虽然看上去有些简陋，但基本功能都实现了，接入大模型后也可以正常和智能体对话。如果后续进行更多迭代，最终效果应该还会改进。

到项目文件夹检查后，可以看到 K2.7 Code 打造的项目文件架构清晰，分工合理。

结语：编程场景，速度同样决定体验

初步体验下来，K2.7 Code 给人一种更为果断的感受，过去那种在简单任务上反复自我质疑、长篇大论地思考，然后再动手的问题少了很多。

在生成速度方面，K2.7 Code 的优化也比较贴合当下的行业趋势。近期国内不少大模型厂商都在推高速模型，Kimi 此次也同步预告了 5 到 6 倍速的高速版。

这种提速不是偶然的，在编程这一高频交互的场景里看，速度本身就是一种关键的用户体验。

宙世代

一起剪

相关标签