快科技 4 月 14 日消息,最近一周国产大模型升级频繁,继 GLM-5.1、MiniMax 2.7 开源之后,月之暗面的 Kimi K2.6-code-preview 也来了,是一款专为 AI 编程优化的万亿参数大模型。
官网上表示已经上线,不过体验这个大模型需要 Kimi 的会员计划,起步 39 元每月,可以在 Kimi Code 中使用。

不过 K2.6-code-preview 大模型比较低调,之前的内测就没怎么宣传过,这两天要发布了才看到有人提,Kimi 官方也没大张旗鼓宣传,甚至目前官网上还没看到这个大模型具体升级了什么。
从网络上有人参与的内测反馈及介绍来看,K2.6-code-preview 是在 K 2.5 这个万亿参数大模型基础上改进的,主要优化依然是 AI 编程,K 2.5 的 SWE-Bench Verified 榜单评分是 76.8%,LiveCodeBench 则是 85%。
K2.6-code-preview 的提升方向主要是推理深度、代理规划质量以及多步工具调用中的可靠性,有内测人员表示思维链有 Opus 的风格(这话太有深意了)。

至于具体的水平,有大佬 Versun 搞过自己的编程能力评测,K2.6-code-preview 的评分是 89 份,比 K 2.5 的 83 分提升 6 分,不过跟前面几位的顶级选手还有些差距。
相比其他厂商在自己的宣传稿中动不动就表示追赶或者超越 Opus 4.6,目前 K2.6-code-preview 有网友评价是 Sonnet 4.6 水平,这也是很强的了。

已经用上的网友给出的评价还是不错的,指令遵循能力还行,能力也不错,现在配合 Kimi 的 Coding Plan 套餐,至少给 AI 编程提供了一个强大而且很有性价比的选择。


登录后才可以发布评论哦
打开小程序可以发布评论哦