
智东西
作者 | 云鹏
编辑 | 李水青
智东西 11 月 6 日消息,刚刚,月之暗面正式发布了 Kimi-k2 thinking 模型,其为具有通用 Agentic 能力和推理能力的思考模型,擅长深度推理,可以通过多轮工具调用,解决各类复杂的难题。

月之暗面官方发布页面
Kimi K2 首次发布是在 7 月 11 日,该模型总参数 10000 亿,激活参数 320 亿。Kimi K2-0905 于 9 月 5 日发布,其核心升级了 Agentic Coding 能力、支持 256K 上下文、API 支持 60-100Token/s 的输出速度、支持 Claude Code。
价格方面,kimi-k2-thinking 每百万 tokens 的输入价格(缓存未命中)为 4 元、输出价格为 16 元;" 高速版 "kimi-k2-thinking-turbo 每百万 tokens 的输入价格(缓存未命中)为 8 元、输出价格为 58 元,适用于需要深度推理和追求极致高速的场景。

Kimi K2 系列模型价格
在实际体验环节,我们主要测试了 Kimi-k2 thinking 在编程、数学和逻辑推理能力三个方面的表现。
在编程方面,我们令其生成一个开源模型分享网站的 HTML 网页原型,包括顶部导航栏、主体展示区、设计风格要求,还要求其构思两个特色功能。
从生成结果来看,我们对网页主要部分提出的要求都可以很好地被执行,包括导航栏有哪些部分、主题展示区由哪些模块组成,简洁现代的设计风格也有较好体现,一键复现、模型对比这两个特色功能也做了出来。

网页编程
整体网页的完成度是比较高的,并且不论是搜索框、按钮、筛选标签都是可以实际选中交互操作的,点击后会有对应的提示,比如点击上传模型,会提示需要准备的问题件、文件大小限制等信息。

网页按钮功能说明
生成网页项目的 tokens 总计消耗为 9K,大约花费了 3 分钟左右的时间。不过在尝试多次生成结果时,偶尔会遇到崩溃状况。

在数学能力方面,今年国际数学奥林匹克竞赛(IMO)第六题被认为最具挑战性:

Kimi-k2 thinking 在解题过程中,思考过程有 21188 字,经过 4 分钟左右时间,给出了错误答案 4048 块,正确答案为 2112 块。

Kimi-k2 thinking 解答 2025 IMO 数学竞赛题第六题
这一过程总共消耗了 23.5K 的 tokens。
在切换为高速版 kimi-k2-thinking-turbo 后,模型仍然给出了同样的 4048 错误答案,花费时间明显缩短至 2 分钟左右,但 tokens 消耗数却提升至 38.5K。

Kimi-k2 thinking-turbo 解答 2025 IMO 数学竞赛题第六题
对于另一道 IMO 数学竞赛题,Kimi-k2 thinking 在经历了 10 多分钟的深度思考后,最终停止了思考,思考过程 47684 字,但并未给出答案。再次尝试后,思考过程同样卡住在了 47940 字上,未能给出答案。

Kimi-k2 thinking 解答 2025 IMO 数学竞赛题第四题
由于 Kimi-k2 thinking 不支持图片输入自动识别公式,因此一些复杂的数学题目很难输入。
在常识逻辑推理方面,对于一般的问题,Kimi-k2 thinking 可以很快给出答案,并且可以轻松绕开逻辑陷阱。

Kimi-k2 thinking 解答逻辑推理问题
对于更进一步的逻辑推理考察题目,Kimi-k2 thinking 也可以在 1 分钟左右的时间内给出答案,准确率较高,消耗 tokens 为 16.6K。

Kimi-k2 thinking 解答逻辑推理问题
结语:" 思考 " 模型之战愈发焦灼
11 月 4 日,阿里刚刚发布了 Qwen 3 系列中最强推理模型 Qwen3-Max-Thinking 早期预览版,Kimi 今天就发布了自家 K2 系列的思考模型,同样主打深度推理能力。
在 Agentic AI 成为主流趋势之下,模型的思考推理能力愈发受到重视,这也是模型能否解决复杂现实问题的关键。


登录后才可以发布评论哦
打开小程序可以发布评论哦