中国企业家杂志 6小时前
月之暗面Kimi:激进的野心,克制地扩张
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

技术无人区与偏执的审美坚持,这种独特性是月之暗面 Kimi 存在的最大意义。

文|《中国企业家》记者   孙欣

见习编辑|李原编辑|何伊凡

图片来源|受访者

过去一年里,月之暗面 Kimi(以下简称 "Kimi")完成了从 "AI 六小虎 " 到全球资本追逐对象的纵身一跃。

2025 年 12 月,Kimi 完成 5 亿美元 C 轮融资,投后估值 43 亿美元。今年 5 月,Kimi 又完成 20 亿美元 D 轮融资,估值来到 200 亿美元。6 月,传闻 Kimi 正洽谈新一轮最高 20 亿美元融资,投前估值达 300 亿美元。

在技术层面,2026 年 1 月 Kimi K2.5 的发布成为关键转折点。这款支持全模态处理的旗舰模型上线不到一个月,Kimi20 天内累计收入便超过 2025 年全年总和,ARR(年度经常性收入)突破 2 亿美元。

此后,Kimi 的产品输出节奏愈发紧凑:2026 年 4 月发布 Kimi K2.6,主打编程和 Agent 集群能力,单次任务最高可调度 300 个专业化子代理并行协作;6 月中旬,又发布了电脑端本地通用 Agent 产品 Kimi Work,以及 K2.7 Code 编程专用模型。

据悉,Kimi K2.7 Code 在基准测试上相较于上一代有极大提升。在长程任务上,K2.7 平均 Token 消耗直接减少 30%,多语言代码生成能力大幅提升。

" 编程能力是 AI 生产力提升的起点,从词元(Token)消耗看,编程占了 90%。但这只是 AI 智能被采纳的开始,通用 Agent 带来的生产力变革将从 3000 万程序员扩展到 10 亿的知识工作者。"Kimi 创始人杨植麟表示。

在他看来,大模型展开的星辰大海更值得期待。" 大模型研发正在发生范式转变,到 2026 年下半年至 2027 年,AI 将会更多地在研究层面发挥主导作用。"

激进的技术野心

回望 2025 年初,DeepSeek 异军突起,一度打乱了 Kimi 的研发节奏。而 2025 年 7 月发布的全球首个万亿参数的开源 MoE 模型 Kimi K2,再度让人们看到了杨植麟的技术底牌。

Kimi K2 发布后,一名 Kimi 内部研究员在博客中写道:" 在(2025 年)年初的反思会上,我提出了一些相当激进的建议,没想到植麟后续的行动比我想的还要激进,比如不再更新 K1 系列模型,集中资源搞基础算法和 K2。"

接近 Kimi 的人士告诉《中国企业家》,K2 诞生于公司的关键时刻,杨植麟放弃 K1 开始做 K2 这个决定,对公司来说至关重要。

而多模态模型 K2.5 的发布,标志着 Kimi 技术路线的进化。其原生多模态架构首次将文本与视觉输入在底层融合,Agent 集群支持 100 个子 Agent 并行协作,单次任务可调用 1500 个步骤。这款 1 万亿参数模型上线后迅速供不应求,直接推动 Kimi ARR 突破 1 亿美元。

4 月,K2.6 将 Agent 集群扩容至 300 子 Agent,且支持 4000 步协调执行,编程能力实现跨越式提升——在 SWE-Bench Pro 上以 58.6% 击败 GPT-5.4,可持续编码 13 小时、修改超 4000 行代码。6 月,K2.7 Code 进一步聚焦垂直场景,推理 Token 减少 30%,Kimi Code Bench V2 提升 21.8%,多语言代码生成大幅优化。

半年三次迭代,Kimi 的产品路径也逐渐清晰:以架构创新打开能力边界,再以 to B 垂直迭代逼近专业场景的精度极限。

据 Kimi 算法研究员分享,产品迭代速度加快的背后,存在一个关键的技术突破:视觉强化学习训练反哺了纯文本能力。杨植麟称之为 " 一个打破行业认知的发现 "。" 之前普遍认为引入视觉能力会降低文本能力,但我们发现二者是可以互相提升的。"

在杨植麟看来,过去 10 年间,Transformer 架构、Adam 优化器、残差连接等构成了深度学习的技术底座,一度被视为行业共识性基础设施。然而,随着模型规模的持续扩张与任务复杂度的不断抬升,这些曾经的 " 标准配置 " 或将成为模型进化的阻碍。

因此,Kimi 的技术路径也表现出了鲜明特征——专挑底层动刀,不仅在现有架构上做工程优化,更是回到 AI 系统最底层的组件,逐个问题解决,对优化器、注意力机制、残差连接等逐一优化,提高算法效率,换取智能上限。

例如,K2 采用的 MuonClip 优化器将 Token 处理效率提升到了 AdamW 的 2 倍;Kimi Linear 混合线性注意力架构在 128K 至 1M 超长上下文中,实现了 5 至 6 倍解码速度提升。K2 对神经网络架构层的改进技术 Attention Residuals,对神经网络中的核心残差连接机制进行了重新设计,在效果相近的前提下,训练计算量减少了约 20%,相当于获得了 1.25 倍的效率优势。

"MuonClip、Kimi Linear、Attention Residuals 本质上都是为了效率,通过算法创新,充分利用现有资源,达到更高的 Token 效率和模型智能水平。" 一位 Kimi 研究员说。

面向下一代模型 K3,杨植麟表示,下一代模型会采用新的模型架构,目标之一是让模型更适配 Agent 长程任务能力,因为这是最关键的能力。

" 未来 Kimi 将持续研究重构底层技术,大量底层技术也将在未来 2 到 3 年内被重新改写。希望 K3 可以成为更与众不同的模型,让用户体验到全新的、其他模型没有定义过的能力。" 杨植麟说。

点击封面订阅全年杂志

克制的组织扩张

与激进的技术野心形成鲜明对比的是,Kimi 在组织扩张上相当克制。

在组织内部,Kimi 维持着灵活的 " 小团队 " 作战状态。作为估值已超 300 亿美元的独角兽,Kimi 全公司约 300 人,也是头部大模型创业公司中人数最少的一家。

" 精锐部队 " 模式也是杨植麟刻意为之,他公开表示:" 这几个大模型创业公司里,我们始终保持人数最少,保持卡和人的比例最高非常关键。我们不希望团队扩那么大,(扩大)对创新有致命性伤害。"

《中国企业家》获悉,Kimi 内部不设 OKR,也没有部门墙,甚至没有传统意义上的部门,公司取消了各种总监、副总裁等职位标签。Kimi 的组织架构极致扁平,几位联创直接对接数十位团队成员。杨植麟的微信签名也只有四个字:直接沟通。

Kimi 创始人杨植麟

接近 Kimi 的人士告诉《中国企业家》,在谈及模型时,杨植麟常反复提及一个词—— " 品味 "(taste)。在算力和数据日益同质化的竞争中," 品味 " 成为 Kimi 建立差异化壁垒的核心驱动力。

总裁张予彤如此解释 Kimi 的人才理念:Kimi 偏好 " 有抽象能力 " 和 " 有些偏执 "" 会疯狂做事 " 的人," 你有一个很好的想法,会不会为它尝试 1000 次?绝大部分人可能尝试 10 次就觉得这件事不能做。但也有极少数人会更相信自己的想法,并且在尝试中形成新的认知。"

"Kimi 成立初期聚集了多项 AI 核心技术的发明者,这些人后续又找到更多同路人。" 在杨植麟看来,技术本身仍然是 AI 大模型最大的变量,而 Kimi 对技术人才的吸引力是竞争力的关键。

不被定义的 LLM

2025 年 12 月底,当 MiniMax、智谱相继敲定 IPO 进展时,市场将目光投向 Kimi。杨植麟一度对此冷然处之,他在全员邮件中表示:公司现金流充足,不急于上市。

但大模型行业水流湍急,玩家仍在急剧收敛。

2026 年 5 月 7 日、8 日两天,中国大模型赛道在 48 小时内密集宣布了逾百亿美元的融资消息。媒体评价:" 钱不是在流向行业,而是在流向最后几个玩家。"Kimi 已经证明了自己的技术实力,还需要向市场证明商业变现能力。

K2.5 发布后的 3 月,Kimi 的 ARR 突破 1 亿美元;4 月,这一数字来到 2 亿美元。" 很长一段时间里,K2.5 供不应求。" 接近 Kimi 的人士告诉《中国企业家》。

6 月 12 日,Kimi 发布桌面 AI Agent 产品 Kimi Work,支持 300 个 Agent 并发,且内置了 Cron 调度器。同时,Kimi Work 还实现了金融数据直连,Agent 也可直接读写电脑上的文件,且所有操作在本地完成、数据不出设备。

加速商业化效率之外,算力、人才、资源以及和互联网大厂之间的竞合关系,也都在等待 Kimi 解答。

杨植麟的姿态始终清晰。" 我们不是为了竞争而建立的公司。" 他在一次早期采访中如此表态。2025 年底,他进一步阐释了自己的判断:" 行业发展进入了一个新的阶段,它从一开始有很多公司在做,变成现在少一点的公司在做,接下来大家做的东西会逐渐不一样。"

开源社区中的技术流动,也为这种 " 和而不同 " 的格局提供了注脚。DeepSeek 发布 V4 时,其技术报告中明确致谢了 Kimi 创新并开源的 Muon 优化器。杨植麟对此的回应平静而坦诚:" 这是开源的意义,我们受益于开源技术,也希望把我们的贡献带给社区。"

未来的 Kimi 将会成为谁?杨植麟在 2025 年底的内部信中,表达清晰坚定,也带着自己卓尔不群的 "taste" 和底气。

"2026 年 Kimi 会成为一个‘与众不同’和‘不被定义’的 LLM(大语言模型)。不管是别人没敢押注的技术无人区,还是需要一点偏执的审美坚持,我相信有更多 Kimi-defined 的创新能对人类文明加速发展产生独特贡献。这种独特性是我们存在的最大意义。"

新闻热线 & 投稿邮箱:tougao@iceo.com.cn

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi ai 编程 融资 程序员
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论