被DeepSeek逼入墙角后，Kimi反击战终于来了

文 | 新质动能

这可能是中国 AI 公司的又一个 DeepSeek 时刻。

2 月 23 日，一则消息在创投圈炸开：大模型创业公司月之暗面（Kimi）旗下 K2.5 大模型发布不到一个月，近 20 天累计收入已超过 2025 年全年总收入。更令人咋舌的是，海外收入首次反超国内，全球付费用户正在以惊人的速度涌入。

但这只是冰山一角。在连续融资超 12 亿美元后，月之暗面刚刚创下国内公司从成立到晋级 " 十角兽 " 企业（估值超 100 亿美元）的最快纪录——仅用两年多时间，身价翻了 30 多倍。要知道，字节突破百亿美元用了 4 年，拼多多用了 3 年。

当阿里砸 30 亿请全国人民喝奶茶、腾讯用 10 亿红包狂轰滥炸时，这家不参与补贴大战的公司，反而成了 AI 赛道最吸金的玩家之一。创始人杨植麟在内部信中淡定写下：" 短期不着急上市。" 公司账面现金储备已接近 100 亿元，比不少上市公司还有钱。

这家仅 300 人的创业公司，如此底气十足，究竟凭什么？

让 100 个 AI 分身同时干活

K2.5 的发布方式很特别。

创始人杨植麟没有开发布会，他站着录了一段中英双语视频，轻描淡写地说："K2.5 是我们目前最强大的模型，而且是开源的。"

真正让开发者疯狂的，不是开源本身，而是 K2.5 带来的新物种：Agent 集群。

简单来说，K2.5 可以调度多达 100 个 " 分身 " 同时工作。当你让它完成一项复杂任务，比如 " 检索近三个月所有关于集群式 Agent 的文献，整理成 Excel 并提炼核心发现 "，它不再是一个 AI 单打独斗，而是瞬间组建一支专业团队——有 " 人 " 分别负责搜索、筛选、总结、排版，所有工作并行推进，效率提升 3 到 10 倍。

这种能力的背后，是 Kimi 研发团队自研的一套新技术——并行智能体强化学习（PARL）。它在训练中教会模型如何拆解任务、分配角色、协同执行，所有的分工协作无需预设，全由模型即时决策。

" 高质量数据的增长速度赶不上算力的增长，传统的用互联网数据预测下一个 token 的方式带来的改进越来越少。" 杨植麟在 Reddit（全球最大的网友自发讨论社区）上与全球网友互动时解释，" 但我们可以通过其他方式扩展，比如 Agent 集群——并行执行子任务的数量可以无限扩展。"

说白了，就是靠喂更多数据让 AI 变聪明的老办法，效果越来越差了。所以 Kimi 换了思路，让 AI 学会团队作战，靠人多力量大来突破瓶颈。

这一策略很快被市场验证。K2.5 发布后，在全球最大的大模型 API 聚合与调用量排行榜平台—— OpenRouter 上，其调用量一度登顶全球第一，超过谷歌的 Gemini 和 Anthropic 的 Claude。OpenClaw —— 2026 年初最火爆的开源 Agent 框架——直接将 K2.5 列为首选推荐模型。

在全球各大社区上，大量开发者开始分享 " 如何用 Kimi 部署 OpenClaw" 的教程。一个用户写道：" 用 Claude 跑 Agent，账单动不动几百美元，换成 Kimi，成本降到原来的八分之一。"

这正是 Kimi 的阳谋：不参与国内 C 端聊天机器人的补贴大战，转而拥抱全球开发者生态。结果就是文章开头那一幕：K2.5 发布不到 20 天，收入超过去年全年总和，海外收入首次反超国内。

被 DeepSeek 逼入墙角之后

但在 K2.5 发布之前，Kimi 刚刚度过艰难的 2025 年。

年初，DeepSeek 的横空出世让 Kimi 的市场声量一度下滑，月活从一季度 2165 万回落至年末 902.7 万，几乎腰斩。

杨植麟在内部信中总结："2025 年可以说只做了一件事，All in 模型能力和 Agent。"

这一年，公司做了几个关键决定：战略性停止年耗超 7 亿元的烧钱买量，砍掉 Ohai、Noisee 等 C 端泛娱乐产品线；从闭源转向开源，7 月发布 Kimi K2 时采用 MIT 开源协议；将重心转向海外，9 月 OK Computer（Kimi Agent）率先在海外全量上线，国内仅灰度测试。

埋头投入很快有了回报。7 月，Kimi 发布中国首个万亿参数开源基座模型 K2，代码与 Agent 能力达到领域顶尖水平；9 月推出 OK Computer 全栈智能体助手；11 月开源思考模型 Kimi K2 Thinking，训练成本仅 460 万美元，性能却超越数十亿美元投入的 GPT 模型。一位接近团队的人士形容，那段时间 " 几乎是抱着必死决心在投入 "。

这场反击的技术成果，最终在 2026 年 1 月的 K2.5 身上集中兑现。

而将 Kimi 带到这个位置的杨植麟，是一个 1992 年出生的年轻人。

杨植麟的求学履历堪称硬核——被清华录取了三次（保送、自主招生、汕头理科状元），以年级第一毕业，随后赴卡内基梅隆大学读博，师从苹果 AI 负责人，以第一作者身份发表 Transformer-XL 与 XLNet 两篇论文，成为构建大模型的基石性成果。

但他绝不是个技术宅。在清华，他是摇滚乐队 Splay 的鼓手，梦想过成为摇滚明星。公司取名 " 月之暗面 "（Moonshot AI），正源自他钟爱的平克 · 弗洛伊德乐队专辑，象征着对未知的好奇与探索。

2023 年创立 Kimi 时，杨植麟选择的是一条在当时看来有些偏门的路——超长文本。当同行都在卷参数规模时，他带着团队死磕 " 让 AI 一次性读完百万字小说 " 的能力。2024 年初，Kimi 凭借 200 万字上下文一鸣惊人，成为资本宠儿。

但 2025 年的低谷，让他和团队完成了一次关键进化：从 " 长文本之王 " 转向 Agent 技术派。如今回头看，那场被 DeepSeek 逼入墙角的危机，反而成了 Kimi 蜕变的契机。

操盘手张予彤，被朱啸虎炮轰的女人

Kimi 的狂奔，还离不开一个人——张予彤。

这位 80 后清华才女的加入，曾伴随巨大争议。

作为金沙江创投的前投资人，她主导投资了杨植麟首次创业的项目，两人早有交集。2024 年，张予彤从金沙江离职，深度参与月之暗面运营，却因此被前同事朱啸虎公开炮轰，指控其隐瞒持股、违反受托责任，纠纷一度被提交至香港国际仲裁中心。

杨植麟对此的反应是力挺。

他在内部信中澄清，张予彤的股份是基于多年兑现的贡献对价，是对她在公司业务、战略及融资上所做贡献的奖励。2025 年 12 月，张予彤正式以 " 月之暗面 Kimi 总裁 " 身份公开亮相，全面负责商业化落地。

这对组合的分工日渐清晰：杨植麟专注技术上限；张予彤负责商业变现。她在达沃斯论坛上提出的竞争策略颇具深意：" 最有效的竞争方式就是不竞争。" ——不盲目追求大而全，而是专注于底层技术创新和 Agent 等高价值场景的深耕。

这种 " 不竞争 " 的背后，是 Kimi 对人才的极致投入。2025 年底，杨植麟在内部信中透露，基于成果产出，公司对 324 名员工进行了调薪、期权、现金等各种激励。2026 年，计划将平均激励提升至 2025 年的 200%，同时大幅上调期权回购额度。

有猎头算过一笔账：以 300 人团队、2025 年人均 80 万元总包估算，2026 年单人力成本将冲到 160 万元。这意味着月之暗面要用约 5 亿元现金，买员工一年的 " 人才独占期 "。

" 我们没有随意堆砌算力的条件，这迫使我们必须通过大量的基础研究创新，来换取极致的效率。" 张予彤说。用美国顶尖实验室 1% 的资源，研发出全球领先的开源模型——这不是谦虚，是现实。

如今的国内大模型赛道，正呈现清晰的 "K 型分化 "。巨头们凭借生态和资本进行 " 全栈饱和攻击 "，智谱和 MiniMax 拥抱大厂、启动 IPO，市值双双突破 3000 亿港元。而 Kimi 选择另一条路：不上市，不站队，靠技术溢价和全球开发者生态，构建自己的护城河。

100 亿现金和 Agent 集群的技术领先，帮 Kimi 拿到了留在牌桌上的资格。但在算力掣肘和巨头虎视眈眈之下，它能否把领先的半个身位跑成一段路？

答案或许藏在杨植麟喜欢的那张平克 · 弗洛伊德专辑里——月之暗面，既是未知的黑暗，也是未被照亮的可能。

宙世代

一起剪

相关标签