文 | 新质动能
这可能是中国 AI 公司的又一个 DeepSeek 时刻。
2 月 23 日,一则消息在创投圈炸开:大模型创业公司月之暗面(Kimi)旗下 K2.5 大模型发布不到一个月,近 20 天累计收入已超过 2025 年全年总收入。更令人咋舌的是,海外收入首次反超国内,全球付费用户正在以惊人的速度涌入。
但这只是冰山一角。在连续融资超 12 亿美元后,月之暗面刚刚创下国内公司从成立到晋级 " 十角兽 " 企业(估值超 100 亿美元)的最快纪录——仅用两年多时间,身价翻了 30 多倍。要知道,字节突破百亿美元用了 4 年,拼多多用了 3 年。
当阿里砸 30 亿请全国人民喝奶茶、腾讯用 10 亿红包狂轰滥炸时,这家不参与补贴大战的公司,反而成了 AI 赛道最吸金的玩家之一。创始人杨植麟在内部信中淡定写下:" 短期不着急上市。" 公司账面现金储备已接近 100 亿元,比不少上市公司还有钱。
这家仅 300 人的创业公司,如此底气十足,究竟凭什么?
让 100 个 AI 分身同时干活
K2.5 的发布方式很特别。
创始人杨植麟没有开发布会,他站着录了一段中英双语视频,轻描淡写地说:"K2.5 是我们目前最强大的模型,而且是开源的。"
真正让开发者疯狂的,不是开源本身,而是 K2.5 带来的新物种:Agent 集群。
简单来说,K2.5 可以调度多达 100 个 " 分身 " 同时工作。当你让它完成一项复杂任务,比如 " 检索近三个月所有关于集群式 Agent 的文献,整理成 Excel 并提炼核心发现 ",它不再是一个 AI 单打独斗,而是瞬间组建一支专业团队——有 " 人 " 分别负责搜索、筛选、总结、排版,所有工作并行推进,效率提升 3 到 10 倍。
这种能力的背后,是 Kimi 研发团队自研的一套新技术——并行智能体强化学习(PARL)。它在训练中教会模型如何拆解任务、分配角色、协同执行,所有的分工协作无需预设,全由模型即时决策。
" 高质量数据的增长速度赶不上算力的增长,传统的用互联网数据预测下一个 token 的方式带来的改进越来越少。" 杨植麟在 Reddit(全球最大的网友自发讨论社区)上与全球网友互动时解释," 但我们可以通过其他方式扩展,比如 Agent 集群——并行执行子任务的数量可以无限扩展。"
说白了,就是靠喂更多数据让 AI 变聪明的老办法,效果越来越差了。所以 Kimi 换了思路,让 AI 学会团队作战,靠人多力量大来突破瓶颈。
这一策略很快被市场验证。K2.5 发布后,在全球最大的大模型 API 聚合与调用量排行榜平台—— OpenRouter 上,其调用量一度登顶全球第一,超过谷歌的 Gemini 和 Anthropic 的 Claude。OpenClaw —— 2026 年初最火爆的开源 Agent 框架——直接将 K2.5 列为首选推荐模型。
在全球各大社区上,大量开发者开始分享 " 如何用 Kimi 部署 OpenClaw" 的教程。一个用户写道:" 用 Claude 跑 Agent,账单动不动几百美元,换成 Kimi,成本降到原来的八分之一。"
这正是 Kimi 的阳谋:不参与国内 C 端聊天机器人的补贴大战,转而拥抱全球开发者生态。结果就是文章开头那一幕:K2.5 发布不到 20 天,收入超过去年全年总和,海外收入首次反超国内。
被 DeepSeek 逼入墙角之后
但在 K2.5 发布之前,Kimi 刚刚度过艰难的 2025 年。
年初,DeepSeek 的横空出世让 Kimi 的市场声量一度下滑,月活从一季度 2165 万回落至年末 902.7 万,几乎腰斩。
杨植麟在内部信中总结:"2025 年可以说只做了一件事,All in 模型能力和 Agent。"
这一年,公司做了几个关键决定:战略性停止年耗超 7 亿元的烧钱买量,砍掉 Ohai、Noisee 等 C 端泛娱乐产品线;从闭源转向开源,7 月发布 Kimi K2 时采用 MIT 开源协议;将重心转向海外,9 月 OK Computer(Kimi Agent)率先在海外全量上线,国内仅灰度测试。
埋头投入很快有了回报。7 月,Kimi 发布中国首个万亿参数开源基座模型 K2,代码与 Agent 能力达到领域顶尖水平;9 月推出 OK Computer 全栈智能体助手;11 月开源思考模型 Kimi K2 Thinking,训练成本仅 460 万美元,性能却超越数十亿美元投入的 GPT 模型。一位接近团队的人士形容,那段时间 " 几乎是抱着必死决心在投入 "。
这场反击的技术成果,最终在 2026 年 1 月的 K2.5 身上集中兑现。
而将 Kimi 带到这个位置的杨植麟,是一个 1992 年出生的年轻人。
杨植麟的求学履历堪称硬核——被清华录取了三次(保送、自主招生、汕头理科状元),以年级第一毕业,随后赴卡内基梅隆大学读博,师从苹果 AI 负责人,以第一作者身份发表 Transformer-XL 与 XLNet 两篇论文,成为构建大模型的基石性成果。
但他绝不是个技术宅。在清华,他是摇滚乐队 Splay 的鼓手,梦想过成为摇滚明星。公司取名 " 月之暗面 "(Moonshot AI),正源自他钟爱的平克 · 弗洛伊德乐队专辑,象征着对未知的好奇与探索。
2023 年创立 Kimi 时,杨植麟选择的是一条在当时看来有些偏门的路——超长文本。当同行都在卷参数规模时,他带着团队死磕 " 让 AI 一次性读完百万字小说 " 的能力。2024 年初,Kimi 凭借 200 万字上下文一鸣惊人,成为资本宠儿。
但 2025 年的低谷,让他和团队完成了一次关键进化:从 " 长文本之王 " 转向 Agent 技术派。如今回头看,那场被 DeepSeek 逼入墙角的危机,反而成了 Kimi 蜕变的契机。
操盘手张予彤,被朱啸虎炮轰的女人
Kimi 的狂奔,还离不开一个人——张予彤。
这位 80 后清华才女的加入,曾伴随巨大争议。
作为金沙江创投的前投资人,她主导投资了杨植麟首次创业的项目,两人早有交集。2024 年,张予彤从金沙江离职,深度参与月之暗面运营,却因此被前同事朱啸虎公开炮轰,指控其隐瞒持股、违反受托责任,纠纷一度被提交至香港国际仲裁中心。
杨植麟对此的反应是力挺。
他在内部信中澄清,张予彤的股份是基于多年兑现的贡献对价,是对她在公司业务、战略及融资上所做贡献的奖励。2025 年 12 月,张予彤正式以 " 月之暗面 Kimi 总裁 " 身份公开亮相,全面负责商业化落地。
这对组合的分工日渐清晰:杨植麟专注技术上限;张予彤负责商业变现。她在达沃斯论坛上提出的竞争策略颇具深意:" 最有效的竞争方式就是不竞争。" ——不盲目追求大而全,而是专注于底层技术创新和 Agent 等高价值场景的深耕。
这种 " 不竞争 " 的背后,是 Kimi 对人才的极致投入。2025 年底,杨植麟在内部信中透露,基于成果产出,公司对 324 名员工进行了调薪、期权、现金等各种激励。2026 年,计划将平均激励提升至 2025 年的 200%,同时大幅上调期权回购额度。
有猎头算过一笔账:以 300 人团队、2025 年人均 80 万元总包估算,2026 年单人力成本将冲到 160 万元。这意味着月之暗面要用约 5 亿元现金,买员工一年的 " 人才独占期 "。
" 我们没有随意堆砌算力的条件,这迫使我们必须通过大量的基础研究创新,来换取极致的效率。" 张予彤说。用美国顶尖实验室 1% 的资源,研发出全球领先的开源模型——这不是谦虚,是现实。
如今的国内大模型赛道,正呈现清晰的 "K 型分化 "。巨头们凭借生态和资本进行 " 全栈饱和攻击 ",智谱和 MiniMax 拥抱大厂、启动 IPO,市值双双突破 3000 亿港元。而 Kimi 选择另一条路:不上市,不站队,靠技术溢价和全球开发者生态,构建自己的护城河。
100 亿现金和 Agent 集群的技术领先,帮 Kimi 拿到了留在牌桌上的资格。但在算力掣肘和巨头虎视眈眈之下,它能否把领先的半个身位跑成一段路?
答案或许藏在杨植麟喜欢的那张平克 · 弗洛伊德专辑里——月之暗面,既是未知的黑暗,也是未被照亮的可能。


登录后才可以发布评论哦
打开小程序可以发布评论哦