梁文锋向左，杨植麟向右

出品｜虎嗅科技组

作者｜宋思杭

编辑｜苗正卿

头图｜视觉中国

月之暗面（以下简称 "Kimi"）和 DeepSeek，已然成为 2026 年大模型圈内最受关注的两家公司。与此同时，两家公司也越来越相似。

首先是融资。过去半年里，Kimi 连续完成多轮融资，估值快速上涨。而另一边，此前一直被视为不差钱的 DeepSeek，也终于启动了融资。放在两年前，这其实是一件很难想象的事情。

当时的大模型行业里，两家公司代表着两种不同的发展路径。

Kimi 是明星创业公司，融资频繁，持续扩张；DeepSeek 则显得有些特殊。梁文锋很少出现在融资新闻里，外界对于 DeepSeek 最大的印象，也始终是技术。

但到了今年，一个越来越明显的变化是，两家公司开始同时出现在资本市场的牌桌上。

其次是技术路线。过去很长一段时间里，外界总喜欢把两家公司放在一起比较，但实际上，它们做的事情并不完全一样。

Kimi 一直更靠近产品。从长文本、搜索，到后来的 Agent、Coding，月之暗面始终试图把模型能力变成产品。

而 DeepSeek 则更像一家研究机构。无论是 V2、R1 还是 V3，行业讨论最多的始终是模型能力本身。但从今年的 V4 开始，在技术路线上，DeepSeek 也将焦点放在了长文本、Coding 和 Agen 上。

这两家公司的边界正在变得模糊。

Kimi 开始越来越重视底层模型能力；而 DeepSeek 也开始越来越关注推理效率、工程体系以及大规模部署问题。甚至连招聘方向都开始出现重叠。

虎嗅注意到，近期 Kimi 和 DeepSeek 都在持续招聘 Harness 相关岗位。对于大模型公司而言，Harness 并不是模型本身，而是模型背后的基础设施。训练、推理、调度、资源管理，都需要依赖这一套系统。

换句话说，当两家公司同时开始扩招 Harness 团队时，说明他们关注的已经不只是模型能力，而是模型如何被更快地训练出来、更稳定地运行，以及更低成本地被使用。

而除了上述所提到的融资、技术路线，创始人的管理风格也有一些相似之处。

杨植麟和梁文锋都属于典型的技术创始人，他们都不喜欢站到聚光灯下，也很少主动讲故事。相比市场、营销或者融资，他们更愿意讨论模型、算法和技术本身。

过去几年里，" 技术理想主义 " 几乎成为外界贴在两家公司身上最统一的标签。

但融资之后，两家公司可能又会走向新的分岔。

DeepSeek 的钱，准备花在哪？

对于 DeepSeek 来说，今年最大的变化是融资。过去很长一段时间里，外界对 DeepSeek 的印象都是 " 不缺钱 "。

梁文锋背后的幻方量化，本身就拥有持续投入 AI 研发的能力。相比很多需要不断融资才能维持训练节奏的大模型公司，DeepSeek 一直显得有些特殊。

这也是为什么，当融资消息传出时，比起融资金额和估值、融资方外，大家最关注的还是，DeepSeek 为什么突然开始融资了？

目前来看，人才或许是其中一个原因。

过去一年，大模型行业最激烈的竞争，已经从模型能力逐渐转向人才竞争。

无论是 OpenAI、Meta 还是国内头部模型公司，都在持续争夺顶级研究员和工程人才。而对于 DeepSeek 来说，融资无疑能够提供更充足的激励工具，帮助其留住核心团队。

但如果仅仅是为了留住人才，或许还不足以解释 DeepSeek 最近的一系列动作。

近期，虎嗅注意到，DeepSeek 正在招聘 " 数据中心高级交付经理 " 的岗位。从岗位职责来看，其负责内容包括数据中心项目从立项、建设、交付到运营的全流程管理，同时还需要参与 IDC 自动化运维平台建设、资源管理以及运维标准体系建设。

更值得关注的是，在任职要求中，DeepSeek 特别提到了 GPU 算力相关交付运维经验，以及大型集群规划建设经验。

对于普通互联网公司来说，这或许只是一个基础设施岗位。但对于一家大模型公司而言，这背后对应的其实是另一套能力体系。

过去两年，行业讨论最多的是模型能力。R1、V3、V4，每一次模型发布都会引发外界关注。但随着模型规模不断扩大，以及 Agent 带来的 Token 消耗持续增长，模型公司面临的问题已经不仅仅是如何把模型训练出来。

越来越多的问题开始出现在模型之外。例如，如何管理越来越庞大的 GPU 集群；如何提升算力资源利用率；如何保证训练和推理任务稳定运行；以及如何支撑下一代模型训练所需要的基础设施规模。

而这些，恰恰是数据中心团队所要解决的问题。与此同时，DeepSeek 也在持续扩张 Harness 团队。

对于很多模型公司而言，Harness 更接近训练和推理基础设施平台。它并不直接参与模型研发，但负责让模型训练、推理以及资源调度能够更加高效地运行。

从这个角度来看，DeepSeek 当下的关注点已经不仅仅聚焦在模型能力上，还有基础设施能力，因为它决定着模型能达到的上限。

这或许也是 DeepSeek 融资之后，最值得关注的变化之一。

一个流向用户，一个流向 GPU

2026 年对 Kimi 来说是至关重要的一年，这一点从其半年融资三次，估值涨了 5 倍，就可以看出。

今年年初，OpenClaw 带来了惊人的收入增长。这让月之暗面第一次真正看到了商业化的希望。

与此同时，从 Kimi 今年发布的几款模型变化中也可以发现，模型技术开始越来越明显地为产品服务。

无论是 Agent、Coding 还是海外市场，月之暗面都在试图证明，模型能力最终能够转化为收入和增长。

所以，对于 Kimi 来说，今年最重要的关键词是商业化。而对于 DeepSeek 来说，其关注点和 Kimi 并不相同。

虽然两家公司都在融资，也都在扩张团队，但它们要解决的问题完全不同。

对于 Kimi 来说，市场最关心的是增长。收入能否持续增长？Agent 能否带来新的付费场景？海外市场能否复制国内的成功经验？这些问题最终都会回到商业化本身。

但 DeepSeek 面临的压力并不在这里。从成立至今，DeepSeek 最大的竞争力始终来自模型能力。无论是 V2 时期的低成本训练，还是 R1 带来的推理模型热潮，其核心优势都建立在技术领先之上。

因此，对于 DeepSeek 而言，最重要的问题并不是如何找到更多用户，而是如何持续保持领先。

这也是为什么，在融资之后，外界看到的并不是大规模产品扩张，而是 Harness 团队扩张、数据中心岗位出现，以及更多围绕基础设施建设的动作。

因为对于 DeepSeek 来说，模型能力本身仍然是最重要的资产。

相比为某一个产品功能做针对性优化，DeepSeek 更需要保证的是，下一代模型能够继续迭代，下一次技术突破仍然发生在自己身上。

某种程度上，这也是两家公司最根本的区别。Kimi 需要向市场证明模型能够赚钱。DeepSeek 则需要向市场证明模型能够继续领先。前者的资金最终会流向产品、用户和收入。后者的资金则会流向算力、集群和基础设施。

而这也决定了，同样是一笔融资，两家公司最终会走向完全不同的方向。

宙世代

一起剪