梁文峰和姚顺雨，四月交卷

文 | 版面之外，作者｜画画

2026 年 4 月，中国 AI 圈将迎来一次罕见的同台竞技。

DeepSeek V4，梁文锋打磨已久的多模态大模型，计划正式上线。

几乎同一时间，腾讯混元新模型也将发布，负责人是姚顺雨，2025 年底刚刚回国，顶着腾讯总办首席 AI 科学家的 Title 走马上任。

两家公司，一南一北，一个初创，一个巨头。

一个是用量化私募思路颠覆了 AI 行业的理工男，一个是被腾讯用最高规格从海外请回来的学术派。

他们几乎不可能在同一张牌桌上出现，但 4 月，他们都要交卷。

这不是巧合，这是一个节点。

1、腾讯的那个决定

要理解 4 月意味着什么，必须回到 2025 年初腾讯做的那个决定。

彼时国内大模型市场，百度有文心，阿里有通义，字节有豆包，各家都在跑马圈地。腾讯混元排不进第一梯队，产品端的元宝几乎没有存在感。

就在这个时候，腾讯选择在元宝里接入 DeepSeek。

这个决定在当时被很多人解读为务实之举，与其死撑自研，不如先用最好的模型把用户留住。

但它同时也是一个承认：在大模型能力这件事上，我们现在不如一家创业公司。

元宝的数据验证了这个决定的正确性。

接入 DeepSeek 之后，用户和活跃度明显回升。这是腾讯用流量换了时间，用元宝已有的产品生态和微信 QQ 的导流能力，换来了姚顺雨团队自研模型的窗口期。

但时间窗口终究有限。一旦混元最新的版本上线，腾讯面临的第一个真实问题是：留在元宝里的用户，到底认的是哪个名字？

这不是能靠市场调研回答的问题，它只能靠 4 月之后的留存数据来回答。

2、DeepSeek 的另一道难题

DeepSeek 这边，面对的是一种完全不同性质的压力。

V3 发布之后，DeepSeek 的数字是这样的：上线至 2025 年 2 月 9 日，累计下载超过 1.1 亿次，周活跃用户最高接近 9700 万。

这个量级，已经接近 Twitter 在鼎盛期的日活水平，对于一个发布不到半年的 AI 应用，当时几乎没有先例。

更大的影响发生在行业层面。V3 发布后，英伟达单日市值蒸发约 6000 亿美元，美国科技圈开始重新讨论算力军备竞赛的逻辑是否成立。

DeepSeek 用一个开源模型，在成本和效率上同时挑战了大模型必须靠暴力堆算力的行业共识。

但这组数字和这段叙事，也同时变成了 V4 必须背负的重量。

市场对 V4 的预期，不是比 V3 更好，而是能不能再次重新定义。这是一个很难完成的任务，因为 V3 已经把天花板拉得很高。

梁文锋选择的应对方式，是让 V4 的迭代方向足够具体，而不是继续打效率革命的旗号。

从论文节奏看，这个准备早就开始了。

2025 年 12 月，署名包含梁文锋团队的《mHC: Manifold-Constrained Hyper-Connections》发表，方向是底层架构的连接方式优化；

2026 年 1 月，梁文锋署名的《Conditional Memory via Scalable Lookup》提出条件记忆机制，在推理过程中，模型可以根据条件动态检索和激活相关记忆，而不是把所有历史上下文都塞进一个固定窗口里。

这两篇论文，距离 V4 发布只有几个月。它们不是学术展示，更像是产品路线图的技术背书。

V4 还有一条线被单独提出，深度适配国产芯片，并有望成为首个完全运行在国产算力生态上的顶级大模型。

在此之前，所有顶级大模型的训练和推理都高度依赖英伟达的 GPU。华为昇腾、寒武纪等国产芯片在性能和软件生态上与英伟达仍有差距，适配工作远比听起来复杂。

如果 V4 真的跑通了，意味着中国大模型产业链上最关键的一环，算力依赖第一次出现了可被验证的替代路径。

3、两条路，同一个终点

有意思的是，DeepSeek 和腾讯在技术路线上正在往同一个方向收拢：长上下文、长期记忆、Agent 可用性。

这不是巧合，这是整个行业正在形成的共识。下一代 AI 竞争的核心，不再是谁的参数更多，而是谁能真正记住用户、理解上下文、在复杂任务中持续工作。

但两家公司走向这个终点的路径截然不同。

DeepSeek 的做法是从底层架构动刀，条件记忆机制是要在模型本身的记忆方式上做根本性改变。

腾讯的做法是先定义评测标准，CL-bench 提出了一套衡量上下文学习能力的新基准。

如果这套标准被学术圈和行业接受，腾讯就获得了一个叙事上的主动权：你的模型好不好，要按我定的标准。

两种路径，代表了两种不同的竞争策略。做出更好的产品，和定义什么叫更好的产品，是两件事。

历史上，后者有时候比前者活得更久。但前提是，你定的标准得被别人接受。如果 DeepSeek V4 的能力直接碾压了 CL-bench 设定的评测维度，那套标准就只是腾讯的自我评分。

4、四月之后

4 月会到来，两张考卷会被打开，市场会给出它的判断。

但真正值得追问的问题，比谁的模型更好要复杂得多。

第一个问题：腾讯能不能接住用户的切换？

从接入 DeepSeek 到推出自研混元，这条路如果走通，腾讯的体量、数据、场景接入，微信、QQ、腾讯视频、游戏、企业微信，一旦有了够用的底座，这些场景的价值才能被真正释放出来。

但如果切换之后用户留存下滑，腾讯可能需要重新评估自己在这场竞争里的位置。

第二个问题：DeepSeek 能不能守住国产第一的位置？

V3 之后，DeepSeek 已经不只是一个产品，它是一个标准、一种叙事。

V4 需要证明，这不是偶然，而是一种可持续的能力。

尤其是在国产芯片这条线上，如果跑通了，DeepSeek 将拥有一个其他顶级大模型都没有的叙事，而这个叙事的价值，可能比模型本身还要大。

第三个问题，也是最大的问题：谁在争定义权？

大模型的下半场，不只是谁的能力更强，更是谁来定义下一代 AI 应该是什么样的。

梁文锋的答案是：开源、高效、记忆力强、跑在自己的芯片上。

姚顺雨和腾讯的答案是：深度融合场景、长上下文、Agent 友好。这两个答案并不互斥，但代表了两种不同的路径，一个是从模型出发往应用走，一个是从应用出发往模型走。

4 月，只是一个节点。真正的答案，可能需要整个 2026 年来慢慢揭晓。

但有一件事是确定的，2025 年初，元宝接入 DeepSeek 的那一刻，是中国 AI 格局的一次重组，大公司第一次公开承认，创业公司在核心技术上跑到了前面。

2026 年 4 月，如果混元和 V4 同时亮相，将是另一次重组的开始，不再是谁领先的问题，而是各自走哪条路的问题。

中国 AI 的故事，正在从赛跑变成分道。

而分道，往往比赛跑，更有意思。

【版面之外】的话：

两家公司，两种路径，一个时间点。

真正有意思的，不是分数。是在这两张答卷里，会看到两种完全不同的安全感。

DeepSeek 的安全感，来自把东西做出来，开源、高效、跑在自己的芯片上，这套打法能持续。

腾讯的安全感，来自把东西放进去，放进微信里，放进 QQ 里，放进游戏里。

4 月的交卷，对于腾讯来说，不是为了向外界证明什么，本质上是为了把元宝的大脑，从 DeepSeek 那里赎回来。