总理座谈会上的年轻人，春节暴涨超千亿

The following article is from 华商韬略 Author 华商韬略

内容来源：本文转载自微信公众号华商韬略 ( hstl8888 ) ，笔记侠经授权转载。转载请联系原公众号授权。

责编 | 柒排版 | 拾零

第 9465 篇深度好文：4909 字 | 13 分钟阅读

商业趋势

笔记君说：

去年底因为参加总理座谈会而备受瞩目的闫俊杰，真正是度过了一个马上暴富的春节：

腊月 25 至正月初五，他创立的上海稀宇极智科技有限公司（MiniMax），股价从 500 多元飙升至近千元，市值也拉升到超过 3000 亿港元。

一个春节，暴涨超千亿。

一、干得早

闫俊杰和大多数 AI 创业者一样，是天才，也是超级学霸。

1989 年出生于河南一座小县城的他，在中国科学院自动化所完成博士学业，之后又在清华大学计算机系从事博士后研究。

2015 年，闫俊杰加入了当时的 AI 领军企业商汤科技，并快速晋升为公司副总裁、研究院副院长及智慧城市事业群 CTO，参与和主导了商汤深度学习工具链及通用智能技术体系搭建，并发表顶级会议和期刊论文 100 余篇，成为业内公认的顶级专家。

2021 年底，已是商汤副总裁的闫俊杰决定辞职，创业成立 MiniMax。

彼时的商汤科技即将港股上市，以闫俊杰的职级，如果不辞职很可能成为亿万富翁。

放弃既得的大好钱程，冒险重新开始，是因为闫俊杰对 AI 的发展有了新的思考。

当时的 AI 炒得火热，大量资金涌入，发展却远不及预期。也就应用于人脸识别、语音识别领域，创造的社会价值不高，甚至被调侃为人工智障。

核心问题在于 AI 不够通用。当时行业用虚拟模型解决客户的问题，每做一个模型就要训练一次。

一旦客户有多个问题，就得训练多个模型，直接导致成本高、周期长、效率低。

能否摆脱这种为每个任务专门定制模型的路径，面向更广泛人群的需求，开发一个通用的模型，让 AI 像水电一样普及，融入并改变人们的生活呢？

比如，一款能回答大家各种问题的模型，一款能帮助大家写作的模型……闫俊杰认为，这是有可能的。

更进一步思考后，他开始为这种可能性感到兴奋，感到时不我待，希望自己可以亲手将它做出来。

于是，他做出让很多人意外的决定，于 2021 年底成立了 MiniMax ‌，毅然决然地希望做出自己的通用大模型。

现在回头看，他的这一时间选择可谓是相当美妙：

就在 2022 年底，OpenAI 发布的 ChatGPT 爆火全球，也让通用大模型成为全球科技浪潮的暴风口。

二、看得准

MiniMax 的创立顺应了大势，但其发展，相当程度上却都是逆行业而行。

当大模型爆火后，大多数 AI 公司都集中资源先精一项。MiniMax 却从一开始就无视文本、语音、视频的界限，坚持全模态自研，想实现全精通。

这种 " 不聚焦 " 的战略，很可能贪多嚼不烂，让许多投资者忧心忡忡。但闫俊杰认为，只有全模态才能逼近人类智能交互能力。

在目标用户上，大多数 AI 公司深耕面向企业或组织的 B 端。MiniMax 却双拳出击，不仅深抓 B 端，更发布了众多面向个人消费者的 C 端产品，诸如 Talkie、海螺 AI、MiniMax Agent 等。

而且从创业伊始，闫俊杰就将主要精力侧重到具备付费习惯的海外市场。一些产品甚至是" 海外先行，国内跟进 "，比如 2023 年 6 月，AI 社交应用 Talkie 登陆欧美市场，火了之后才推出国内版 " 星野 "。

在技术路线上，闫俊杰更是孤注一掷，豪赌未来。

2023 年下半年，他力排众议，坚持从行业常用的 Dense 架构，转向混合专家系统的 MoE 架构。而且不是小幅调整，是全力转向，几乎投入了公司所有的算力资源。

Dense 架构的核心特征是每次计算都‌全员参与，这种方式效率低且‌资源消耗大，但也有结构简单、训练稳定的优点。

MoE 架构的预训练难度更高，但能显著降低算力消耗和使用成本，实现更高的效率。

当时，大多数公司都选择了更简单、稳定的 Dense 架构。但闫俊杰认为，未来的发展会对算力和资源消耗提出更大要求。只有在算力和消耗上省下成本，才会更有竞争力。

" 不管有钱的大厂，还是没有钱的创业公司，（中国公司）在算力层面的投入可能要比美国公司小 1-2 个数量级。这是接下来两三年内非常确定的事情。"

如何用更少的资金和算力追上美国，成为了最迫切的事情，闫俊杰反复思考后的答案就是，转向 MoE 架构。

" 你会发现这不是选择，而是你能够想到的唯一一条路，只有那一条路可以通向你的目标。当时只能这样，如果做不出来就完了。"

这是一场豪赌，失败了就会出局。后来的经历也是相当艰险，连续两次转型，结果都失败了，如果第三次继续失败，公司很可能走向终局。

好在第三次成功了，公司不但活了下来，而且提前走到了正确的道路上，赢得了先机。

如闫俊杰所料，AI 大爆发之后，MoE 架构的技术路线逐渐成为行业主流。

抢先布局的 MiniMax，在 2024 年 1 月上线了国内首个 MoE 大模型 abab，不但引领了国内行业，而且仅以累计 5 亿美元的投资，约行业龙头 OpenAI 花销的百分之一，就跻身世界 AI 的第一梯队。

闫俊杰另两个反向而行—— C 端产品和 " 全模态 "，也都获得了成功。

如今，MiniMax 已经跑出了多个畅销全球的 C 端产品，拥有超 2 亿个人用户，覆盖 200 多个国家及地区。

其中，主打视频生成的海螺 AI，全球用户数突破 4000 万，其生成的高质量视频连马斯克都点赞过。专注于 AI 角色陪伴与虚拟社交的 Talkie，更是在全球爆火，用户数达到惊人的 1.47 亿名。

图源：海螺 AI

而且这些应用的用户大多来自海外，尤其是美国，堪称真正的 " 国际明星 "。

在 MiniMax 的营收中，已有超过 70% 为海外市场贡献。

多模态的坚持，则让 MiniMax 成为" 全球唯四全模态进入第一梯队 "的大模型企业。它的语音模型 Speech-02、视频模型 Hailuo-02、文本模型 MiniMax M2，都在权威评测中达到全球顶尖水平。

这也就意味着，它可以最大限度地争取用户。无论是语音、视频、文本，甚至是音乐，它都能够满足需求。更关键的是，多模态可以融合，成就全能 AI。

这些综合起来，共同筑成了 MiniMax 的王座。

2024 年，仅仅成立三年的 MiniMax，年营收达到 2.14 亿元，同比增长 782.2%。

卓越的表现，不仅让 MiniMax 与月之暗面、智谱 AI、阶跃星辰、百川智能、零一万物并称为中国大模型 " 六小虎 "，而且还是估值最高的小虎，受到了腾讯、IDG、高瓴创投、米哈游等资本的狂热追捧。

2025 年初，MiniMax 满怀信心，上线了拥有 4560 亿参数的开源大模型 MiniMax-01，期望以此巩固技术领先优势。

然而，一个巨大的挑战席卷而来。

三、挺得住

MiniMax-01 上线没几天，整个国内乃至世界 AI 圈都迎来了一件王炸级事件：

DeepSeek-R1 横空出世，凭借推理模型的革命性技术爆火出圈，而且完全开源。

几乎是一夜之间，全球 AI 都在讨论，甚至畏惧着 DeepSeek 这家此前堪称默默无闻的公司，腾讯、百度等巨头，乃至各行各业也都纷纷接入其模型。

对于国家来说，这是国运级的科技成果。但对于很多大模型初创企业来说，这就是天塌了。

王者已现且气势如虹的压力之下，一众还在为大模型准备的初创公司，要么弃赛，要么接入，要么转行，继续坚持做自己的模型被认为是最危险的选择。

但闫俊杰选择了继续坚持做自己的模型。

很多人以为 MiniMax 会就此坠入深谷，闫俊杰也感觉大山压肩，但他化压力为动力，最困难时刻最大力度爆发，集中一切力量，继续孤注一掷，研发新一代的推理模型。

半年之后，格局再次被扭转了。

当年 6 月 17 日，MiniMax 上线了自主研发的 MiniMax-M1，不但赢得了" 全球首个开源大规模混合架构的推理模型 "的占位，还凭借支持 100 万 Tokens 的上下文输入（8 倍于 DeepSeek-R1），以及卓越的长文本理解等关键能力，在 DeepSeek-R1 之外，打出了自己的优势，也赢得不少赞誉。

虎口脱险般的闫俊杰，还发了一条意味深长的朋友圈：

" 第一次感觉到大山不是不能翻越。"

而这还不是全部。之后的 4 天，MiniMax 以 " 日更 " 的方式，陆续发布了全新视频生成大模型 Hailuo 02、通用智能体产品 MiniMax Agent、视频创作智能体 Hailuo Video Agent、音色设计产品 Voice Design。

5 天时间，5 款重磅模型和产品，MiniMax 不仅重新坐上了牌桌，还吸引了 " 教主 " 黄仁勋的注意。

图源：腾讯科技

当年 7 月，英伟达 CEO 黄仁勋在北京链博会上公开称赞 MiniMax，将其与阿里巴巴、百度等企业并称为 " 世界级 " 产品开发者。

链博会结束不久，黄仁勋又单独和闫俊杰会面，深入交谈了约两个小时。

此后的 MiniMax，开始好消息连连，并在 2026 年 1 月 9 日，于港交所正式挂牌上市，上市首日股价大幅上涨近 110%，市值超1000 亿港元。

如今更是突破了 3000 亿港元，远高于老东家商汤科技，与另一家公司智谱 AI 并称为 " 大模型双雄 "。

四、站更高

闫俊杰的身上，有一个巨大的反差点。

他总是满脸笑容，说话慢条斯理，但内心杀伐果断。当整个 AI 圈都在追逐 DAU（日活跃用户数）时，他依然信奉技术驱动，专注在大模型的研发上。

2025 年前三季度，MiniMax 实现营业收入 3.75 亿元，但研发投入高达 12.63 亿元，是同期营收的 3 倍多。这种专注，不仅让他们挺过了 DeepSeek 的冲击，还找到了引领世界的创新点。

在去年 10 月发布的文本大模型 MiniMax-M2 中，他们首创了" 交错思维 " 机制，让推理模型在做事前，先停下来思考一下。

这种 " 行动—停下来思考—再行动 " 的循环，显著提升了推理模型的可靠性。在全球权威测评榜单 Artificial Analysis 中，MiniMax-M2 的总分位列开源第一，国内外的大模型都迅速学习，补齐了类似能力。

对比 DeepSeek 用极致的工程优化榨干每一分算力，MiniMax 更加剑走偏锋，以算法突破和机制创新撬动无限可能。

而让人震惊的是，这个世界级的 AI 新贵，员工总数才 385 人（截至 2025 年 9 月）。而且团队中没有 " 硅谷天才 " 坐镇，很多人都是第一份工作。

图源：闫俊杰参加《罗永浩的十字路口》

AI 圈不都在高薪挖天才吗？为什么闫俊杰不挖呢？

因为他坚信AI 不是玄学，完全可以用第一性原理拆解成若干个明确的工程，诸如算法的设计、训练效率的优化、数据链路的搭建。

只要找到正确的科学方法，根本就不用所谓的天才，普通人也能创造出非凡价值。这种人才观念，又为公司省下了一大笔资金。

与此同时，闫俊杰也陷入了恐惧。因为当大模型可以被量化，也就意味着它会不断进步，最终必然超越人类。当做出成功的模型时，他会感到不安。

而战胜恐惧的，是公司会议室墙上的一行字—— Intelligence with Everyone。这是闫俊杰创业的初衷，让尖端 AI" 为人所用、与人同行 "。

早期投资人黄明明评价，"闫俊杰是一个‘狠人’，在资源等方方面面有限的情况下，他还是专注在模型研发上。只有这样的企业家可能才能走得更远，走到终局。"

AI 是中国不能输掉的一场比赛。

面对美国的算力优势，这个出生在河南小县城，在资源匮乏的环境中成长起来的俊杰，正在用有限的资源打造世界顶尖的 AI 公司。

" 如果未来全球只有五家 AI 公司，至少有两家中国公司，至少第二名是中国公司。"

这是闫俊杰的希望，更是他的长期目标。

* 文章为作者独立观点，不代表笔记侠立场。

好文阅读推荐：

下一个 10 年，商业的底层逻辑变了！

" 中国最有钱的 3 个男人 "，开战了

" 子弹笔记 "是笔记侠的矩阵公众号，聚焦职场效率追求、人际关系与高潜成长者，帮你 3 分钟吃透核心观点和方法论。欢迎关注～

分享、点赞、在看，3 连 3 连！

宙世代

一起剪

相关标签