笔记侠 昨天
总理座谈会上的年轻人,春节暴涨超千亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

The following article is from 华商韬略 Author 华商韬略

内容来源:本文转载自微信公众号华商韬略 ( hstl8888 ) ,笔记侠经授权转载。转载请联系原公众号授权。

责编  | 柒  排版  | 拾零

第 9465  篇深度好文:4909  字 | 13 分钟阅读

商业趋势

笔记君说:

去年底因为参加总理座谈会而备受瞩目的闫俊杰,真正是度过了一个马上暴富的春节:

腊月 25 至正月初五,他创立的上海稀宇极智科技有限公司(MiniMax),股价从 500 多元飙升至近千元,市值也拉升到超过 3000 亿港元。

一个春节,暴涨超千亿。

一、干得早

闫俊杰和大多数 AI 创业者一样,是天才,也是超级学霸。

1989 年出生于河南一座小县城的他,在中国科学院自动化所完成博士学业,之后又在清华大学计算机系从事博士后研究。

2015 年,闫俊杰加入了当时的 AI 领军企业商汤科技,并快速晋升为公司副总裁、研究院副院长及智慧城市事业群 CTO,参与和主导了商汤深度学习工具链及通用智能技术体系搭建,并发表顶级会议和期刊论文 100 余篇,成为业内公认的顶级专家。

2021 年底,已是商汤副总裁的闫俊杰决定辞职,创业成立 MiniMax。

彼时的商汤科技即将港股上市,以闫俊杰的职级,如果不辞职很可能成为亿万富翁。

放弃既得的大好钱程,冒险重新开始,是因为闫俊杰对 AI 的发展有了新的思考。

当时的 AI 炒得火热,大量资金涌入,发展却远不及预期。也就应用于人脸识别、语音识别领域,创造的社会价值不高,甚至被调侃为人工智障。

核心问题在于 AI 不够通用。当时行业用虚拟模型解决客户的问题,每做一个模型就要训练一次。

一旦客户有多个问题,就得训练多个模型,直接导致成本高、周期长、效率低。

能否摆脱这种为每个任务专门定制模型的路径,面向更广泛人群的需求,开发一个通用的模型,让 AI 像水电一样普及,融入并改变人们的生活呢?

比如,一款能回答大家各种问题的模型,一款能帮助大家写作的模型……闫俊杰认为,这是有可能的。

更进一步思考后,他开始为这种可能性感到兴奋,感到时不我待,希望自己可以亲手将它做出来。

于是,他做出让很多人意外的决定,于 2021 年底成立了 MiniMax ‌,毅然决然地希望做出自己的通用大模型。

现在回头看,他的这一时间选择可谓是相当美妙:

就在 2022 年底,OpenAI 发布的 ChatGPT 爆火全球,也让通用大模型成为全球科技浪潮的暴风口。

二、看得准

MiniMax 的创立顺应了大势,但其发展,相当程度上却都是逆行业而行。

当大模型爆火后,大多数 AI 公司都集中资源先精一项。MiniMax 却从一开始就无视文本、语音、视频的界限,坚持全模态自研,想实现全精通。

这种 " 不聚焦 " 的战略,很可能贪多嚼不烂,让许多投资者忧心忡忡。但闫俊杰认为,只有全模态才能逼近人类智能交互能力。

在目标用户上,大多数 AI 公司深耕面向企业或组织的 B 端。MiniMax 却双拳出击,不仅深抓 B 端,更发布了众多面向个人消费者的 C 端产品,诸如 Talkie、海螺 AI、MiniMax Agent 等。

而且从创业伊始,闫俊杰就将主要精力侧重到具备付费习惯的海外市场。一些产品甚至是" 海外先行,国内跟进 ",比如 2023 年 6 月,AI 社交应用 Talkie 登陆欧美市场,火了之后才推出国内版 " 星野 "。

在技术路线上,闫俊杰更是孤注一掷,豪赌未来

2023 年下半年,他力排众议,坚持从行业常用的 Dense 架构,转向混合专家系统的 MoE 架构。而且不是小幅调整,是全力转向,几乎投入了公司所有的算力资源。

Dense 架构的核心特征是每次计算都‌全员参与,这种方式效率低且‌资源消耗大,但也有结构简单、训练稳定的优点。

MoE 架构的预训练难度更高,但能显著降低算力消耗和使用成本,实现更高的效率。

当时,大多数公司都选择了更简单、稳定的 Dense 架构。但闫俊杰认为,未来的发展会对算力和资源消耗提出更大要求。只有在算力和消耗上省下成本,才会更有竞争力。

" 不管有钱的大厂,还是没有钱的创业公司,(中国公司)在算力层面的投入可能要比美国公司小 1-2 个数量级。这是接下来两三年内非常确定的事情。"

如何用更少的资金和算力追上美国,成为了最迫切的事情,闫俊杰反复思考后的答案就是,转向 MoE 架构。

" 你会发现这不是选择,而是你能够想到的唯一一条路,只有那一条路可以通向你的目标。当时只能这样,如果做不出来就完了。"

这是一场豪赌,失败了就会出局。后来的经历也是相当艰险,连续两次转型,结果都失败了,如果第三次继续失败,公司很可能走向终局。

好在第三次成功了,公司不但活了下来,而且提前走到了正确的道路上,赢得了先机。

如闫俊杰所料,AI 大爆发之后,MoE 架构的技术路线逐渐成为行业主流。

抢先布局的 MiniMax,在 2024 年 1 月上线了国内首个 MoE 大模型 abab,不但引领了国内行业,而且仅以累计 5 亿美元的投资,约行业龙头 OpenAI 花销的百分之一,就跻身世界 AI 的第一梯队。

闫俊杰另两个反向而行—— C 端产品和 " 全模态 ",也都获得了成功。

如今,MiniMax 已经跑出了多个畅销全球的 C 端产品,拥有超 2 亿个人用户,覆盖 200 多个国家及地区。

其中,主打视频生成的海螺 AI,全球用户数突破 4000 万,其生成的高质量视频连马斯克都点赞过。专注于 AI 角色陪伴与虚拟社交的 Talkie,更是在全球爆火,用户数达到惊人的 1.47 亿名。

图源:海螺 AI

而且这些应用的用户大多来自海外,尤其是美国,堪称真正的 " 国际明星 "。

在 MiniMax 的营收中,已有超过 70% 为海外市场贡献

多模态的坚持,则让 MiniMax 成为" 全球唯四全模态进入第一梯队 "的大模型企业。它的语音模型 Speech-02、视频模型 Hailuo-02、文本模型 MiniMax M2,都在权威评测中达到全球顶尖水平。

这也就意味着,它可以最大限度地争取用户。无论是语音、视频、文本,甚至是音乐,它都能够满足需求。更关键的是,多模态可以融合,成就全能 AI。

这些综合起来,共同筑成了 MiniMax 的王座。

2024 年,仅仅成立三年的 MiniMax,年营收达到 2.14 亿元,同比增长 782.2%。

卓越的表现,不仅让 MiniMax 与月之暗面、智谱 AI、阶跃星辰、百川智能、零一万物并称为中国大模型 " 六小虎 ",而且还是估值最高的小虎,受到了腾讯、IDG、高瓴创投、米哈游等资本的狂热追捧。

2025 年初,MiniMax 满怀信心,上线了拥有 4560 亿参数的开源大模型 MiniMax-01,期望以此巩固技术领先优势。

然而,一个巨大的挑战席卷而来。

三、挺得住

MiniMax-01 上线没几天,整个国内乃至世界 AI 圈都迎来了一件王炸级事件:

DeepSeek-R1 横空出世,凭借推理模型的革命性技术爆火出圈,而且完全开源。

几乎是一夜之间,全球 AI 都在讨论,甚至畏惧着 DeepSeek 这家此前堪称默默无闻的公司,腾讯、百度等巨头,乃至各行各业也都纷纷接入其模型。

对于国家来说,这是国运级的科技成果。但对于很多大模型初创企业来说,这就是天塌了。

王者已现且气势如虹的压力之下,一众还在为大模型准备的初创公司,要么弃赛,要么接入,要么转行,继续坚持做自己的模型被认为是最危险的选择。

但闫俊杰选择了继续坚持做自己的模型。

很多人以为 MiniMax 会就此坠入深谷,闫俊杰也感觉大山压肩,但他化压力为动力,最困难时刻最大力度爆发,集中一切力量,继续孤注一掷,研发新一代的推理模型。

半年之后,格局再次被扭转了。

当年 6 月 17 日,MiniMax 上线了自主研发的 MiniMax-M1,不但赢得了" 全球首个开源大规模混合架构的推理模型 "的占位,还凭借支持 100 万 Tokens 的上下文输入(8 倍于 DeepSeek-R1),以及卓越的长文本理解等关键能力,在 DeepSeek-R1 之外,打出了自己的优势,也赢得不少赞誉。

虎口脱险般的闫俊杰,还发了一条意味深长的朋友圈:

" 第一次感觉到大山不是不能翻越。"

而这还不是全部。之后的 4 天,MiniMax 以 " 日更 " 的方式,陆续发布了全新视频生成大模型 Hailuo 02、通用智能体产品 MiniMax Agent、视频创作智能体 Hailuo Video Agent、音色设计产品 Voice Design。

5 天时间,5 款重磅模型和产品,MiniMax 不仅重新坐上了牌桌,还吸引了 " 教主 " 黄仁勋的注意。

图源:腾讯科技

当年 7 月,英伟达 CEO 黄仁勋在北京链博会上公开称赞 MiniMax,将其与阿里巴巴、百度等企业并称为 " 世界级 " 产品开发者。

链博会结束不久,黄仁勋又单独和闫俊杰会面,深入交谈了约两个小时。

此后的 MiniMax,开始好消息连连,并在 2026 年 1 月 9 日,于港交所正式挂牌上市,上市首日股价大幅上涨近 110%,市值超1000 亿港元

如今更是突破了 3000 亿港元,远高于老东家商汤科技,与另一家公司智谱 AI 并称为 " 大模型双雄 "。

四、站更高

闫俊杰的身上,有一个巨大的反差点。

他总是满脸笑容,说话慢条斯理,但内心杀伐果断。当整个 AI 圈都在追逐 DAU(日活跃用户数)时,他依然信奉技术驱动,专注在大模型的研发上。

2025 年前三季度,MiniMax 实现营业收入 3.75 亿元,但研发投入高达 12.63 亿元,是同期营收的 3 倍多。这种专注,不仅让他们挺过了 DeepSeek 的冲击,还找到了引领世界的创新点。

在去年 10 月发布的文本大模型 MiniMax-M2 中,他们首创了" 交错思维 " 机制,让推理模型在做事前,先停下来思考一下。

这种 " 行动—停下来思考—再行动 " 的循环,显著提升了推理模型的可靠性。在全球权威测评榜单 Artificial Analysis 中,MiniMax-M2 的总分位列开源第一,国内外的大模型都迅速学习,补齐了类似能力。

对比 DeepSeek 用极致的工程优化榨干每一分算力,MiniMax 更加剑走偏锋,以算法突破和机制创新撬动无限可能。

而让人震惊的是,这个世界级的 AI 新贵,员工总数才 385 人(截至 2025 年 9 月)。而且团队中没有 " 硅谷天才 " 坐镇,很多人都是第一份工作。

图源:闫俊杰参加《罗永浩的十字路口》

AI 圈不都在高薪挖天才吗?为什么闫俊杰不挖呢?

因为他坚信AI 不是玄学,完全可以用第一性原理拆解成若干个明确的工程,诸如算法的设计、训练效率的优化、数据链路的搭建。

只要找到正确的科学方法,根本就不用所谓的天才,普通人也能创造出非凡价值。这种人才观念,又为公司省下了一大笔资金。

与此同时,闫俊杰也陷入了恐惧。因为当大模型可以被量化,也就意味着它会不断进步,最终必然超越人类。当做出成功的模型时,他会感到不安。

而战胜恐惧的,是公司会议室墙上的一行字—— Intelligence with Everyone。这是闫俊杰创业的初衷,让尖端 AI" 为人所用、与人同行 "。

早期投资人黄明明评价,"闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。"

AI 是中国不能输掉的一场比赛。

面对美国的算力优势,这个出生在河南小县城,在资源匮乏的环境中成长起来的俊杰,正在用有限的资源打造世界顶尖的 AI 公司。

" 如果未来全球只有五家 AI 公司,至少有两家中国公司,至少第二名是中国公司。"

这是闫俊杰的希望,更是他的长期目标。

* 文章为作者独立观点,不代表笔记侠立场。

好文阅读推荐:

下一个 10 年,商业的底层逻辑变了!

" 中国最有钱的 3 个男人 ",开战了

" 子弹笔记 "是笔记侠的矩阵公众号,聚焦职场效率追求、人际关系与高潜成长者,帮你 3 分钟吃透核心观点和方法论。欢迎关注~

分享、点赞、在看,3 连 3 连! 

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

微信公众号 华商 the
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论