
智东西
作者 | 陈骏达
编辑 | 李水青
智东西 1 月 20 日消息,今天,据外媒 CNBC 报道,两位知情人士透露,北京大模型独角兽月之暗面正在进行新一轮融资,这轮融资对其估值为 48 亿美元(约合人民币 334.13 亿元),而仅在 20 天前公布的 C 轮融资中其估值还是 43 亿美元(约合人民币 299.32 亿元)。
此外,上述知情人士透露,由于市场需求旺盛,这轮融资很可能很快完成,随着市场对中国 AI 领域的 IPO 候选公司的兴趣激增,月之暗面在随后可能进行的融资轮次中,估值还有进一步上升的空间。
智东西就上述内容向月之暗面求证,对方称暂时无更多消息可供分享。
在月之暗面 2025 年 12 月 31 日曝光的内部信中,月之暗面创始人兼 CEO 杨植麟透露了该公司目前的资金状况。月之暗面近期完成了5 亿美元(约合人民币 34.8 亿元)C 轮融资且大幅超募,当前现金持有量超过 100 亿元。
杨植麟称,相比于二级市场,月之暗面判断还可以从一级市场募集更大量资金,短期不着急上市,但未来计划将上市作为手段来加速 AGI,择时而动。
技术层面,杨植麟则在 1 月 10 日举办的 AGI Next 峰会上分享了不少细节。目前,Kimi 模型的预训练策略聚焦两条主线:Token 效率与长上下文能力。

在提升 token 效率方面,月之暗面去年提出了改进版的 Muon 优化器,实现约 2 倍 Token 效率提升,并通过 QK-Clip 解决 Logits 爆炸问题,支撑万亿参数模型稳定训练。Token 效率的提升,意味着月之暗面可以从等量的数据中,获得更多的智能。
而在长上下文能力方面,月之暗面提出了 Kimi-Linear 这一全新的线性注意力机制,可在在保证效果的同时大幅提升推理速度,为超长上下文任务提供现实路径。
模型与产品侧,月之暗面去年开源了万亿参数模型 Kimi K2及其对应的推理模型 Kimi K2 Thinking,还推出了 OK Computer 这一 Agent 模式。
大模型调用平台 OpenRouter 的统计显示,Kimi K2 系列模型的调用量在发布后占据了一定的市场份额。
2024 年 11 月 -2025 年 11 月,在 OpenRouter 平台上,月之暗面模型的调用量为 0.92 万亿个 token,在开源模型玩家中排名全球第九,略少于智谱(1.18 万亿个 token)、MiniMax(1.26 万亿个 token)等厂商。OpenRouter 数据主要反映海外市场的使用情况。

在今年英伟达创始人兼 CEO 黄仁勋的 CES 演讲中,Kimi K2 Thinking 取代了此前英伟达发布会上常见的 DeepSeek-R1,被用于演示英伟达 Rubin NVL72 系统的性能。

对于下一代模型 Kimi K3 的演进方向,杨植麟在 AGI Next 峰会上分享,月之暗面会在 K2 的基础上做进一步的 Scaling,不过 Scaling 不只是堆算力,更是架构、数据与 " 品味 " 的综合进化。
他尤其强调,造模型本质上是在创造一种世界观,模型也需要具备更好的品味和审美。他认为,模型产生的智能本质上是一个 Non-Fungible Token(非同质化通证),它承载着品味、审美与价值观。在智能的维度上,品味拥有极其广阔的探索空间,而且这一空间是指数级扩展的,这是月之暗面未来很重要的目标。
结语:中国大模型头部企业,备齐下一阶段筹码
2026 年开年以来,多家中国大模型头部企业在资本市场收获颇丰。接连上市的智谱与 MiniMax 股价飞涨,MiniMax 更是成为国内首家市值超过 1000 亿元的 AI 大模型公司。
估值在短时间内连续抬升,叠加充裕的现金储备,月之暗面或许已具备在未来一段时间内持续加码投入的底气。此前,杨植麟透露 C 轮融资将会用于更加激进地扩增显卡,加速 K3 模型的训练和研发。
接下来,月之暗面能否在中国乃至全球大模型格局中占据更稳固的位置,值得继续关注。


登录后才可以发布评论哦
打开小程序可以发布评论哦