当美团、华为开源，与寒武纪市值破万亿发生在同一日

国产模型与国产算力融合。图片经由 AI 处理

文丨谢瑞瑞

编辑丨苏扬

6 月 30 日，中国 AI 行业迎来了标志性的一天。

美团、华为 " 撞车 "，同日发布开源模型，算力芯片龙头寒武纪盘中突破 "10000 亿 " 市值，模型、芯片和资本共振。

美团新一代开源模型 LongCat-2.0，总参数达 1.6 万亿，测试版调用量跻身全球前三。

1.6 万亿参数的国产模型并不稀奇，与 4 月份上线的 DeepSeek 相当，重要的是这款模型完全基于国产算力训练——它反映的是 " 国模国芯 " 深度融合的趋势。

过去虽然也有基于国产算力训练的模型的先例，但还都达不到 1.6 万亿这种参数量。另一边，绝大多数模型虽然开始探索国产算力推理，但训练部分仍旧依赖英伟达芯片，这也是作为国产算力上市概念股的寒武纪，在横盘超过 9 个月之后，才向 10000 亿市值发起冲击的原因。

另一边，当 Mythos 5 这样的前沿模型，开始变相 " 出口管制 "，越来越多像美团、华为这样的中国公司推出开源模型，给全球 " 主权 AI" 用户，提供了多样化的可选项。

01 中国公司领跑开源

公开数据显示，开源大模型生态的增长速度惊人。

根据美国独立研究机构 Interconnects AI 发布的 ATOM 报告，从 2025 年 3 月到 2026 年 3 月，全球开源模型累计下载量从 3.39 亿增长到 20.4 亿，同比增长 6 倍。2024 年 11 月至 2026 年 1 月，中、美、欧开源模型使用量占比分别为 72.7%、10.4%、16.8%。

中、美、欧开源模型使用量图表

相较去年，中国同比增长 11.9 倍，美国 4.1 倍，欧洲 2.5 倍，下载量增速天差地别。

中国开源模型当中，阿里 Qwen 是一股重要的力量，并在过去一段时间持续 " 霸榜 "。2025 年 9 月，阿里 Qwen 的下载量首次超过 Meta Llama；到 2026 年 3 月，Qwen 累计下载 9.42 亿次，已是 Llama 的近两倍。

" 全球顶尖的八种模型中，三种来自中国。"2025 年 3 月，盖茨在纽约经济俱乐部讲座中提及。实际上，全球最大 AI 开源社区 Hugging Face 的榜单上，排名前十的开源大模型绝大多来自中国。

Meta 前首席 AI 科学家、图灵奖得主 Yann LeCun 也一直对中国开源模型保持夸夸模式，" 目前最好的开源模型来自中国，整个研究社区都在依赖它们。"

中国开源模型领跑，得益于人才、效率和国内开源普惠的优势。

清华大学智能产业研究院（AIR）创始院长张亚勤在 2026 夏达沃斯称，中国 AI 人才的培养规模约为美国的 5 倍，同时 DeepSeek 等依靠算力、电力带来的极致成本效率，正持续放开开源模型的全球竞争力。

中国开源大模型的 " 划时代 " 一战，是 DeepSeek R1 的亮相。

2025 年 1 月 20 日，DeepSeek 发布开源模型 R1。一周后，英伟达股价暴跌约 17%，市值蒸发 5900 亿美元，这在当时被解读为 " 市场对巨资构建 AI 大语言模型的合理性和前景产生质疑。"

如 AI 泰斗吴恩达做出的判断：当时美国遏制中国 AI 发展，反而倒逼出一条效率极高的 " 第二增长曲线。" 根据 DeepSeek 技术报告显示，DeepSeek V3 模型，训练仅使用了一个由 2048 块 H800 组成的集群。

原 HuggingFace 亚太生态负责人王铁震提到，目前 DeepSeek 的强化学习训练算法正直接提升着美国实验室的产出效率。" 许多中国开源模型权重都运行在美国硬件上。" 中国开源模型，也在加速美国闭源模型的进化。

相比之下，闭源模型的控制权在单一厂商手里，也易受到监管约束。

此前，Fable 5 和 Mythos 5" 全球下线 "。在经过一系列封号、漏洞修复等处理后又重新上线，但开放后的 Fable 5 系列，非美国公民无法使用 ‌。‌‌‌

" 美国政府对于顶尖模型越来越多的限制，将把更多用户推入中国 AI 模型的怀抱。"《经济学人》对此举评价道。

阿里巴巴集团主席蔡崇信的观察是，欧洲的高管、科学家，最在意的也是 " 主权 "。他们怕技术被 " 一键关停 "、怕数据交出去就再也收不回。" 开源正好能解决这两个问题。模型下载到自己的数据中心，跟原始制造商就没关系了，数据也能留在自己的防火墙内。"

目前，开源成了大模型的 " 集体信仰 "，国内主要模型几乎全数开源：DeepSeek、Qwen、Kimi、混元、小米 MiMo 等无一例外。

与此同时，中国大模型的迭代速度也越来越快。模型的更新周期，从过去的 " 半年一代 " 缩短到 " 一月数款 "。有网友在 X 上向马斯克提问 ," 中国大模型预计何时能够达到 Anthropic 的 Fable 水平？" 马斯克预测（2027 年）一季度。

之后，智谱 AI 创始人唐杰回复马斯克：" 用不了这么久。（Won ’ t take that long）。"

从 " 追赶者 " 变为 " 领跑者 "，中国开源模型只用了一年的时间。只不过，在跑得快的同时，中国大模型还得迈过算力自主的第二道坎。

02 重估国产算力

过去很长一段时间，模型训练依赖英伟达的 GPU，但随着美国出口管制不断收紧，Hopper 系列、Blackwell 系列之后的多款先进芯片均被禁止出口到中国。

2025 年，黄仁勋多次表态，中国市场的销量将为零。刚刚结束的英伟达 2026 年度股东大会上，黄仁勋透露，2026 财年英伟达来自中国的营收占比已降至约 9%。

《金融时报》报道援引一位交易员的消息，称受出口管制的影响，英伟达的非合规产品价格普遍暴涨，RTX 6000 Pro 类算力相对较低的产品，价格也已从年初约 5 万元人民币涨至最高 13 万元人民币，上涨了 160%。

一道又一道出口禁令，迫使大量算力需求向国内释放，给 " 寒武纪们 " 创造了最好的市场机会。6 月 30 日，寒武纪盘中市值冲破 10000 亿，是国产算力被重估的最好说明。

我们在文章开头提到，越来越多的国产模型，在推理层面引入国产算力。

4 月底上线的 DeepSeek V4，其技术报告首次将昇腾 NPU 与英伟达 GPU 并列验证，这是 DeepSeek 把推理路径从单一硬件依赖中解耦出来的尝试。与此同时，完成超 500 亿融资之后，DeepSeek 也开始推动数据中心建设，这相当于国产算力的增量空间。

梁文锋想 " 烧 " 多少钱，国产算力就有多大机会。

6 月 17 日，智谱上线并开源新一代旗舰大模型 GLM-5.2，昇腾、平头哥、摩尔线程等国产算力平台当天即完成 "Day 0" 级别推理适配，在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。

越来越多的中国模型开始释放需求，但国产算力的供给也面临挑战。

" 一卡难求，包括我自己，我们虽然生产卡，但是我想用卡也很难。" 华为昇腾内部专家在一次沟通会上表示。

2025 年初，由于市面上还能抢到英伟达和 AMD 等提供的合规产品，彼时业内对国产卡的态度几乎都是 " 好不好用 " 的问题；但在过去一年多海外算力断供的真空期，中国大模型面临的则是 " 不得不用 " 的问题。

如果说 DeepSeek 们在推理上迈出了匹配国产算力的关键一步，美团则是通过 1.6 万亿参数的 Long-Cat 2.0 上，打开了国产算力训练的想象空间。

中国算力和中国模型的融合，走了很长一段时间，像是《荷马史诗》里那场十年的 " 奥德赛时期 " ——漫长、又充满着不确定性。

宙世代

一起剪

相关标签