
国产模型与国产算力融合。图片经由 AI 处理
文丨谢瑞瑞
编辑丨苏扬
6 月 30 日,中国 AI 行业迎来了标志性的一天。
美团、华为 " 撞车 ",同日发布开源模型,算力芯片龙头寒武纪盘中突破 "10000 亿 " 市值,模型、芯片和资本共振。
美团新一代开源模型 LongCat-2.0,总参数达 1.6 万亿,测试版调用量跻身全球前三。
1.6 万亿参数的国产模型并不稀奇,与 4 月份上线的 DeepSeek 相当,重要的是这款模型完全基于国产算力训练——它反映的是 " 国模国芯 " 深度融合的趋势。
过去虽然也有基于国产算力训练的模型的先例,但还都达不到 1.6 万亿这种参数量。另一边,绝大多数模型虽然开始探索国产算力推理,但训练部分仍旧依赖英伟达芯片,这也是作为国产算力上市概念股的寒武纪,在横盘超过 9 个月之后,才向 10000 亿市值发起冲击的原因。
另一边,当 Mythos 5 这样的前沿模型,开始变相 " 出口管制 ",越来越多像美团、华为这样的中国公司推出开源模型,给全球 " 主权 AI" 用户,提供了多样化的可选项。
公开数据显示,开源大模型生态的增长速度惊人。
根据美国独立研究机构 Interconnects AI 发布的 ATOM 报告,从 2025 年 3 月到 2026 年 3 月,全球开源模型累计下载量从 3.39 亿增长到 20.4 亿,同比增长 6 倍。2024 年 11 月至 2026 年 1 月,中、美、欧开源模型使用量占比分别为 72.7%、10.4%、16.8%。

中、美、欧开源模型使用量图表
相较去年,中国同比增长 11.9 倍,美国 4.1 倍,欧洲 2.5 倍,下载量增速天差地别。
中国开源模型当中,阿里 Qwen 是一股重要的力量,并在过去一段时间持续 " 霸榜 "。2025 年 9 月,阿里 Qwen 的下载量首次超过 Meta Llama;到 2026 年 3 月,Qwen 累计下载 9.42 亿次,已是 Llama 的近两倍。
" 全球顶尖的八种模型中,三种来自中国。"2025 年 3 月,盖茨在纽约经济俱乐部讲座中提及。实际上,全球最大 AI 开源社区 Hugging Face 的榜单上,排名前十的开源大模型绝大多来自中国。
Meta 前首席 AI 科学家、图灵奖得主 Yann LeCun 也一直对中国开源模型保持夸夸模式," 目前最好的开源模型来自中国,整个研究社区都在依赖它们。"
中国开源模型领跑,得益于人才、效率和国内开源普惠的优势。
清华大学智能产业研究院(AIR)创始院长张亚勤在 2026 夏达沃斯称,中国 AI 人才的培养规模约为美国的 5 倍,同时 DeepSeek 等依靠算力、电力带来的极致成本效率,正持续放开开源模型的全球竞争力。
中国开源大模型的 " 划时代 " 一战,是 DeepSeek R1 的亮相。
2025 年 1 月 20 日,DeepSeek 发布开源模型 R1。一周后,英伟达股价暴跌约 17%,市值蒸发 5900 亿美元,这在当时被解读为 " 市场对巨资构建 AI 大语言模型的合理性和前景产生质疑。"
如 AI 泰斗吴恩达做出的判断:当时美国遏制中国 AI 发展,反而倒逼出一条效率极高的 " 第二增长曲线。" 根据 DeepSeek 技术报告显示,DeepSeek V3 模型,训练仅使用了一个由 2048 块 H800 组成的集群。
原 HuggingFace 亚太生态负责人王铁震提到,目前 DeepSeek 的强化学习训练算法正直接提升着美国实验室的产出效率。" 许多中国开源模型权重都运行在美国硬件上。" 中国开源模型,也在加速美国闭源模型的进化。
相比之下,闭源模型的控制权在单一厂商手里,也易受到监管约束。
此前,Fable 5 和 Mythos 5" 全球下线 "。在经过一系列封号、漏洞修复等处理后又重新上线,但开放后的 Fable 5 系列,非美国公民无法使用 。
" 美国政府对于顶尖模型越来越多的限制,将把更多用户推入中国 AI 模型的怀抱。"《经济学人》对此举评价道。
阿里巴巴集团主席蔡崇信的观察是,欧洲的高管、科学家,最在意的也是 " 主权 "。他们怕技术被 " 一键关停 "、怕数据交出去就再也收不回。" 开源正好能解决这两个问题。模型下载到自己的数据中心,跟原始制造商就没关系了,数据也能留在自己的防火墙内。"
目前,开源成了大模型的 " 集体信仰 ",国内主要模型几乎全数开源:DeepSeek、Qwen、Kimi、混元、小米 MiMo 等无一例外。
与此同时,中国大模型的迭代速度也越来越快。模型的更新周期,从过去的 " 半年一代 " 缩短到 " 一月数款 "。有网友在 X 上向马斯克提问 ," 中国大模型预计何时能够达到 Anthropic 的 Fable 水平?" 马斯克预测(2027 年)一季度。
之后,智谱 AI 创始人唐杰回复马斯克:" 用不了这么久。(Won ’ t take that long)。"

从 " 追赶者 " 变为 " 领跑者 ",中国开源模型只用了一年的时间。只不过,在跑得快的同时,中国大模型还得迈过算力自主的第二道坎。
过去很长一段时间,模型训练依赖英伟达的 GPU,但随着美国出口管制不断收紧,Hopper 系列、Blackwell 系列之后的多款先进芯片均被禁止出口到中国。
2025 年,黄仁勋多次表态,中国市场的销量将为零。刚刚结束的英伟达 2026 年度股东大会上,黄仁勋透露,2026 财年英伟达来自中国的营收占比已降至约 9%。
《金融时报》报道援引一位交易员的消息,称受出口管制的影响,英伟达的非合规产品价格普遍暴涨,RTX 6000 Pro 类算力相对较低的产品,价格也已从年初约 5 万元人民币涨至最高 13 万元人民币,上涨了 160%。
一道又一道出口禁令,迫使大量算力需求向国内释放,给 " 寒武纪们 " 创造了最好的市场机会。6 月 30 日,寒武纪盘中市值冲破 10000 亿,是国产算力被重估的最好说明。
我们在文章开头提到,越来越多的国产模型,在推理层面引入国产算力。
4 月底上线的 DeepSeek V4,其技术报告首次将昇腾 NPU 与英伟达 GPU 并列验证,这是 DeepSeek 把推理路径从单一硬件依赖中解耦出来的尝试。与此同时,完成超 500 亿融资之后,DeepSeek 也开始推动数据中心建设,这相当于国产算力的增量空间。
梁文锋想 " 烧 " 多少钱,国产算力就有多大机会。
6 月 17 日,智谱上线并开源新一代旗舰大模型 GLM-5.2,昇腾、平头哥、摩尔线程等国产算力平台当天即完成 "Day 0" 级别推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。
越来越多的中国模型开始释放需求,但国产算力的供给也面临挑战。
" 一卡难求,包括我自己,我们虽然生产卡,但是我想用卡也很难。" 华为昇腾内部专家在一次沟通会上表示。
2025 年初,由于市面上还能抢到英伟达和 AMD 等提供的合规产品,彼时业内对国产卡的态度几乎都是 " 好不好用 " 的问题;但在过去一年多海外算力断供的真空期,中国大模型面临的则是 " 不得不用 " 的问题。
如果说 DeepSeek 们在推理上迈出了匹配国产算力的关键一步,美团则是通过 1.6 万亿参数的 Long-Cat 2.0 上,打开了国产算力训练的想象空间。
中国算力和中国模型的融合,走了很长一段时间,像是《荷马史诗》里那场十年的 " 奥德赛时期 " ——漫长、又充满着不确定性。


登录后才可以发布评论哦
打开小程序可以发布评论哦