严防死守！美国AI三巨头封杀中国模型蒸馏

快科技 4 月 7 日消息，OpenAI、Anthropic、谷歌正通过 2023 年联合微软成立的前沿模型论坛（FMF）共享信息，联手侦测并遏制中国 AI 企业的 " 对抗性蒸馏 " 行为，以阻止其窃取先进模型成果、抢占全球 AI 竞赛优势。目前该论坛成员还包括亚马逊与 Meta，这场罕见的巨头合作，凸显了美国 AI 行业对中国竞争对手的警惕。

对抗性蒸馏是指第三方未经授权，通过技术手段复制专有 AI 模型能力的行为。OpenAI 已证实参与相关信息共享，并在提交给美国国会的备忘录中，指控中国企业深度求索（DeepSeek）" 搭便车 "，利用美国 AI 公司技术壮大自身，Anthropic、谷歌及 FMF 均未置评。

而 Anthropic 去年已禁止中资企业使用其 Claude 模型，今年 2 月更直接点名深度求索、月之暗面、MiniMax 三家中国公司，称其通过蒸馏非法提取模型能力。谷歌也在官方博客中表示，已观察到模型提取攻击呈上升趋势。

蒸馏技术本是 AI 行业常用手段，企业可借此训练更高效的小型模型，或供外部开发者非竞争使用。

值得注意的是，针对美国企业的指控，深度求索早已在权威平台作出回应。2025 年 9 月，由 DeepSeek 团队完成、梁文锋担任通讯作者的 DeepSeek-R1 研究论文，登上国际权威期刊《Nature》封面，这也是全球首个经过独立同行评审的主流大语言模型，论文补充了大量技术细节，正面回应了 " 模型蒸馏 " 的相关质疑。该论文历经 7 个月审核、8 位外部专家评审，审稿文件达 64 页，充分体现了其科学性与严谨性。

DeepSeek 在论文中明确表示，其 R1 模型的基座模型 DeepSeek-V3-Base，训练数据仅来自普通网页和电子书，不包含任何合成数据。

在预训练冷却阶段，也未故意加入 OpenAI 生成的合成数据，所用数据均为网页抓取所得。不过该公司也坦诚，部分网页中包含大量 OpenAI 模型生成的答案，这可能让基础模型间接受益于其他强大模型的知识。

此外，DeepSeek 强调，DeepSeek-V3-Base 的数据截止时间为 2024 年 7 月，彼时各类公开的先进推理模型尚未发布，这进一步降低了无意从现有推理模型中蒸馏的可能性。

宙世代

一起剪

相关标签