快科技 4 月 7 日消息,OpenAI、Anthropic、谷歌正通过 2023 年联合微软成立的前沿模型论坛(FMF)共享信息,联手侦测并遏制中国 AI 企业的 " 对抗性蒸馏 " 行为,以阻止其窃取先进模型成果、抢占全球 AI 竞赛优势。目前该论坛成员还包括亚马逊与 Meta,这场罕见的巨头合作,凸显了美国 AI 行业对中国竞争对手的警惕。
对抗性蒸馏是指第三方未经授权,通过技术手段复制专有 AI 模型能力的行为。OpenAI 已证实参与相关信息共享,并在提交给美国国会的备忘录中,指控中国企业深度求索(DeepSeek)" 搭便车 ",利用美国 AI 公司技术壮大自身,Anthropic、谷歌及 FMF 均未置评。
而 Anthropic 去年已禁止中资企业使用其 Claude 模型,今年 2 月更直接点名深度求索、月之暗面、MiniMax 三家中国公司,称其通过蒸馏非法提取模型能力。谷歌也在官方博客中表示,已观察到模型提取攻击呈上升趋势。
蒸馏技术本是 AI 行业常用手段,企业可借此训练更高效的小型模型,或供外部开发者非竞争使用。
值得注意的是,针对美国企业的指控,深度求索早已在权威平台作出回应。2025 年 9 月,由 DeepSeek 团队完成、梁文锋担任通讯作者的 DeepSeek-R1 研究论文,登上国际权威期刊《Nature》封面,这也是全球首个经过独立同行评审的主流大语言模型,论文补充了大量技术细节,正面回应了 " 模型蒸馏 " 的相关质疑。该论文历经 7 个月审核、8 位外部专家评审,审稿文件达 64 页,充分体现了其科学性与严谨性。
DeepSeek 在论文中明确表示,其 R1 模型的基座模型 DeepSeek-V3-Base,训练数据仅来自普通网页和电子书,不包含任何合成数据。
在预训练冷却阶段,也未故意加入 OpenAI 生成的合成数据,所用数据均为网页抓取所得。不过该公司也坦诚,部分网页中包含大量 OpenAI 模型生成的答案,这可能让基础模型间接受益于其他强大模型的知识。
此外,DeepSeek 强调,DeepSeek-V3-Base 的数据截止时间为 2024 年 7 月,彼时各类公开的先进推理模型尚未发布,这进一步降低了无意从现有推理模型中蒸馏的可能性。



登录后才可以发布评论哦
打开小程序可以发布评论哦