驱动之家 16小时前
严防死守!美国AI三巨头封杀中国模型蒸馏
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 7 日消息,OpenAI、Anthropic、谷歌正通过 2023 年联合微软成立的前沿模型论坛(FMF)共享信息,联手侦测并遏制中国 AI 企业的 " 对抗性蒸馏 " 行为,以阻止其窃取先进模型成果、抢占全球 AI 竞赛优势。目前该论坛成员还包括亚马逊与 Meta,这场罕见的巨头合作,凸显了美国 AI 行业对中国竞争对手的警惕。

对抗性蒸馏是指第三方未经授权,通过技术手段复制专有 AI 模型能力的行为。OpenAI 已证实参与相关信息共享,并在提交给美国国会的备忘录中,指控中国企业深度求索(DeepSeek)" 搭便车 ",利用美国 AI 公司技术壮大自身,Anthropic、谷歌及 FMF 均未置评。

而 Anthropic 去年已禁止中资企业使用其 Claude 模型,今年 2 月更直接点名深度求索、月之暗面、MiniMax 三家中国公司,称其通过蒸馏非法提取模型能力。谷歌也在官方博客中表示,已观察到模型提取攻击呈上升趋势。

蒸馏技术本是 AI 行业常用手段,企业可借此训练更高效的小型模型,或供外部开发者非竞争使用。

值得注意的是,针对美国企业的指控,深度求索早已在权威平台作出回应。2025 年 9 月,由 DeepSeek 团队完成、梁文锋担任通讯作者的 DeepSeek-R1 研究论文,登上国际权威期刊《Nature》封面,这也是全球首个经过独立同行评审的主流大语言模型,论文补充了大量技术细节,正面回应了 " 模型蒸馏 " 的相关质疑。该论文历经 7 个月审核、8 位外部专家评审,审稿文件达 64 页,充分体现了其科学性与严谨性。

DeepSeek 在论文中明确表示,其 R1 模型的基座模型 DeepSeek-V3-Base,训练数据仅来自普通网页和电子书,不包含任何合成数据。

在预训练冷却阶段,也未故意加入 OpenAI 生成的合成数据,所用数据均为网页抓取所得。不过该公司也坦诚,部分网页中包含大量 OpenAI 模型生成的答案,这可能让基础模型间接受益于其他强大模型的知识。

此外,DeepSeek 强调,DeepSeek-V3-Base 的数据截止时间为 2024 年 7 月,彼时各类公开的先进推理模型尚未发布,这进一步降低了无意从现有推理模型中蒸馏的可能性。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 谷歌 美国 中国企业 美国国会
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论