怎么看美国对Anthropic模型的出口管制？

美国这次对 Anthropic 的 Fable 5 和 Mythos 5 实施出口管制，目前公开信息没有说明具体法律依据是什么，但从现有情况看，最可能的解释是 BIS 使用了 " 告知函 "（is-informed letter）机制。除此之外，确实很难找到更合理的法律路径。

拜登时期《AI 扩散框架》以及 ECCN 4E091 对闭源模型权重的管制目前仍存在争议，有人认为相关规则实际上已经失效，也有人认为其法律上仍然有效。但无论如何，Fable 5 和 Mythos 5 本质上是云端提供的闭源模型服务，用户并不会获得模型权重，因此与 4E091 针对模型权重扩散的逻辑并不一致。

相比之下，告知函是更合理的解释。根据 EAR 第 744.11 ( c ) 条，BIS 即使在相关物项还没被正式纳入商业管制清单（CCL）的情况下，也可以通过个案通知的方式直接触发许可证要求。这种做法不需要经过漫长的联邦规则制定程序。如果 BIS 认为某项技术、产品或服务可能涉及军用最终用途、军用最终用户，或者对美国国家安全构成风险，就可以通过内部程序向企业发出通知。

过去几年，美国政府实际上多次采用这种方式作为正式规则出台前的过渡工具。A100、H100、H20、EDA 软件以及部分美国产半导体制造设备，都曾先通过告知函受到限制，之后再逐步写入 EAR 规则体系。由于告知函通常属于保密文件，企业收到后不得公开披露，因此外界很少能看到原文，大多数案例都是通过媒体报道或企业间接披露才进入公众视野。

另一个佐证，是 CNBC 今天披露这次事件的决策内幕，提到美国政府是上周五美东时间下午 1 点致电 Anthropic，要求停用这俩模型，Anthropic 不同意，然后就在当天美东时间下午 5 点半左右收到了 " 一封正式信函 "，要求其暂停发布这两款模型。

但这里也有个明显的问题，美国政府此次究竟在管制什么物项（item）？根据 Anthropic 自己的说法，政府要求其停止向外国人提供 Fable 5 和 Mythos 5 的访问权限，包括美国境内的外国公民，甚至 Anthropic 内部的外籍员工也受到影响。这说明政府实际限制的并不是模型权重，而是模型访问权和推理服务（inference service）。

然而，这恰恰构成了当前法律框架下最大的疑问。模型访问权和推理服务总体来说属于 " 服务 "。传统 EAR 主要围绕货物（commodities）、软件（software）和技术（technology）的出口、再出口和境内转移展开，而模型访问权和云端推理服务本质上更接近一种服务（service）。用户既不会获得模型权重，也不会接触底层代码。从严格意义上讲，现行 EAR 是否能够直接覆盖此类服务，并没有十分明确的答案。正在国会推进的《远程访问安全法》有机会填补这个漏洞，但现在前景还不明朗。

比法律依据本身更重要的问题是，BIS 这次通过告知函限制 Fable 5 和 Mythos 5 发布，究竟是一次临时补丁，还是未来前沿大模型出口管制的前奏。如果是后者，BIS 迟早要修改 EAR，建立一套专门针对前沿模型的规则。但在大模型发布场景下，它到底要管制什么？是模型权重、API 访问、推理服务，还是某种抽象的 " 模型能力 "？目前这个问题并没有清晰答案。

告知函可以快速出手，但合规成本极高，企业需要法律确定性。但任何对前沿模型搞的出口管制，在美国都是一个高度产业敏感、政治敏感的问题。我不确定美国政府是不是敢这么干，以及是不是已经想好了要怎么干。

过去几年，美国确实尝试过模型出口管制。拜登时代《AI 扩散框架》的思路，是用训练算力和模型是否闭源作为标准，对训练算力超过 10^26 FLOP 的闭源模型权重进行管制。但随着算法效率、后训练、蒸馏和合成数据技术快速进步，训练算力和模型实际能力之间的对应关系正在变弱。很多研究认为，美国头部开放权重模型，比如 Llama 4，可能已经超过 10^26 FLOP 门槛，此外，训练算力并不能准确捕捉监管真正关心的特定风险能力。Fable 5 被限制，核心问题显然不是训练算力本身，而是特定越狱漏洞以及网络攻击相关能力。

另一种可能路径，是从 " 算力门槛 " 转向 " 能力门槛 "。也就是说，不再问模型训练用了多少 FLOP，而是问模型能不能辅助高级网络攻击、能不能帮助合成大规模杀伤性武器相关材料、能不能进行高度自主欺骗或操控、能不能显著加速前沿模型研发。如果模型在某些危险能力基准上超过特定阈值，那么向特定国家或主体提供权重、访问权限或服务就需要许可证。

但这种能力管制也有明显缺陷。首先，模型能力如何评估，目前没有国际共识，美国内部不同机构如 METR、AISI 采用的测试方法也并不一致。其次，同一个模型经过微调、后训练或系统提示调整后，能力表现可能大幅变化，评估结果并不稳定。再次，BIS 本身并不是 AI 安全评测机构，而且在大幅裁员背景下，它是否具备独立完成复杂模型能力评估的技术能力，存在很大疑问。最终很可能仍要依赖企业自报、第三方测试或 AI 安全机构评估。

当然，BIS 也可以尝试设计一套 " 算力门槛 + 能力评估 " 的混合机制：以训练算力作为初步触发条件，再通过能力评测决定是否豁免、升级或施加额外限制。但双重标准只会让规则更加复杂，也更难执行。值得注意的是，特朗普政府最新行政令已经要求财政部和网络基础设施安全局等部门研究建立 " 受保护前沿模型（protected frontier models）" 评测体系。如果美国最终决定对大模型实施系统性出口管制，未来规则很可能会与这一评测框架挂钩。

不过总体而言，我对 " 大模型出口管制 " 这个概念本身仍持相当怀疑态度。传统出口管制体系，无论是 EAR 还是 ITAR，其底层逻辑都建立在对货物、软件和技术文件跨境流动的控制之上。但 AI 模型天然是数字化、无形化的产物，物理边界极弱。今天的前沿模型并不是存放在某台电脑或某个可以上锁的数据中心里，而是分布在庞大的全球云基础设施和算力集群之中。

更重要的是，模型权重一旦生成，理论上可以无限复制，不经过海关、不需要运输，也不存在传统意义上的 " 走私 "。即便能够限制闭源模型权重出口，也无法阻止蒸馏、微调、再训练以及开放权重模型的快速追赶。这会产生典型的 " 漏桶效应 "：限制越严格，市场越有动力寻找替代路径，而管制本身的边际效果则会不断递减。

对这次事件，伯恩斯坦最近发了一份题为《永远不要打断正在犯错的对手：中国 AI 迎来战略窗口》的报告，大意是说美国这么随便靠行政指令封禁模型，严重破坏全球对美国技术栈的信任，以后可能没有国家敢放心地依赖美国的模型，因为搞不好哪天就被美国一下子切断了访问。这也会迫使更多国家考虑构建自己的主权大模型，和更多转向中国的开源模型。伯恩斯坦甚至因为这个开始重估整个中美科技巨头的价值，直接给阿里定下了 180 美元的目标价。

乍一听，还是比较激动的，也觉得似乎很有道理，但后来认真想了下，觉得这个事要拆解开来条分缕析一下。

美国政府在 Mythos 模型问题上为什么如此谨慎，内部进行了这么多讨论和监管动作，是他们在故弄玄虚，还是美国模型的能力确实强到了这个程度？这是个事实问题，也是很关键的问题。

正常逻辑下，如果模型不具备战略价值，政府没有必要付出如此高的政治和行政成本去干预一家公司的产品发布。从目前公开披露的信息看，Mythos 所涉及的并不是泛泛意义上的聊天机器人能力，而是高度具体的漏洞发现、攻击路径分析和进攻性网络能力。如果这种能力确实接近网络武器级别，那么美国政府采取最高等级的风险控制措施，并非完全无法理解。

如果这个事实前提成立，美国政府基于长期的对华偏见，一定会认为，如果中国研究机构能够自由访问 Fable 5 或 Mythos 5，就有可能利用这些模型进行漏洞发现、攻击技术研究，甚至用于支持未来的进攻性网络行动。即使模型权重没有泄露，仅仅开放 API 访问，也足以让研究人员长期、大规模测试模型能力边界，理解其推理模式和能力结构。如果再考虑到在美工作的外国籍员工能够接触模型开发、评估和训练流程，那么相关知识完全可能通过人才流动、合作研究、开源复现等方式扩散出去。这或许也可以解释，为什么这次美国限制的对象是所有外国人，而不只是中国籍人员。

我从这件事里得到的最大启示，和伯恩斯坦不太一样，不是美国在犯错、中国会受益，而是：最强的模型是否掌握在中国的手中，未来是一个国家安全的问题，也是一个产业竞争的问题。

归根结底，模型能力仍然是真理和王道。长远看，模型能力上限决定了企业能够进入哪些应用场景。尤其是在 B 端市场，复杂推理、长链工具调用、代码生成、科研辅助、企业级 Agent 等高价值场景，客户最终看重的是模型能不能把事情做对、做好，而不是每百万 Token 便宜多少钱。成本优化当然重要，但它改善的是单位经济性，而不是能力上限。再低的成本，也无法把一个原本做不好复杂任务的模型变成可靠的高能力模型。

模型能力又反向塑造生态和数据优势。谁率先把能力推到更高水平，谁就更容易获得复杂真实的应用场景、更高质量的人类反馈、更强的开发者生态，以及后续产品化迭代所需的数据飞轮。一个更强的基础模型，可以通过量化、蒸馏和专用化微调不断衍生出更便宜的商业版本；但一个先天能力不足的模型，很难仅靠工程优化突破能力天花板。

Anthropic 在企业市场的表现其实已经说明了这一点。据报道，全球不少科技公司、咨询机构、律所和金融机构的研发团队，都在通过各种方式访问 Claude 和 GPT，并基于这些美国模型构建自己的 Agent 和工作流。因为在部分高难度任务上，中国模型与美国前沿模型之间仍然存在可感知的能力差距，而这些任务往往对应的正是价值最高的企业级应用场景。对于高价值客户而言，美国模型创造的价值和节省的人力成本，远远超过其额外增加的推理成本。

此外，对 B 端客户来说，模型切换从来不只是更换一个 API Key，而是涉及 Agent 流程重构、提示词体系重写、安全审计、合规认证、云基础设施适配以及组织内部培训等一系列成本。对于已经深度绑定美国云服务和 CUDA 生态的企业而言，这往往是一次组织级改造。更何况，许多国家同样会对中国模型的数据安全、治理机制和长期可持续性存在顾虑。因此，即便未来客户出于风险分散考虑降低对美国闭源模型的依赖，更现实的路径也可能是采用 Llama、Mistral、Qwen 以及自研模型的混合架构，而不是直接从美国模型全面转向中国模型。

中美模型能力的差距未必会无限扩大，但如果高端算力长期受限，中国最前沿模型的训练规模、试错速度和基础设施冗余度都会受到影响，冲刺下一代模型的难度也会明显增加，而这并不是 MoE 等工程优化手段能够完全弥补的。事实上，我们已经不止一次从 DeepSeek 等中国头部 AI 实验室公开发布的技术报告中看到，由于高端算力约束，中国模型在世界知识覆盖、泛化能力等方面正逐渐与美国最先进模型拉开差距。

如果中美模型能力未来持续扩大，至少从 B 端来说，很难乐观地认为大量企业客户会主动放弃美国模型，转而全面采用中国模型。所以，未来如何利用一切资源和机会保障先进算力供给，确保中国前沿模型与美国竞争对手之间不出现代际差距，仍然是中美 AI 竞争中最关键的问题。

在我看来，美国政府使用告知函的方式，或许还真不是想搞一套大模型的出口管制，可能主要还是担心前沿模型被中国获取并进行能力学习、反向工程和二次开发。

从我参与的几次中美 AI 二轨对话来看，美国专家真正担心的并不只是中国获得先进模型能力本身，而是他们认为中国与美国在安全理念上存在差异。按他们的逻辑，Anthropic 即便发现模型存在漏洞，也会尝试通过对齐、安全测试和持续修复来降低风险；而如果中国研究人员获得同样能力，他们未必会优先报告和修复漏洞，而可能直接利用这些能力开展网络攻防研究甚至进攻性应用。这种他们所认为的 " 安全不对称 "，才是美国国家安全体系最核心的担忧。

所以，在白宫在收到亚马逊的报告后，第一反应是先拦住 Anthropic，阻止模型进一步扩散，给美国政府修复漏洞、或开发出对应的防御机制争取时间。这样也能解释为什么这次措施来得如此突然、如此不透明，因为本质上这就是次应急处置，而不是经过长期论证形成的成熟监管框架。甚至也可能多少还涉及现任美国政府和 Anthropic 的一些私怨。

退一步讲，就算美国的确意在管制大模型出口，其他国家是担心美国，但有什么理由认为他们不会担心中国哪一天也会采取同样的方法呢？特别是对欧洲这些美国的盟友来说。保护自己最强大的模型，中美在这一点上应该没有本质分歧。更何况，近年来中国面对激烈的地缘政治环境，也在不断强化对本土前沿原生技术出口限制。美国担心中国获得 Fable 5；欧洲完全有理由同样担心，开源模型随时可以转成闭源的，如果哪天 DeepSeek 或某个中国模型成为全球最强，中国政府是否也会用同样的逻辑限制其输出？毕竟中国对算法推荐系统的出口已经明确要求经过商务部审批了，搞不好哪天再把大模型也限制出口了呢？中国政府会不会在某个时间点，出于制裁和惩罚的意图，要求 DeepSeek 停止向特定国家 / 实体提供开源模型权重呢？

当然，历史上美国出口管制也干了不少傻事，并不是总能正确评估一个技术的能力，有时候一些措施是焦虑苏联这些竞争对手的追赶做出的预防性反应。不管怎么说，对一个私营企业发布模型的商业行为进行行政干预，但却没有明确的法律依据，至少没有明确对外阐释法律依据，某种程度上破坏了美国法治的信誉和营商环境的确定性。而这个代价，最终还由美国 AI 产业的国际声誉来承担。如果本届美国政府在这条路上一直这么走下去，那只能说是我们的国运了。

我的直觉是美国政府会迅速和 Anthropic 通过谈判解决这件事，给市场一个更稳定的预期，毕竟已经有英伟达等美国科技企业和安全领域的 80 多位高管和专家联名致信商务部长 Howard Lutnick 及白宫国家网络总监 Sean Cairncross，要求解除对对这两款模型的出口管制，并且承诺未来用开放、科学和透明的方式处理 AI 风险评估。Anthropic 估计也不会一直头铁，Fable 5 是他们在 2026 年上半年唯一能跟 GPT-5.5 正面竞争的旗舰模型，也很可能也是其最重要的企业合同续约和新客获客工具。失去这个旗舰的全球可及性，在 OpenAI 产品迭代速度越来越快的背景下，这个时间窗口损失是很肉疼的。

如果这件事一直得不到解决，那么那些能把 Llama 4、Qwen 3 或 Mistral 通过后训练打磨到特定场景（法律、医疗、金融合规、代码）接近前沿水平的 MaaS 提供商，有可能会在这波情绪下获得更多关注。因为企业客户需要稳定、可持续、可控的模型服务。如果美国前沿模型的可获得性开始被认为存在政策风险，那么部分客户自然会更重视能力略弱但供应稳定的替代方案。不过这条路门槛并不低。真正能够把开放权重模型在特定领域做到接近 Claude、GPT 等前沿模型水平，需要长期积累高质量数据、后训练能力、评测体系和行业 Know-how，应该只有少数具备深厚模型工程能力和行业资源的 MaaS 厂商能分一杯羹。

最后，大模型的发展可能会逐渐出现明显分层。一类是最先进的前沿模型，特别是在模型具备较强自主规划、自主研发乃至递归自我改进（RSI）潜力的情况下，其战略意义将越来越接近关键基础设施甚至 " 国之重器 "。这类模型不仅会受到开发企业自身的严格管理，包括分级访问、动态能力限制、身份验证和持续监测等机制，也可能面临越来越多来自主权国家的监管和出口管制，以确保最先进的模型能力不会无限扩散，并始终掌握在本国及其可信伙伴手中。

另一类则是性能略逊但成本更低的通用模型。对于客服、知识管理、表单处理、代码补全、内容审核等大量标准化、成本敏感型应用而言，这类模型往往已经能够满足需求。因此，这部分市场的竞争逻辑可能越来越接近云计算市场，企业更关注成本、稳定性、安全性和生态集成能力，而非单纯追求排行榜上的最强模型。

但在软件开发、智能 Agent、科研创新、网络安全等高价值场景中，顶尖模型与普通模型之间的能力差距仍可能被显著放大，并最终转化为生产效率、创新能力和产业竞争优势。因此，能够持续研发并掌握最先进前沿模型的国家，不仅将在 AI 产业链中占据更高位置，也可能在未来科技竞争和国家实力对比中获得额外优势。

文章仅做学术探讨和研究交流使用，相关判断不代表任何公司或机构立场，也不构成任何法律、商业或投资建议。转载请注明出处。

宙世代

一起剪

相关标签