雪藏背后：Anthropic的技术、商业与伦理困境

文 | 硅基星芒

一向自诩为 " 道德标杆 " 的 Anthropic，上周发布其最新模型 Claude Mythos Preview 后，罕见地宣布不向公众开放，理由是该模型的网络攻击能力已构成 " 前所未有的网络安全风险 "。

一个 AI 公司主动雪藏自己的产品，这本身就是一个信号。

本文想从四个角度来梳理这件事：

●模型能力的真实跃升

●技术架构的可能来源

●商业策略下的成本转嫁

●以及互联网底层规则的悄然瓦解。

最终我们看到，技术狂飙与商业反噬之间的张力，远比表面看起来复杂。

01 AI 完全自主攻陷企业网络

在大多数人的认知中，AI 还只是一个会写代码、做数学题的聊天机器人。

然而，英国人工智能安全研究所（AISI）近期发布的一份核心评测报告彻底重塑了人们对 AI 杀伤力的理解。

这份报告揭露了一个令人恐惧的事实：前沿大模型已经实现了从智能助手到数字 " 佣兵 " 的进化。

这场攻防演练的主角，正是 Anthropic 前几天推出的最新模型Claude Mythos Preview。

相比 Claude Code 和 Opus，这款名为 Mythos 的模型最大的区别在于没有公开发布。

原因竟然是 Anthropic 评估该模型的能力过强，一旦被滥用风险无法估量。

听起来有些难以置信，但这并非单纯的商业宣传。

4 月 11 日，美国副总统和财政部部长召集了 Anthropic、xAI、Google、OpenAI、微软等世界顶级 AI 公司的 CEO，专门对以 Mythos 为首的 AI 模型的安全性及网络攻击应对策略进行讨论。

目前，Anthropic 仅仅向 Apple、Google、微软、英伟达等少数企业定向开放了该模型，并重点评估防范黑客滥用的机制。

能够引起美国政府的重点关注，这款模型宣传的能力绝非浪得虚名。

在古希腊语中，Mythos 往往代指神话、故事等虚构叙事，代表这款模型的能力上限已经远超人们的想象。

然而，真正支持 Mythos 达到如此水平的，是它在古希腊语中与这个词对立的 Logos（理性思辨）上做到了极致。

为了测试 AI 的能力上限，AISI 构建了一个名为 "The Last Ones（TLO）" 的高仿真企业网络靶场。

这与此前网络安全技术人员之间进行技术竞技的 " 夺旗赛 " 有所不同，TLO 是一个包含 32 步的企业网络攻击场景，目标则是从受保护的内部数据库中窃取敏感数据。

换句话说，这是一场包含侦察、凭证窃取、NTLM 中继攻击直到最终数据窃取的 32 步超长周期渗透测试。

AI 智能体自主向攻击目标推进能够完成的步数越多，性能就越强。

对于这个测试，即使是人类顶级安全专家，完成一整套流程通常也需要耗费 14-20 小时的连续高强度工作。

但在长达 18 个月的纵向跟踪中，AISI 看到了一条令人不寒而栗的能力进化曲线：

2024 年，独领风骚的 GPT-4o 在这个靶场测试中平均只能完成 1.7 步，证明它对复杂的网络拓扑结构和密码学瓶颈束手无策，迅速陷入了停滞。

2026 年 2 月，编程之王 Claude Opus 4.6 出场，在 1 亿 token 的推理算力预算下，一举拿下 22 步的高光成绩。

然而，仅仅两个月过去，Mythos 就大幅刷新了这个成绩，它竟然在 10 次独立测试中有 3 次完美通关了 32 个步骤，首次实现了对企业网络从 0 开始的完全自主接管。

在对 Mythos 能力发生跨越式进步的惊叹之余，它也揭示了现阶段 AI 演进方向的底层逻辑：

规模化定律应该加上一个定语 "Inference"，模型能力提升不能仅仅依靠预训练阶段的知识灌输，必须通过近乎不计成本的 token 消耗，在推理阶段进行反复的试错、反思和纠正。

另一个值得关注的重点突破在于，在网络安全领域，算力已经是 Mythos 唯一的限制。

只要给予足够的 token 预算，它就能在漫长的攻击序列中链式结合异构能力。

在工业控制系统（ICS）靶场测试 "Cooling Tower" 中，甚至有多个模型跳出了人类预设的 Web 提权常规路径，直接凭借对未知协议网络流量的暴力嗅探和模糊测试，硬生生砸开了一台物理设备的控制通道。

以 Mythos 为首的前沿模型，不仅对全球网络安全防御体系造成了降维打击，也证明了它们在复杂物理映射世界中已经具备极强的自主执行力。

这就意味着，几个月后，你的电脑、你的电动汽车甚至是你的智能马桶都可能不再安全。

02 异常的跑分与 " 幽灵架构 "

Mythos 带来的这种诡异的推理能力跃升，显然无法仅仅用参数规模和显卡的堆砌来解释。

然而，能使用 Mythos 模型的公司都屈指可数，从代码层面上解构技术特点自然是无稽之谈。

不过，就在 Anthropic 对其模型架构讳莫如深的同时，一份异常的基准测试成绩却引起了技术社区关于 " 幽灵架构 " 的热烈讨论。

目前用户能看到的关于 Mythos 的相关信息，就只有 Anthropic 官方发布的系统卡片。

敏锐的研究人员在其中发现了一个不太寻常的数据异常：在考察模型应对复杂图结构广度优先搜索能力的 GraphWalks BFS 测试中，Mythos 的得分远超对手达到 80.0%，而两个月前发布的 Opus 4.6 只有 38.7%，GPT-5.4 更是只有 21.4%。

目前 AI 行业模型性能层面上的提升速度已经显著放缓，这种在单一纯逻辑推力维度上的断崖式领先，绝非标准 Transformer 架构通过常规思维链输出大量文本所能达到的效果。

前 Meta、现 OpenAI 的工程师 Chris Hayduk 直接捅破了这层窗户纸，并将矛头指向了一种创新的底层架构设计：循环语言模型（Looped Language Models）。

这个名字，不可避免地让人联想到字节跳动 Seed 团队在去年 10 月发布的一篇名为《Scaling Latent Reasoning via Looped Language Models》的论文。

字节的研究团队提到了一个开创性的核心思想：彻底抛弃在外部生成大量文字让模型思考的模式，转而让输入序列在同一组 Transformer 层中反复进行内部的多轮迭代计算，在模型的 " 黑盒 " 中完成深度的逻辑推演。

而图搜索，正是这种架构在理论上的绝对舒适区。

令人疑惑之处还不止两种架构上的相似。

在 SWE-Bench 测试中，Mythos 消耗的 token 生成数量只有前代旗舰模型 Opus 4.6 的五分之一，但得出最终答案的推理耗时反而更长。

按照传统的计算逻辑，输出越少，计算速度理应越快。

不过，若是像循环语言模型一样，把海量的计算成本隐藏在不输出 token 的内部循环之中，这一看似矛盾的现象就能完美地迎刃而解。

尽管模型性能存在显著差距，但 Anthropic 面对外界质疑集体噤声仍然略显欲盖弥彰。

当然，只要模型不被公开发布，任何推测都不可能被证实。

不过我们仍然有理由认为，象征着美国硅谷最高技术结晶的下一代顶级模型，核心架构的设计灵感大概率源自中国团队在开源社区毫无保留的学术分享。

尽管国内外 AI 大模型的权力格局已经基本确定，但这种隐秘的技术路线借用早已是行业中不言而喻的 " 秘密 "。

值此之际，试问国际顶尖 AI 企业又有什么立场联手抵制国内 AI 企业的蒸馏行为呢？

03 悄无声息被砍掉的缓存时间

Anthropic 的奇葩操作还远远不止于此。

在 Mythos 体现出了神明一般的能力的同时，支撑其能力的算力成本还是一笔糊涂账。

然而，买单的人却已经确定，那就是数以万计的无辜开发者。

近期，一位名为 seanGSISG 的开发者在 GitHub 上发布了一份数据分析报告，用接近 12 万次 Claude Code API 调用日志将 Anthropic 的暗箱操作公开于众：

从 3 月 6 日至 3 月 8 日，Anthropic 在没发布任何公告、更新日志和警告的情况下，悄无声息地将 API 提示词缓存的默认存活时间（TTL）从原本的 1 小时砍到了 5 分钟。

时间的骤降，带来的是成本的飙升。

从 2 月 1 日到 3 月 5 日，系统稳定运行在 1 小时缓存的档位，而当时的缓存资源浪费率只有 1.1%。

然而在 3 月 6 日之后，5 分钟级别的缓存刷新简直就像是一只吸血鬼，瞬间掏空了开发者的钱包。

仅仅是 Sonnet 模型的调用，就直接导致了用户的隐性使用成本被硬生生提高了 17%，3 月的资金浪费率也随之暴涨到 26%。

这种简单粗暴的数学逻辑的核心驱动力，毫无疑问是背后的商业贪婪。

TTL 变短意味着庞大的上下文背景信息每隔 5 分钟就会失效，系统就必须不断重新写入并创建缓存（KV Cache）。

而这么做的原因，在每一款 AI 产品的价格表上都体现得淋漓尽致：缓存命中与未命中时的 token 输入价格简直是天壤地别，后者比前者贵十倍都是常见定价。

最倒霉的反而是那些为了追求机制生产力而购买 Pro Max 订阅服务、付费意愿最强的用户，他们付款最多，使用最频繁，额度耗尽也最快。

这种容易被忽视的暗箱操作，反应的仍然是顶尖 AI 企业面对长上下文计算压力时不得不采取的商业妥协。

算力瓶颈从未消失，现阶段也没有人能给出任何解决方案。

聚光灯下 Mythos 展现出了迄今为止人工智能的最高水平，而阴暗的角落中 Anthropic 却要克扣开发者的每一分钟缓存。

以前市场总会质疑大模型的运行是一笔亏本买卖，而如今的状况已经完全相反。

从上个月国产模型纷纷宣布涨价来看，算力问题短期内不可能被根本性解决，而 Anthropic 的这种行为势必会蔓延到全球 AI 企业。

04 传统互联网契约的彻底毁灭

如果把视线进一步抬高，从围观的开发者生态转移到整个互联网的宏观伦理层面，就会发现 Anthropic 这家自诩为 AI 道德标杆的巨头正在榨干互联网上全部的剩余价值。

Cloudflare 这家为全球互联网提供底层基础设施服务的公司，恐怕全球的网友们都不会陌生。

而 2026 年 4 月初 Cloudflare 发布的一份最新数据，无情地揭示了 Anthropic 主导的一场数据榨取的真相。

传统的互联网生态中，网站需要流量才能生存，流量（点击量）就是获取信息的成本。

但自打 AI 出现以后，不少网站的信息失去了这种价值。

Cloudflare 通过追踪 AI 的爬虫抓取网站内容的次数，与这些平台为原创网站带来的流量回流进行对比，并定义了一个叫做 " 抓取回流比（crawl-to-refer ratio）" 的指标，以此衡量 AI 的行为给网站造成的影响。

而在这份榜单上，始终把 " 人类利益和负责任 AI" 挂在嘴边的 Anthropic，凭借着8800:1的刺眼数据稳居倒数第一，碾压了同行竞品。

OpenAI 的抓取回流比是 993.3:1，还不到 Anthropic 的八分之一。

简单来说，Anthropic AI 创建的爬虫在对互联网网页进行 8000 次的抓取后，只能给原创网站带来 1 次点击流量的回流。

在 AI 出现前的十几年，互联网的生态运转一直建立在一个心照不宣的隐形契约之上：

创作者允许搜索引擎免费爬取和索引自己的原创心血，作为交换，他们将获得可用于变现的真实用户流量。

然而，贪婪的生成式 AI 不仅破坏了这份契约，还试图从中榨取尽可能多的价值。

它们在训练阶段将互联网上仅存的人类智慧结晶嚼碎并消化，在推理阶段把知识以最终答案的形式喂给用户，彻底掐断了用户点击溯源的路径。

而这些极其高频的爬虫活动，从未将网站拥有者的服务器宕机风险和带宽成本纳入考量。

Anthropic 引领的这场技术狂欢，带来的却是建立在技术强权上的生态环境毁灭。

但这种极具割裂感与讽刺的事实，在商业利益面前不仅不会被抵制，反而会被全球 AI 企业所效仿。

或许，在机器变得全知全能之前，人类数字文明已经沦为一片毫无生机的废墟。

宙世代

一起剪

相关标签