科技每日推送 11小时前
美国AI巨头,疯狂攻击中国同行!但阿里不惯着
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 赵芷姗

编辑 | 周伟鹏

Anthropic 快把中国 AI 公司挑衅了个遍。

6 月 24 日,美国 AI 巨头 Anthropic 指控阿里巴巴,称对自己发动了 " 蒸馏攻击 "。

在它给美国国会议员的信中提到,从 2026 年 4 月 22 日 -6 月 5 日,阿里相关操作人员与 Claude 进行了近 2900 万次交互。

这不是它第一次针对中国公司。今年 2 月,它用几乎一模一样的话术,一口气点名了 DeepSeek、Kimi、MiniMax 三家 AI 公司。

四个月后,指控的对象换成了阿里。但阿里没有选择忍耐,而是直接硬刚。

就在指控的前一天,阿里向美国加州圣何塞联邦法院提交诉状,起诉美国国防部将其列入 " 中国军事企业清单 ",要求法院判决该决定违法。

Anthropic 曾被指控窃取数据

模型自称是 " 千问 "

一般来说,一家科技公司指控别人窃取技术,行业至少应该先观望一下,但这次海外的开发者反而是几乎一边倒的嘲讽。

因为这件事槽点实在是太多了。

首先,蒸馏在 AI 圈里是一个非常基础、通用的技术。

所谓蒸馏,是指用一个能力强的 " 教师模型 " 的输出,来训练一个参数更小的 " 学生模型 ",让小模型用更低的成本获得接近大模型的能力。

就像名师带徒弟,徒弟不用从头摸索所有知识,直接学习老师的解题思路和答案,效率高很多。

能叫得出名字的 AI 厂商,基本都用过蒸馏。

Deepseek 官方指出,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区;谷歌在发布 Gemma 2 时,在官方技术报告中明确提到,较小模型在预训练阶段就嵌入了知识蒸馏技术。

即便是 OpenAI 和 Anthropic,也在蒸馏。有开发者还指出,两家甚至互相蒸馏,但两家似乎从未提告过彼此。

假如说蒸馏只是业界有所模糊的技术,难以界定边界,那么在这之前,Anthropic 就因为违规窃取数据,被实锤过。

2025 年,Anthropic 因未经授权,从盗版图书网站下载 700 万本书训练模型,被出版商告上法庭,最终赔偿 15 亿美元达成和解,成为美国历史上金额最高的 AI 版权诉讼案。

今年 1 月,环球音乐联合几个音乐集团,起诉它非法使用超 2 万首版权歌曲,索赔金额可能超过 30 亿美元。

连马斯克都发文嘲讽:"Anthropic 大规模窃取训练数据,并不得不为自己的盗窃行为支付了数十亿美元的和解金。这只是一个事实。"

甚至在 5 月,Anthropic 发布旗舰模型 Claude Opus4.8 之后,大量开发者实测发现,问它 " 你是谁 " 的时候,模型会多次自称是 " 阿里通义千问 "。

这个 bug 现在看来,更像是 Claude 蒸馏 Qwen 的实锤。

没有任何直接证据

Anthropic 的指控站不住脚

即使撇开 Anthropic 自身的槽点不谈,就算说阿里千问蒸馏,至少也得拿出证据。

有外国网友站出来挑明了:Anthropic 没有任何直接证据证明,阿里千问模型是在其输出上训练的。

没有前后基准测试、没有泄露的数据集、没有训练运行、没有模型相似性分析、也没有阿里的内部文件。

业界公认的判断模型蒸馏的手段有两种,一个是 " 专属水印 ",主流的头部大模型会在输出中嵌入不可见的统计水印。

如果用带水印的输出训练另一个模型,那么它的生成结果也会继承相同的水印特征。

另一个是 " 蜜罐陷阱 ",一些模型厂商会故意在输出中插入全网独有的虚假信息,比如编造不存在的论文、人名、公式、冷门事实错误。

如果其他模型也输出了完全一致的虚假内容,且数量足够多,就几乎可以确认蒸馏。

此外,每个大模型都有对特定问题的逻辑偏好、答题习惯等,行业会通过响应相似性评估,对比判断是否存在蒸馏痕迹。

Anthropic 完全没有披露这些核心技术证据,指控的虚假账号和近 2900 万次的交互,也只能算是异常调用行为证据。

但大模型的调用不等于用于模型蒸馏,也可能用于竞品评测、数据采集、第三方工具开发等其他目的。

尤其是调用竞品 API 做测评,这是全行业的常规操作。

这似乎也解释了,为什么这次 Anthropic 不发详细博客,只选择了告御状?——毕竟,忽悠起别有用心的政客,比忽悠火眼金睛的开发者要容易得多。

千问冲到全球第二

Anthropic 地位受到威胁

那 Anthropic 为什么选在这个时间点,把矛头对准阿里?

一些外国网友很容易就看出了其中的猫腻:因为千问真的打疼 Claude 了,尤其还是在它最引以为傲的软件工程能力上。

长期以来,软件工程与长链路代码推理,都是 Claude 安身立命的核心护城河,这也是它区别于 GPT、Gemini 的核心差异化优势。

但是今年上半年,千问的迭代速度打破了这个格局。

5 月发布的千问 3.7-Max,在全球权威编程盲测榜单 CodeArena 上拿到了 1541 分,直接冲到全球第二,打破了 Claude 的垄断格局,只比榜首的 Claude Opus4.7 低 26 分。

相当于在 Anthropic 的核心阵地上,插上了一面来自中国的旗帜。

而且,千问的价格只有 Claude 的零头,性价比高到离谱。对于 Anthropic 这种靠代码能力卖高价的公司来说,这简直是降维打击。

就在这个节骨眼上,Anthropic 抛出了 " 蒸馏攻击 " 的指控,不只是蒸馏,而且上升到了攻击的层面,时间点卡得不可谓不精准。

结语

更深层次的原因是,Anthropic 开始焦虑了。

过去这段时间,即使美国的出口管制在不断加强,中国企业也没有因为硬件受限而停止追赶,一堆 AI 公司还是跑了出来。

于是这就产生了一个问题:如果算力封锁挡不住能力进化,那模型本身是不是应该被拉入管制名单。

这才是它四个月里接连指控四家中国 AI 企业的真正用意。它想要推着美国政府把管制的手,从硬件层往下伸到模型能力层,直接从规则层面锁死中国追赶的路径。

Anthropic 指控阿里蒸馏,本质上不是什么技术纠纷,而是一场关于 AI 时代规则定义权的争夺。

当技术差距缩小到一定程度,规则、话语权、标准制定权的博弈,就会走到舞台中央。

但历史早就反复证明,真正的技术领先,不是靠封锁封出来的。

与其挖空心思给对手找茬,不如沉下心打磨好自己的产品。毕竟市场的眼睛永远是亮的,谁的产品更好用、性价比更高,用户自然会用脚投票。

硬实力,才是所有规则里的硬通货。

END •

Question. Write.Narrate. Believe. Become a story. 易简传媒的愿景是提问和传播商业故事,让读者更开阔,更聪明。有 2500 万微信粉丝关注我们的账号,欢迎大家关注:

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 美国 ai 阿里巴巴 kimi
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论