量子位 前天
Claude降智实锤了!还变相涨价,Opus跌下神坛
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

Claude 性能降智,已经成了重度用户们绕不开的槽点。

而且发现这一点的,还是 AMD 高级总监 Stella Laurenzo。

在翻烂了近 7000 份会话日志后直言,Stella 发现现在的 Claude 在处理复杂任务时已经变傻了。

第三方跑分数据也印证了这一点,原本稳坐前 2 名的尖子生,短短几周内排名直接跌到了榜单第 10 位。

眼看着交了同样的订阅费却只能用上这种减配版模型,不少用户都感觉自己被当成了冤大头。

Claude 降智被抓包

前面提到的 Stella,对 Claude Code 的运行数据进行了详细审计。

调查范围覆盖了 6852 份会话文件、17871 个思考块以及超过 23 万次工具调用。

分析结果显示,从 2 月份开始,模型的推理深度出现了断崖式下滑。

在实际操作中,它在处理复杂工程任务时表现得不再可靠,经常出现逻辑断层或无法理解复杂指令的情况。

原本那个愿意深钻难题的助手现在变得非常敷衍,开始倾向于用最简单的修补方案来应付差事,甚至频繁在任务进行到一半时莫名其妙地停下来。

这种退步在第三方基准测试 BridgeBench 中表现得更加直观,Opus 4.6 的准确率在短时间内从 83.3% 跌到了 68.3%。

由于准确率的大幅缩水,它在测试榜单上的排名也从第二名直接掉到了第十名。

对于这些质疑,官方负责人 Boris Cherny 承认,目前模型默认开启的是努力程度为 85 分的 " 中等努力 " 模式。

官方给出的解释是,这种调整是为了平衡处理速度和算力成本,给大多数用户提供更快的响应。

但在很多重度用户看来,这种为了省钱而限制模型智能水平的做法,实质上就是一种变相的性能削减。

为了在视觉上掩盖这种变化,程序界面还在 2 月份悄悄隐藏了具体的思考过程,导致很多习惯观察模型逻辑的用户觉得它根本没在认真动脑子。

此外,后台的技术细节也暴露了一些缩减成本的痕迹,有开发者发现提示词缓存的时长从 1 小时被骤降到了 5 分钟。

这种改动意味着在长会话中,只要用户稍微停顿思考,之前生成的缓存就会过期,导致额度消耗速度大幅提升。

这种性能表现和计费规则的双重缩水,让那些需要长时间处理复杂代码的程序员感觉非常受挫。

不过,虽然智商降下来了,可是价格在涨啊。

企业包月套餐涨价

Anthropic 对计费规则的大幅度调整让很多企业用户措手不及,原本那种一口价包月畅用的模式已经被彻底拆分。

现在的 Claude Enterprise 计费方案,更像是一种流量计费——

用户除了要交 20 美元的固定底薪,剩下的每一份算力开销都要根据实际用量额外结账。

这种计费转变对重度用户来说无异于一场金钱噩梦。

曾经每月只需支付 200 美元固定费用的公司,在新的规则下极有可能发现账单翻了倍,甚至有部分团队的支出直接暴涨到了原来的三倍。

A 社之所以选择在此时跟客户算细账,主要还是因为扛不住成本的压力。

由于模型推理成本在过去一年翻了三倍,管理层为了保住毛利率,只能选择从这些高频用户身上寻找盈利空间。

甚至因为算力资源实在捉襟见肘,A 社开始限制订阅用户去调用 OpenClaw 这种极度消耗资源的 Agent 工具。

看着 A 社的涨价降智风波,隔壁 OpenAI 立刻推出了 100 美元档位的 Codex 订阅服务。

这种定价策略,或许正是想趁机收割那些对涨价感到不满的优质客户。

Opus 4.7 要来了

根据爆料,Anthropic 最快在本周就会把 Claude Opus 4.7 摆上货架。

这款新旗舰模型目前已经准备就绪,预计将作为产品线的最新性能代表直接上线。

同步曝光的还有一款 AI 设计工具,它能让用户通过自然语言指令直接生成网页、演示文稿、落地页或者产品原型。

这款工具的门槛设得很低,无论是敲代码的还是完全不懂技术的小白,都能通过提要求的方式完成设计。

受此消息影响,Adobe、Wix 和 Figma 这些设计软件巨头的股价在报告发布后的几小时内应声下跌了 2% 以上。

这种还没见着真家伙就先让友商市值蒸发的表现,确实给市场留足了想象空间。

参考链接:

[ 1 ] https://venturebeat.com/technology/is-anthropic-nerfing-claude-users-increasingly-report-performance

[ 2 ] https://www.theinformation.com/articles/anthropic-changes-pricing-bill-firms-based-ai-use-amid-compute-crunch

[ 3 ] https://www.theinformation.com/briefings/exclusive-anthropic-preps-opus-4-7-model-ai-design-tool

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

谁会代表 2026 年的 AI?

龙虾爆火,带动一波 Agent 与衍生产品浪潮。

但真正值得长期关注的 AI 公司和产品,或许不止于此。

如果你正在做,或见证着这些变化,欢迎申报。

让更多人看见你。 https://wj.qq.com/s2/25829730/09xz/

一键关注 点亮星标

科技前沿进展每日见

评论
大家都在看