导语:Claude Sonnet 5 上线,Agent 能力逼近 Opus、价格仅三分之一,即日起成为 Free 和 Pro 默认模型
【资讯速览】
· Claude Sonnet 5 上线,Agent 能力逼近 Opus、价格仅三分之一,即日起成为 Free 和 Pro 默认模型
· 特斯拉 Cybercab 量产版上路测试,彻底取消人类操控
· 美团 LongCat-2.0 正式见面,1.6 万亿参数全程国产 ASIC 训练
· 黑石宣布 300亿美元 AI 数据中心计划,联手阿波罗、博通成立 AI XPV 平台,目标 2028 年前交付超 20GW 算力
· X 正式推出 MCP 服务,首个主流社交平台为 AI Agent 提供原生 API 通道
Claude Sonnet 5 上线,Agent 能力逼近 Opus、价格拦腰斩
6 月 30 日,Anthropic 发布 Claude Sonnet 5,具备计划、浏览器和终端工具使用能力,可自主运行,已成为 Free 和 Pro 套餐的默认模型。
相比其前代 Sonnet 4.6,在智能体性能的重要方面(如推理、工具使用、编码和知识工作)有显著提升。同时追赶 Opus 4.8 各项性能,知识处理能力甚至更优。

定价方面,优惠期内输入 2/ 百万 token、输出 10/ 百万 token,之后恢复为输入 3/ 百万 token、输出 15/ 百万 token ——约为 Opus 4.8 的三分之一。
安全层面,Sonnet 5 在恶意请求拒绝、幻觉和谄媚行为上均优于前代,但与能力更强的 Opus 4.8 和 Claude Mythos Preview 相比,仍存在较大差距。

信号解读:
Sonnet 5 的故事线非常清晰:用中等模型实现接近旗舰的 Agent 能力,再把价格打到三分之一。TechCrunch 的评论切中要害—— Agent 能力已从旗舰模型专属变为各价位标配,竞争焦点正从 " 谁有 Agent 能力 " 转向 " 以多低的成本实现可靠的 Agent 执行 "。
这对企业用户意味着 Agentic Coding、自动化工作流等场景的使用门槛实质性下降。此前需要 Opus 级别才能稳定跑通的编程 Agent 任务,现在可以用 Sonnet 5 以三分之一的价格搞定。Anthropic 正在主动把高毛利模型自降到普及价位,这在垂直竞争维度上给了闭源竞品和开源模型双重压力。
特斯拉 Cybercab 量产版上路,Robotaxi 从改装验证进入原生产品阶段
6 月 30 日,特斯拉在得克萨斯州奥斯汀城区启动首批量产版 Cybercab 公开道路工程测试。
Cybercab 是特斯拉首款原生面向 Robotaxi 运营打造的 L4 级自动驾驶车型,整车围绕出行载客场景重构设计,采用双座座舱搭配蝴蝶门。
其取消了传统外后视镜,依靠车载感知硬件完成路况观测。并彻底取消方向盘、油门和刹车踏板,不存在任何可供人类接管的操控硬件。
得州交通局已确认该设计合规有效,车内配备安全监督员但无法手动干预,所有驾驶操作由车载系统独立执行。
从 2024 年 10 月概念车首秀到此次量产上路,历时约 20 个月。目前投入 34 台车辆在市中心验证硬件可靠性,暂不对外开放乘坐。马斯克同步发布实拍视频。
为什么值得关注:
相比 Waymo 等对手在改装车路线上的渐进式推进,特斯拉选择了 " 去掉所有人类操作冗余 " 的激进路径。取消方向盘不仅是工程决策,更是对法规边界的直接试探——得州交通局的合规批复是一个先例。
对行业而言,Robotaxi(自动驾驶出租车)从 " 改装验证期 " 进入 " 原生产品期 ",意味着接下来的竞争将更多围绕量产成本、维修经济性和规模化运营效率展开,而不再是 " 能不能跑 " 的技术验证。
美团 LongCat-2.0 开源,国产 ASIC 万亿模型路线的完整亮相
6 月 30 日,美团正式发布新一代万亿参数大模型 LongCat-2.0,并宣布将对外开源。
该模型采用 MoE 架构,总参数 1.6 万亿,平均激活约 48B(动态范围 33B-56B),原生支持 1M 超长上下文,全程在 5 万块国产 ASIC 上完成训练与推理,未使用 NVIDIA GPU。
此前预览版 Owl Alpha 已在 OpenRouter 平台登顶使用量榜首,累计消耗 10 万亿 tokens。
LongCat 团队对国产算力的探索始于 2023 年,三年间从千卡集群逐步攻克算子适配、通信优化等工程难题,此次完整开源的不仅是模型权重,也包括训练方案和部署系统。
长远意义:
SWE-bench Pro 得分 59.5,接近主流闭源模型。但 LongCat-2.0 更大的意义在模型之外:它是目前最完整的一次 " 国产 ASIC+ 万亿参数 + 全栈开源 " 的公开验证。从千卡到五万卡的三年工程史,也是国产算力从 " 能不能用 " 到 " 能不能大规模跑 " 的浓缩版编年史。
继豆包、千问之后,美团以万亿参数模型入局,标志着国产大模型竞争已从 " 有无可用 " 进入 " 工程能力与算力自主的双重竞赛 "。谁能把国产芯片的算子生态、通信效率和训练稳定性做到可规模化复制的水平,谁就拿到了下一阶段的基建定价权。
黑石 300 亿美元日本投建,AI 算力融资进入另类资产配置时代
据《日经》及 IT 之家报道,黑石总裁 Jonathan Gray 于 6 月 30 日宣布,计划未来 3-5 年在日本投入 300 亿美元建设 AI 数据中心,在现有 500MW 基础上新增超 1GW 容量。Gray 直接表态:"AI 投资仍处早期,真正风险是算力短缺而非基建泡沫。"
此外,黑石已于 6 月 9 日与阿波罗、博通联合成立 AI XPV 平台,目标 2028 年前向 OpenAI、Anthropic 等提供超 20GW 算力。
三大资管巨头联合成立 AI XPV 平台这件事,意义超出了项目本身。
AI 算力融资正在从科技公司自有资本开支扩展至另类资产管理的结构化配置——黑石、阿波罗这类玩家入局,意味着 AI 基础设施已被视为可长期持有的投资类资产,而不仅是科技公司的成本项。
黑石联合博通(硬件层)+ 阿波罗(资金层)的组合,也勾勒出 AI 基建的典型分工模型:硬件供应商、资本方和云服务客户已形成一条独立于传统科技公司的供给链。
X 正式推出 MCP 服务,AI Agent 首次获得社交平台原生 API 通道
6 月 30 日,X 正式推出托管式模型上下文协议(X MCP)服务,AI 智能体可直接调用 X API 获取实时信息,支持 Grok、Cursor 等工具接入。
这是首个主流社交平台为 AI Agent 提供官方 MCP 接口。
在此之前,AI 获取社交平台数据几乎完全依赖非官方爬虫、RSS 中转或第三方 API 封装,合规性和稳定性存在隐患。X MCP 的推出,意味着平台方开始主动将 AI Agent 视为一类正式用户——不是需要防范的爬虫,而是有付费意愿的新型调用方。
X MCP 的引入意味着社交数据进入 AI Agent 的能力拼图打开了一扇合规之门。各行各业可以开始构建标准化的 AI+ 社交数据工作流,而不再依赖脆弱的第三方方案,将大大增强如信息聚合、舆情分析、自动化运营等场景的自动化能力。
结语
AI 发展的底层基础正在全面成熟化。
Sonnet 5 把 Agent 能力打到三分之一价格,说明模型层正在从 " 能力竞赛 " 切换为 " 成本竞赛 ";特斯拉 Cybercab 量产上路,标志着自动驾驶的基础设施从技术验证进入产品化阶段;美团 LongCat-2.0 开源,将国产算力独立从政策命题转化为可交付的工程系统;黑石携 300 亿美元入局日本,意味着 AI 算力建设正在成为全球另类资产的标准配置;X 开放 MCP 接口,则预示着 AI Agent 的网络基础设施开始从开发者工具链向消费级平台延伸。
这些事件看似分散,但底层逻辑相通—— AI 产业正在从 " 能不能做 " 过渡到 " 能不能稳定、便宜、合规地做 "。模型、算力、数据、资金、法规,每一层都在进入可规模化复制的阶段。
(本文为艾瑞网独家原创稿件 转载请注明出处)


登录后才可以发布评论哦
打开小程序可以发布评论哦