【TechWeb】5 月 23 日消息,Anthropic 正式发布了新一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4。凭借 " 世界上最好的编码模型 " 的表现,在全球掀起新一波大模型关注热潮。
作为 Anthropic 的战略合作伙伴和重要投资方,亚马逊云科技已第一时间在 Amazon Bedrock 中推出 Anthropic 的最新一代模型 Claude Opus 4 和 Claude Sonnet 4。
根据亚马逊云科技透露的数据,Claude 系列模型广受客户欢迎,以 Anthropic 的上一款模型 Claude Sonnet 3.7 为例,该模型在发布后的五周内,Amazon Bedrock 客户使用率比同期的上一代 Claude 模型高出 300%。
Anthropic 强调,Claude Opus 4 和 Sonnet 4 的推出更是将让 AI 系统成为能力不断增长的协作伙伴,包括创意与知识工作。
全球最好编码模型 Claude 4
Claude Opus 4 和 Claude Sonnet 4 这两款全新混合推理模型能够根据需求在快速响应和深度思考模式间灵活切换,为编码、高级推理和多步骤工作流领域带来全新标准。它们不仅能在复杂的长时间推理任务中保持稳定的性能,更能驱动 AI agents 将耗时数小时的任务浓缩至数分钟内完成。
Anthropic 将 Claude Opus 4 称之为 " 世界上最好的编程模型 ",能在复杂、长时间运行的任务和智能体工作流中表现出稳定的性能。可独立完成从规划到执行的复杂编码项目和 agent 工作流。该模型还能以自然语言生成长篇创意内容。金融行业客户可利用 Claude Opus 4 进行 agent 搜索与研究,例如连接海量市场报告以获取行业洞察;营销类客户则可利用该模型自主管理多渠道的营销活动。
Claude Sonnet 4 是 Claude Sonnet 3.7 的重大升级,以编程和推理能力为核心,同时能更精确地响应用户提示词。Claude Sonnet 4 平衡性能与成本,特别适合高吞吐量的业务场景,是大多数生产级应用的理想之选。Claude Sonnet 4 可为各类业务赋能,从实时客服 agents 到日常开发工作(如代码审查与漏洞修复),并作为任务专用的子 agents 同时处理搜索、数据分析或内容合成等多类任务。旅游与酒店行业客户可使用 Claude Sonnet 4 近乎实时处理客户请求并提供个性化响应。
在权威编程基准测试 SWE-bench Verified 上,开启扩展思考的 Claude Opus 4 与 Claude Sonnet 4 的得分分别为 79.4% 和 80.2%,大幅度超越了 OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1、Gemini 2.5 Pro 等模型。
在编程、工具使用、视觉推理、数学等领域的基准测试中,这两款模型超越了 OpenAI o3,而在多语言问答、研究生级别推理任务上,Claude Opus 4 与 OpenAI o3 得分持平。
同时,Claude 4 系列模型的自主性进一步提升,Claude 3.7 最多可自主运行 45 分钟,而 Claude 4 可以独立运行数小时,最高达到 7 小时。连续 7 小时自助编程不是梦了。
Anthropic 增长与营收负责人 Kate Jensen 表示:"Claude Opus 4 和 Claude Sonnet 4 将 AI 从工具变为真正的协作伙伴。
Claude Opus 4 和 Sonnet 4 不再仅仅生成内容,而是更像专业的虚拟协作伙伴——专注复杂任务、保留上下文,并在无需持续指导下提供完整的解决方案。这一能力改变了企业应对各种挑战的方式,从开发软件系统到制定全面的营销策略。对于普通用户而言,它意味着与更理解需求的 AI 协作,且 AI 能独立承担更大比例的项目工作。
Amazon Bedrock 上如何使用 Claude 4 系列模型?
目前,亚马逊云科技 Amazon Bedrock 中已经上线 Claude Opus 4 和 Claude Sonnet 4 这两款最新大模型。
亚马逊云科技也给出了使用这 2 款大模型的方法。
用户可以使用 Bedrock Converse API 进行编码,在 Amazon Bedrock 中选择想要使用的模型,模型 ID 为 anthropic.claude-opus-4-20250514-v1:0(适用于 Opus 4)和 anthropic.claude-sonnet-4-20250514-v1:0(适用于 Sonnet 4)。
亚马逊云科技也建议使用 Converse API,因为它提供了一致的 API,可与所有支持消息的 Amazon Bedrock 模型兼容。这意味着用户只需编写一次代码,即可将其用于不同的模型。
例如,假设用户编写了一个 agent,用于在代码库合并变更前审查代码。用户写了如下代码,利用 Bedrock Converse API 发送系统和用户提示。然后,该 agent 会使用流式传输的结果。
Claude Opus 4 现已在北美以下 AWS 区域上线:美国东部(俄亥俄州、弗吉尼亚州北部)和美国西部(俄勒冈州)。Claude Sonnet 4 不仅在北美 AWS 区域上线,还在亚太地区和欧洲地区上线:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(海得拉巴、孟买、大阪、首尔、新加坡、悉尼、东京)和欧洲(西班牙)。
亚马逊云科技表示,Claude Opus 4 和 Claude Sonnet 4 在 Amazon Bedrock 的推出,进一步丰富了客户使用 Anthropic 最先进的模型进行 AI 创新的选择,帮助客户打造更出色、更具变革性的应用,同时具备企业级安全防护和负责任的 AI 管控体系。
登录后才可以发布评论哦
打开小程序可以发布评论哦