日前,Anthropic 方面发布新一代中端主力模型 Claude Sonnet 5,以及面向科研人员的 AI 工作台 Claude Science。
据了解,相比上一代 Sonnet 4.6,Sonnet 5 在推理、工具调用、编程和知识工作等关键能力上都有实质提升,整体表现已接近 Opus 4.8。以 Agent 编程能力为例,Sonnet 5 在 SWE-bench Pro 中录得 63.2% 的得分,较 Sonnet 4.6 的 58.1% 提升 5.1 个百分点,距离 Opus 4.8 的 69.2% 的差距进一步收窄。
值得一提的是,Sonnet 5 具备自主制定长期规划、跨工具协同调用的能力,可在无人工干预下长时间独立运行,贴合目前开发者群体执行长程任务等需求。对此 Anthropic 方面强调,Claude Sonnet 5 的设计目标是成为迄今为止最具自主性的 Sonnet 模型。

目前 Sonnet 5 已面向所有用户开放,并已成为 Claude 免费版和 Pro 版用户的默认模型。需要注意的是,由于 Sonnet 5 采用了全新的分词器(Tokenizer),在提升底层精度的同时将导致同样的文本输入会被切分成更多 Token,大致是原来的 1 到 1.35 倍。为应对这一变化对于用户成本的影响,Anthropic 为 Sonnet 5 启动了阶段性价格促销。
据了解,在截至今年 8 月 31 日的推广期内,Sonnet 5 API 价格将降至每百万 Token 输入 2 美元、输出 10 美元。此后,Sonnet 5 API 价格将恢复为标准计费,即每百万 Token 输入 3 美元、输出 15 美元。
而 Claude Science 则是基于 Claude Opus 4.8 等模型运行,集成了研究人员最常用的工具和软件包,可以一站式完成覆盖科研工作的各个阶段的工作,其中包括分析文献、执行多步骤研究、生成详细的产出物等。而且 Claude Science 每一项产出都带有完整的制作过程记录,方便研究者验证和复现。
Anthropic 方面强调,与 Jupyter Notebook 类似,用户无论身在何处都可以访问 Claude Science,包括通过本地 macOS 或 Linux 系统,以及通过 SSH 远程连接,或是直接登录 HPC 集群节点使用。
据了解,在过去的几个月里,已有研究人员借助 Claude Science 完成单细胞 RNA 测序分析、CRISPR 筛选设计、蛋白质结构预测、化学信息学等任务。例如设计组织靶向药物的公司 Manifold Bio,就使用 Claude Science 为最新一批实验筛选靶点。
目前,Claude Science 的测试版已登录 macOS 和 Linux 平台,并率先面向 Claude Pro、Max、Team 和 Enterprise 用户开放。此外,Anthropic 方面还宣布将为至多 50 个科学项目提供资助。
值得一提的是,继 6 月上旬 Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 这两款全新 Mythos 模型,但美国政府以担忧 AI 安全护栏存在漏洞为由对这 2 款模型实施出口管制,因此宣布对全部用户暂停这 2 款模型的访问后。近日 Anthropic 方面宣布,已正式解除对 Claude Fable 5 和 Claude Mythos 5 的出口限制,即将全面恢复这两款模型的访问权限。
【本文图片来自网络】
加入收藏 点赞 ( 0 ) 踩 ( 0 )


登录后才可以发布评论哦
打开小程序可以发布评论哦