财联社 2小时前
Anthropic深夜炸场,推出新模型:5000万行代码1天搞定
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

Anthropic 最新推出了一款新模型 "Claude Fable 5",作为 " 神话级 "(Mythos-class)的一员,公司将其设计为可安全用于一般用途的模型。

Claude 页面显示,付费用户已可以使用 Fable 5。

新闻稿写道,Fable 5 的性能超越了公司以往所有公开发布的模型,在几乎所有 AI 性能基准测试中都处于领先水平,在软件工程、知识工作、视觉、科学研究以及许多其他领域都展现出卓越的性能。

Anthropic 指出,任务越长、越复杂,Fable 5 相对于公司其他模型的优势就越明显。新闻稿援引 Stripe 的报告称,在早期测试中,Fable 5 将数月的工程量压缩到了几天之内。

在一个拥有 5000 万行代码的 Ruby 代码库中,Fable 5 仅用一天时间就完成了整个代码库的迁移,而如果这项工作由一个团队手动完成,则需要两个多月。

新闻稿提到,Fable 5 的 token 效率也高于以往的 Claude 模型:在 Cognition 的 FrontierCode 评估中,Fable 5 即使在中等工作量下,也在所有前沿模型中得分最高。

Anthropic 强调,Fable 5 是目前最先进的视觉任务模型。仅凭视觉,该模型就能通关《宝可梦:火红》,而早期的 Claude 机器人需要较复杂的辅助设备才能玩该游戏。

Fable 5 通关《宝可梦:火红》

几个月前,该公司曾警告称,Mythos 系列模型具备发现并利用关键软件漏洞的能力。

新闻稿承认 " 发布如此强大的模型伴随着风险 "," 如果没有安全措施,Fable 5 在网络安全等领域的强大功能可能会被滥用,造成严重损害。"

因此,我们在发布该模型时加入了安全措施,这意味着对某些主题的查询将由功能次强的模型 Claude Opus 4.8 进行响应。

Anthropic 还表示,公司面向一小部分网络安全防御机构和基础设施提供商推出了 Claude Mythos 5 ——与 Fable 5 采用相同的底层模型,但在某些方面取消了安全防护措施。

公司补充称,Fable 5 和 Mythos 5 等模型的能力具有造福世界的潜力,它们帮助网络安全防御机构保护了至关重要的软件,在生命科学研究领域提出了新的假设,加速了新疗法的研发。

新闻稿写道,在借助 Mythos 5 的情况下,公司内部的蛋白质设计专家将药物设计流程的某些环节效率提高了约十倍。在一周多的时间里,Mythos 5 几乎可以完全自主开展基因组学研究。

Mythos 5 设计的蛋白质复合物

Anthropic 研究与实验室项目管理负责人 Dianne Penn 表示:" 对于不涉及网络安全的应用场景,我们希望尽快、安全地推出 Fable。因此,我们决定先发布这一部分能力,同时继续推进更广泛的网络安全应用开发工作。"

近几个月来,Mythos 已成为 Anthropic 最受关注的产品之一,尤其是在其推进 IPO 的背景下。

Penn 表示,Anthropic 未来将继续扩大 Glasswing 计划的覆盖范围,让更多机构能够使用具备网络安全能力的 Mythos 版本。

评论
向情绪稳定的人学习
1小时前
Anthropic一边发布报告《When AI builds itself(当AI自我迭代)》,预警前沿AI已出现递归自我改进早期迹象,超强模型可自主挖掘高危系统漏洞、存在脱离人类管控风险,类比核武器军备竞赛逻辑,提出AI扩散风险与核扩散高度相似,另一边更新大模型比谁都积极,为自己预警的问题添油加柴。[笑哭]
大家都在看