全天候科技 08-06
抢在GPT-5前升级模型,Anthropic发布Opus 4.1,编程、研究、数据分析更强大
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

人工智能(AI)模型的竞赛再度升温。在 OpenAI 即将发布备受期待的 GPT-5 之际,Anthropic 率先升级自家模型,推出 Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。

美东时间 8 月 5 日周二,由前 OpenAI 员工创立的 OpenAI 劲敌 Anthropic 宣布,新模型 Opus 4.1 在编程评估基准 SWE-Bench Verified 上的得分达到 74.5%,较前代 Opus 4 的 72.5% 提升两个百分点。

新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group 等客户反馈显示,Opus 4.1 在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。

面对 OpenAI 本月可能发布 GPT-5 的竞争压力,Anthropic 选择聚焦现有产品优化。

Anthropic 的首席产品官 Mike Krieger 表示,此次 Opus 模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:

" 过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。"

性能提升聚焦编程领域

Anthropic 公布的数据显示,Opus 4.1 在编程能力方面实现了实质性突破。

Anthropic 公布,在评估大语言模型(LLM)完成现实世界软件工程能力的 SWE-Bench Verified 基准测试中,Opus 4.1 取得 74.5% 的准确率。这一成绩相比 Claude Sonnet 3.7 的 62.3% 和 Opus 4 的 72.5% 有明显进步。

Anthropic 强调,升级后的 Opus 模型在处理复杂多步骤问题时更加高效,定位为更有效的 AI 代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。

Opus 4.1 还 " 提升了 Claude 的深入研究和数据分析能力,尤其是在细节追踪和代理搜索方面。"

Anthropic 本周二表示,被 Cognition 收购的 AI 编程助手 Windsurf 反馈称,Opus 4.1 在其初级开发人员基准测试中较 Opus 4 有一个标准差的改进,性能提升幅度相当于从 Sonnet 3.7 跃升至 Sonnet 4 的水平。

客户反馈验证实用价值

Anthropic 本周二提到一些企业客户的使用反馈,它们证实了新模型的实际改进效果。

比如日本电商巨头乐天集团(Rakuten Group)发现,Opus 4.1 擅长在大型代码库中精确定位需要修正的位置,无需进行不必要的调整或引入漏洞,乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。

Windsurf 表示,使用 Opus 4.1 后编程任务完成速度更快,质量也有所提高。GitHub 则指出,Opus 4.1 相对于 Opus 4 在大多数功能上都有改进,在多文件代码重构方面的性能提升尤为显著。

市场竞争加剧背景下的战略调整

Anthropic 此次发布正值 AI 行业竞争白热化之际。谷歌和 OpenAI 都推出了帮助程序员简化代码编写和调试流程的功能,而 OpenAI 高管也在公开场合为即将发布的 GPT-5 造势,有报道称该产品可能在本月推出。

被问及 OpenAI 即将发布的产品时,Mike Krieger 表示:" 我学到的一点是,我们要专注于自己拥有的东西,尤其是在快速发展的 AI 领域,其他人要做什么最终取决于他们自己。"

Anthropic 本周二表示,Opus 4.1 现已向付费 Claude 用户开放,并可通过 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获得,定价与 Opus 4 保持一致。Anthropic 还计划,未来几周内发布更重大的模型更新。

Anthropic 被传新融资或推升估值至 1700 亿美元

将近两周前,7 月中旬媒体称,Anthropic 称其年化收入今年上半年增长四倍,已超过 40 亿美元,其爆炸式的收入增长引起部分投资者浓厚兴趣,考虑以超过 1000 亿美元的估值进行新一轮投资,较四个月前该司宣布融资时的 580 亿美元估值几乎翻了一番。

此后,有媒体在与多位中东投资者交流后表示,Anthropic 即将到来的估值更接近 1500 亿美元。

上周又有媒体称,Anthropic 正进行 Iconiq Capital 主导的新一轮融资相关磋商,拟融资 30 亿至 50 亿美元,使公司估值达到 1700 亿美元。另有媒体称,到 7 月末,Anthropic 的年化收入已增至约 50 亿美元。该司预计,到今年年底,其经常性收入可能达到 90 亿美元。

Anthropic 的新融资消息凸显了市场对头部 AI 公司未来增长的极高预期,尤其是对 Anthropic 在 AI 编码这一应用领域的强大变现能力方面。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

人工智能 编程 竞赛
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论