OpenAI“抓虫AI”登顶测试榜能发现漏洞更能一键打补丁

快科技 6 月 23 日消息，OpenAI 宣布将其 Daybreak 网络安全计划扩展至包含一款专门为安全研究人员和防御人员设计的 AI 模型 GPT-5.5-Cyber，初步基准测试显示，该模型在 CyberGym 测试中得分 85.6%，超越了 Claude Mythos 5 的 83.8%，帮助 OpenAI 重夺榜首位置。

自今年 3 月 Codex Security 发布以来，该工具已分析超过 30,000 个代码库中的逾 3 亿个代码提交，识别出 70,000 个被人类审查者标记为已修复的问题，另有超过 50 万份报告被自动标记为已解决。

OpenAI 指出，当前 AI 工具在发现新漏洞方面已展现出强大能力，但在漏洞评估、修复和提供安全更新方面仍存在不足，GPT-5.5-Cyber 正是为此而生，它不仅能够识别漏洞，还能自主创建补丁。

该 AI 代理可执行深度代码分析、检查变更、还原攻击路径、生成安全报告，并随后准备定制补丁供人工审查，还支持评估外部来源信息，如漏洞赏金报告、建议和票务系统，并可将结果集成到现有漏洞管理系统中。

CyberGym 测试（网络安全评测集）得分 85.6%，高于标准版 GPT-5.5 的 81.8% 和 Claude Mythos 5 的 83.8%。

ExploitGym 测试（考验智能体能否将已知漏洞转化为可执行的攻击代码）中，GPT-5.5-Cyber 得分 39.5%，而 GPT-5.5 仅为 25.95%。SEC-Bench Pro 测试（长链条漏洞挖掘）中，该模型得分 69.8%，领先基础版的 63.1%。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：知微

宙世代

一起剪

相关标签