OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁

倚天百科 百科资讯 1

6月23日消息,OpenAI宣布将其Daybreak网络安全计划扩展至包含一款专门为安全研究人员和防御人员设计的AI模型GPT-5.5-Cyber,初步基准测试显示,该模型在CyberGym测试中得分85.6%,超越了Claude Mythos 5的83.8%,帮助OpenAI重夺榜首位置。

自今年3月Codex Security发布以来,该工具已分析超过30,000个代码库中的逾3亿个代码提交,识别出70,000个被人类审查者标记为已修复的问题,另有超过50万份报告被自动标记为已解决。

OpenAI指出,当前AI工具在发现新漏洞方面已展现出强大能力,但在漏洞评估、修复和提供安全更新方面仍存在不足,GPT-5.5-Cyber正是为此而生,它不仅能够识别漏洞,还能自主创建补丁。

该AI代理可执行深度代码分析、检查变更、还原攻击路径、生成安全报告,并随后准备定制补丁供人工审查,还支持评估外部来源信息,如漏洞赏金报告、建议和票务系统,并可将结果集成到现有漏洞管理系统中。

CyberGym测试(网络安全评测集)得分85.6%,高于标准版GPT-5.5的81.8%和Claude Mythos 5的83.8%。

ExploitGym测试(考验智能体能否将已知漏洞转化为可执行的攻击代码)中,GPT-5.5-Cyber得分39.5%,而GPT-5.5仅为25.95%。SEC-Bench Pro测试(长链条漏洞挖掘)中,该模型得分69.8%,领先基础版的63.1%。