最先进AI大模型Claude Fable 5已被越狱!美国下全球封杀令:不许任何人使用

倚天百科 百科资讯 1

6月15日消息,如果要评选2026年AI行业最具戏剧性的事件,Anthropic Claude Fable 5的光速下架毫无疑问会排在第一位。

6月9日刚刚以史上最强AI姿态横空出世的Claude Fable 5,在全球开发者和科技爱好者的瞩目下发布,然而仅仅过去72小时,美国政府便以国家安全为由,将两款模型纳入出口管制。

本次管制范围远超常规出口限制,不仅禁止美国境外所有个人与机构访问,就连身处美国境内的外籍人士,包括Anthropic内部的外籍员工,均被划入禁止访问名单。

由于技术上无法快速精准甄别每一位用户的国籍身份,Anthropic最终选择"一刀切",全量停服两款新模型,所有用户请求自动回退至前代版本,旗下其余模型服务暂不受影响。

这场风暴的核心,是被双方各执一词的模型越狱(Jailbreak)漏洞,以及由此引发的AI安全与商业利益的激烈碰撞。当模型能力强大到足以成为"网络武器"时,所有关于安全、自由和商业的讨论都将被重新定义。

从巅峰到冰封,72小时的光速坠落

6月9日,Anthropic在万众期待中发布了其里程碑式的Mythos级大模型。Claude Fable 5作为首个面向公众开放的Mythos级产品,在几乎所有基准测试中都碾压了竞争对手。

在SWE-Bench Pro编程测试中拿到80.3%的高分,远超GPT-5.5的58.6%。在更贴近真实工程场景的Frontier Code Diamond测试中,更是以29.3%的成绩将GPT-5.5的5.7%远远甩在身后。这已经不是同一代技术之间的竞争,而是代际差距的碾压。

它的强大也获得了业界顶尖开发者工具厂商的官方认证。代码编辑器Cursor的CEO兼联合创始人迈克尔・特鲁埃尔(Michael Truell)直言:"Claude Fable 5是CursorBench上的绝对标杆,它开启了一类此前所有模型都无法解决的长周期问题。"

GitHub首席产品官马里奥・罗德里格斯(Mario Rodriguez)同样盛赞:"Fable 5是GitHub服务的开发者群体向前迈出的真正一步。在早期测试中,它以超越以往所有基准的自主性和可靠性完成了复杂的长周期编码任务。"

Anthropic当时自豪地宣称,任务越长、越复杂,Fable 5的优势就越明显。为了平衡能力与安全,公司为Fable 5加装了层层"安全护栏",当用户查询网络安全等敏感主题时,系统会自动降级到能力次强的Claude Opus 4.8进行响应。这些护栏采用保守调校策略,虽然有时会误拦无害请求,但平均触发概率低于5%。

同时,公司还推出了无安全护栏的Mythos 5版本,仅通过与美国政府合作的玻璃翼计划(Project Glasswing)向少数网络安全防御人员开放。

发现漏洞与CEO的强硬拒绝

美国东部时间6月12日晚5点21分,Anthropic收到了美国政府的出口管制指令。要求立即暂停所有外国人对Fable 5和Mythos 5的访问,无论其身处美国境内还是境外。

公司在官网首页置顶紧急公告:"美国政府援引国家安全部门的理由,发布了出口管制指令,暂停任何外国人(无论在美国境内还是境外)访问Claude Fable 5和Claude Mythos 5。该命令的最终效果是,我们必须突然禁用所有客户的Fable 5和Mythos 5,以确保合规。访问其他所有 Claude 型号不受影响。 对于给客户带来的干扰,我们深表歉意。我们认为这是一个误解,正在尽快恢复访问。"

据美国总统科学技术顾问委员会(PCAST)联合主席、前白宫人工智能事务负责人大卫·萨克斯(David Sacks)发布的详细爆料,事件的导火索,是一个能够绕过Fable 5所有安全护栏的越狱漏洞。这个漏洞由一位同时为Anthropic和美国政府工作的可信第三方伙伴发现。

美国政府当即要求Anthropic CEO达里奥・阿莫迪(Dario Amodei)要么立即修复漏洞,要么临时下架模型。但令人意外的是,阿莫迪明确拒绝了这一要求。

萨克斯透露,美国政府是"不情愿地"发布了这一出口管制措施。政府对Anthropic不愿配合这一合理的安全要求感到非常意外。Anthropic的反应与其作为安全优先的AI研究机构的品牌形象和核心价值观严重脱节。

他同时强调,这次行动与Anthropic此前和国防部的纠纷完全无关,政府仍然高度认可Anthropic的技术能力,并认为这个问题虽然严重,但本应很容易解决。现在主动权完全掌握在Anthropic手中。

什么是模型越狱?为什么它如此致命?

在AI领域,模型越狱(Jailbreak)指的是通过精心设计的提示词或技术手段,绕过AI系统内置的安全防护和内容限制,使其生成原本被禁止的内容或执行原本被限制的操作。

对于普通AI模型来说,越狱可能只是让它生成一些不当言论或虚假信息。但对于Fable 5这样的Mythos级模型,越狱的后果完全不可同日而语。正如萨克斯所指出的:"Fable本质上就是加装了护栏的Mythos,一旦护栏被突破,就等于将Mythos及其先进的网络攻击能力完全暴露给了无权获取的人。"

更关键的是,Anthropic自己曾大肆宣扬Mythos属于"网络武器级"模型,应当按此类别接受严格监管。他们主动向政府申请对Mythos实施管制,并极力标榜Fable的安全护栏是其能够公开发布的唯一前提。这也是为什么这次漏洞事件让美国政府如此介意。你自己说这是武器,现在武器的保险被撬开了,你却说没关系,换谁都不会信。

谁在说谎?

对于这个漏洞的严重程度,双方展开了激烈的口水战。

Anthropic在长达数千字的官方声明中详细阐述了自己的立场。公司表示,政府的信函没有提供任何具体的国家安全细节,他们理解政府的担忧是基于一个"狭窄且非通用"的越狱方法。“我们审查了这个特定技术的演示,它只能识别少量已知的、轻微的漏洞。这些漏洞都非常简单,我们发现其他公开可用的模型在不需要越狱的情况下也能发现它们。”

Anthropic强调,在Fable发布前的数周里,他们与美国政府、英国人工智能安全研究所(UKAISI)、多个第三方机构以及内部团队合作,对安全护栏进行了总计数千小时的红队测试。这些测试表明,Fable的安全护栏比任何之前部署的模型都要有效得多。没有任何测试人员能够找到一个通用越狱,也就是能够非常广泛地绕过模型护栏、解锁大量网络能力的方法。

公司还表示,他们早就明确指出,目前没有任何模型提供商能够实现完美的越狱防护。我们采用了深度防御策略,目标是让越狱要么范围狭窄,要么成本极高,并结合全面监控来快速检测和关闭任何成功的攻击。这也是为什么我们要求保留客户数据30天。这一政策变化给我们带来了实际的客户成本,但它使我们能够研究和缓解越狱问题。

Anthropic认为,因为一个非通用的小漏洞就下架一款服务数亿用户的产品是不合理的。如果这一标准在整个行业应用,我们相信它将基本上停止所有前沿模型提供商的新模型部署。

但美国政府完全不认同这一说法。萨克斯直言,很难想象,他们竟然能声称一种能让网络武器生效的越狱漏洞"不严重"。

据知情人士消息,美国政府之所以反应如此激烈,部分原因是怀疑一个与中国有关的组织已经通过该漏洞访问了Mythos 5的完整能力,存在模型被逆向工程或蒸馏的风险。不过Anthropic方面表示,白宫在与他们的沟通中从未提及这一点。

AI监管的分水岭

这背后其实是整个行业的一个核心矛盾,当模型能力强大到足以影响“国家安全”时,企业还有没有资格独自决定什么是"可接受的风险"?

Anthropic认为自己有完善的安全体系,政府不应该过度干预。但美国政府认为,只要存在一丝风险,就应该采取最严厉的措施。

截至发稿,双方仍在谈判中。当AI能力强大到足以成为"网络武器"时,安全与自由的边界究竟应该划在哪里?这个问题,或许没有简单的答案。