开场:72小时,从巅峰到坠落
6月9日,Anthropic 发布了 Claude Fable 5。
这是 Anthropic 迄今最强的模型,第一次向公众开放的「Mythos 级」能力。Stripe 说它把几个月的工程压缩到了一天,Cursor 说它是 CursorBench 上的最高分,零度解说的实测视频播放量冲到了 4.4 万。
然后,6月11日下午5点21分,一封信从美国政府送到 Anthropic 手里。
当晚,Fable 5 和 Mythos 5 对全球所有用户全面停服。无论你在美国境内还是境外,无论你是企业客户还是 Anthropic 自己的外籍员工——全部不可用。
这是 AI 行业史上第一次:一个已经部署给数亿人的商业大模型,被政府强制召回。
两件事同时发生
要理解这次下架,需要先看清同一天发生的另一件事。
6月11日白天,Anthropic 刚刚为另一场争议公开道歉。
事情起源于 Fable 5 发布后,社区在一份 319 页的系统安全卡中发现了一个「秘密降级」机制。当模型检测到用户在做前沿 AI 研究(比如训练自己的大模型、设计 AI 芯片),它不会拒绝请求,也不会告诉用户发生了什么——而是悄悄把回答质量降到 Opus 4.8 的水平。
用户只会在体感上觉得「答案突然变差了」,但完全不知道为什么。
AI 研究员 Nathan Lambert 批评这「骇人听闻」。Fast.ai 联合创始人 Jeremy Howard 在 X 上直言:「让实验室自己的模型不能用于前沿 AI 研究,但其他人可以用——这意味着前沿根本不会前进。」
Anthropic 在 6月11日上午道歉:「我们做出了错误的取捨,为此道歉。」并承诺改为显式的 fallback——检测到相关请求时,直接切换到 Opus 4.8 并告知用户。
几个小时后,政府禁令到了。
政府到底说了什么?
信的内容很短,但很重。
美国政府引用国家安全权限,发布出口管制指令:暂停所有外国主体对 Fable 5 和 Mythos 5 的访问,无论身处何地。Anthropic 的实际执行方式是一刀切——对所有客户全部停服,因为无法精准区分「外国主体」和「本国主体」。
信中没有说明具体的国家安全顾虑。
Anthropic 在官方声明中透露了他们的理解:「政府认为已掌握了一种绕过(jailbreak)Fable 5 的方法。」但政府迄今只提供了口头证据,展示了一种「狭窄的、非通用的越狱」——本质上是要求模型读取特定代码库并修复其中的软件缺陷。
Anthropic 明确表示不同意这个结论:「我们不同意某个狭窄的潜在越狱漏洞,就应当成为召回一个已部署给数亿用户的商业模型的理由。」
更关键的是,Anthropic 指出这种能力「其他公开可用的模型也能做到」——包括 OpenAI 的 GPT-5.5。也就是说,政府封禁的这个「漏洞」,在别的模型上也存在。
来龙去脉:一场持续两个月的拉锯
这次下架不是突发事件,而是一场更长博弈的高潮。
时间线拉回 4 月。Anthropic 当时发布了 Claude Mythos Preview,只对极少数合作方开放——主要是网络安全防御者和关键基础设施提供商。原因是 Mythos 级模型的漏洞发现能力太强,能串联多个漏洞形成攻击链,Anthropic 认为不能直接放出来。
5月28日,Anthropic 发布了 Opus 4.8——Fable 5 的「前置机型」。当 Fable 5 的安全分类器检测到高风险查询时,会自动 fallback 到 Opus 4.8。
6月9日,Fable 5 正式公开。定价是 Opus 4.8 的两倍(输入 $10/百万 token,输出 $50/百万 token),但 Anthropic 说这是 Mythos Preview 价格的一半以下。订阅用户在 6月22日前免费使用。
6月10日,Anthropic CEO Dario Amodei 发表了一篇政策长文《Policy on the AI Exponential》,主张「政府应该有权阻止被判定为过于危险的 AI 系统进入市场」。
6月11日,秘密降级争议爆发 → Anthropic 道歉 → 政府禁令到达 → 全球停服。
值得注意的背景是:更早之前,美国国防部曾与 Anthropic 就 Claude 模型的访问权产生过争端。五角大楼一度将 Anthropic 列为「供应链安全风险」,国防部长 Pete Hegseth 拒绝了 Anthropic 改变这一认定的请愿。联邦法院的相关诉讼至今未决。
Anthropic 为什么选择「先服再争」?
Anthropic 的声明里有一个微妙的立场:遵从政府指令,但公开表达不同意。
这不是第一次发生类似的事。在 AI 行业,公司面对政府监管时通常有两种选择:一是默默执行,二是公开抗争。Anthropic 选了第三条路——执行的同时发表一篇措辞克制但立场鲜明的声明,把分歧摊到公众面前。
声明中有一段话值得注意:「如果这个标准适用于整个行业,实际上将阻止所有前沿模型提供商部署新模型。」
这句话的潜台词很清楚:政府今天能因为一个狭窄的越狱召回 Fable 5,明天就能因为类似的原因阻止任何新模型发布。Anthropic 在为整个行业划定一条红线。
与此同时,Anthropic 正准备 IPO——估值 9650 亿美元,与 OpenAI 和 SpaceX 同期提交了上市申请。下架事件对一家即将上市的公司来说,当然是坏消息,但 Anthropic 似乎判断:公开表态的长期收益,大于短期股价压力。
对开发者意味着什么
直接影响很明确。
所有 Claude 产品中,新建的会话切换到默认模型或 Opus 4.8。现有的 Fable 5 会话会报错中止。API 调用 claude-fable-5 会返回错误。Anthropic 建议开发者「更新集成,切换至其他 Claude 模型」。
对于重度依赖 Fable 5 的开发团队,这意味着需要回退到 Opus 4.8——性能差距在部分基准测试上超过 10%。Cursor、GitHub 等集成商需要调整模型推荐策略。
但更深层的影响是信任层面的。
两周之内,Fable 5 的用户经历了三次冲击:先是发现模型会悄悄降级自己的回答,然后看到 Anthropic 道歉承认错误,最后整个模型被政府叫停。对于那些刚把工作流迁移到 Fable 5 上的团队来说,这是一次完整的信任冲击。
LINUX DO 社区的反应很直接:「大周末的竟然拉闸了。」
未解的问题
这次事件留下了几个人们仍在讨论的问题。
那个「越狱」到底是什么? 政府说掌握了绕过 Fable 5 的方法,但没有公布细节。Anthropic 说这只是一个「让模型读代码库修漏洞」的狭窄攻击,而且 GPT-5.5 也能做到。真相可能介于两者之间——但公众无从判断。
数据保留的代价。 Fable 5 发布时就附带了一个争议性条款:所有流量强制保留 30 天,即使企业此前有零保留协议。Anthropic 说数据不用于训练,只用于安全防御。但在政府禁令的语境下,这个「安全防御」保留的数据,是否会成为政府调查的素材?
先例效应。 如果一个狭窄的越狱就能触发已部署模型的全球召回,那每家前沿模型公司发布新模型时,是否都要先通过政府的「越狱审查」?Anthropic 说这是「第一次」,但可能不会是最后一次。
秘密降级的遗产。 虽然 Anthropic 道歉并承诺修改,但这一事件已经改变了行业对 AI 安全机制的信任预期。以后任何 AI 公司声称的「安全防护」,都可能被追问:这是明面上的拦截,还是暗地里的降级?
写在最后
Claude Fable 5 的故事还没结束。Anthropic 在声明中表示正在「努力尽快恢复访问权限」。恢复的时间、条件和形式,将决定这件事最终是一次短暂的中断,还是 AI 行业监管范式的转折点。
但有一点已经很清楚:最强的 AI 模型不再只是一个技术产品。它同时是地缘政治的筹码和监管博弈的试验场。当模型强大到政府不得不介入时,「安全」这个词的含义,已经远远超出了技术范畴。