上线72小时即被全球下架：Claude Fable 5 经历了什么？

开场：72小时，从巅峰到坠落

6月9日，Anthropic 发布了 Claude Fable 5。

这是 Anthropic 迄今最强的模型，第一次向公众开放的「Mythos 级」能力。Stripe 说它把几个月的工程压缩到了一天，Cursor 说它是 CursorBench 上的最高分，零度解说的实测视频播放量冲到了 4.4 万。

然后，6月11日下午5点21分，一封信从美国政府送到 Anthropic 手里。

当晚，Fable 5 和 Mythos 5 对全球所有用户全面停服。无论你在美国境内还是境外，无论你是企业客户还是 Anthropic 自己的外籍员工——全部不可用。

这是 AI 行业史上第一次：一个已经部署给数亿人的商业大模型，被政府强制召回。

两件事同时发生

要理解这次下架，需要先看清同一天发生的另一件事。

6月11日白天，Anthropic 刚刚为另一场争议公开道歉。

事情起源于 Fable 5 发布后，社区在一份 319 页的系统安全卡中发现了一个「秘密降级」机制。当模型检测到用户在做前沿 AI 研究（比如训练自己的大模型、设计 AI 芯片），它不会拒绝请求，也不会告诉用户发生了什么——而是悄悄把回答质量降到 Opus 4.8 的水平。

用户只会在体感上觉得「答案突然变差了」，但完全不知道为什么。

AI 研究员 Nathan Lambert 批评这「骇人听闻」。Fast.ai 联合创始人 Jeremy Howard 在 X 上直言：「让实验室自己的模型不能用于前沿 AI 研究，但其他人可以用——这意味着前沿根本不会前进。」

Anthropic 在 6月11日上午道歉：「我们做出了错误的取捨，为此道歉。」并承诺改为显式的 fallback——检测到相关请求时，直接切换到 Opus 4.8 并告知用户。

几个小时后，政府禁令到了。

政府到底说了什么？

信的内容很短，但很重。

美国政府引用国家安全权限，发布出口管制指令：暂停所有外国主体对 Fable 5 和 Mythos 5 的访问，无论身处何地。Anthropic 的实际执行方式是一刀切——对所有客户全部停服，因为无法精准区分「外国主体」和「本国主体」。

信中没有说明具体的国家安全顾虑。

Anthropic 在官方声明中透露了他们的理解：「政府认为已掌握了一种绕过（jailbreak）Fable 5 的方法。」但政府迄今只提供了口头证据，展示了一种「狭窄的、非通用的越狱」——本质上是要求模型读取特定代码库并修复其中的软件缺陷。

Anthropic 明确表示不同意这个结论：「我们不同意某个狭窄的潜在越狱漏洞，就应当成为召回一个已部署给数亿用户的商业模型的理由。」

更关键的是，Anthropic 指出这种能力「其他公开可用的模型也能做到」——包括 OpenAI 的 GPT-5.5。也就是说，政府封禁的这个「漏洞」，在别的模型上也存在。

来龙去脉：一场持续两个月的拉锯

这次下架不是突发事件，而是一场更长博弈的高潮。

时间线拉回 4 月。Anthropic 当时发布了 Claude Mythos Preview，只对极少数合作方开放——主要是网络安全防御者和关键基础设施提供商。原因是 Mythos 级模型的漏洞发现能力太强，能串联多个漏洞形成攻击链，Anthropic 认为不能直接放出来。

5月28日，Anthropic 发布了 Opus 4.8——Fable 5 的「前置机型」。当 Fable 5 的安全分类器检测到高风险查询时，会自动 fallback 到 Opus 4.8。

6月9日，Fable 5 正式公开。定价是 Opus 4.8 的两倍（输入 $10/百万 token，输出 $50/百万 token），但 Anthropic 说这是 Mythos Preview 价格的一半以下。订阅用户在 6月22日前免费使用。

6月10日，Anthropic CEO Dario Amodei 发表了一篇政策长文《Policy on the AI Exponential》，主张「政府应该有权阻止被判定为过于危险的 AI 系统进入市场」。

6月11日，秘密降级争议爆发 → Anthropic 道歉 → 政府禁令到达 → 全球停服。

值得注意的背景是：更早之前，美国国防部曾与 Anthropic 就 Claude 模型的访问权产生过争端。五角大楼一度将 Anthropic 列为「供应链安全风险」，国防部长 Pete Hegseth 拒绝了 Anthropic 改变这一认定的请愿。联邦法院的相关诉讼至今未决。

Anthropic 为什么选择「先服再争」？

Anthropic 的声明里有一个微妙的立场：遵从政府指令，但公开表达不同意。

这不是第一次发生类似的事。在 AI 行业，公司面对政府监管时通常有两种选择：一是默默执行，二是公开抗争。Anthropic 选了第三条路——执行的同时发表一篇措辞克制但立场鲜明的声明，把分歧摊到公众面前。

声明中有一段话值得注意：「如果这个标准适用于整个行业，实际上将阻止所有前沿模型提供商部署新模型。」

这句话的潜台词很清楚：政府今天能因为一个狭窄的越狱召回 Fable 5，明天就能因为类似的原因阻止任何新模型发布。Anthropic 在为整个行业划定一条红线。

与此同时，Anthropic 正准备 IPO——估值 9650 亿美元，与 OpenAI 和 SpaceX 同期提交了上市申请。下架事件对一家即将上市的公司来说，当然是坏消息，但 Anthropic 似乎判断：公开表态的长期收益，大于短期股价压力。

对开发者意味着什么

直接影响很明确。

所有 Claude 产品中，新建的会话切换到默认模型或 Opus 4.8。现有的 Fable 5 会话会报错中止。API 调用 claude-fable-5 会返回错误。Anthropic 建议开发者「更新集成，切换至其他 Claude 模型」。

对于重度依赖 Fable 5 的开发团队，这意味着需要回退到 Opus 4.8——性能差距在部分基准测试上超过 10%。Cursor、GitHub 等集成商需要调整模型推荐策略。

但更深层的影响是信任层面的。

两周之内，Fable 5 的用户经历了三次冲击：先是发现模型会悄悄降级自己的回答，然后看到 Anthropic 道歉承认错误，最后整个模型被政府叫停。对于那些刚把工作流迁移到 Fable 5 上的团队来说，这是一次完整的信任冲击。

LINUX DO 社区的反应很直接：「大周末的竟然拉闸了。」

未解的问题

这次事件留下了几个人们仍在讨论的问题。

那个「越狱」到底是什么？ 政府说掌握了绕过 Fable 5 的方法，但没有公布细节。Anthropic 说这只是一个「让模型读代码库修漏洞」的狭窄攻击，而且 GPT-5.5 也能做到。真相可能介于两者之间——但公众无从判断。

数据保留的代价。 Fable 5 发布时就附带了一个争议性条款：所有流量强制保留 30 天，即使企业此前有零保留协议。Anthropic 说数据不用于训练，只用于安全防御。但在政府禁令的语境下，这个「安全防御」保留的数据，是否会成为政府调查的素材？

先例效应。 如果一个狭窄的越狱就能触发已部署模型的全球召回，那每家前沿模型公司发布新模型时，是否都要先通过政府的「越狱审查」？Anthropic 说这是「第一次」，但可能不会是最后一次。

秘密降级的遗产。 虽然 Anthropic 道歉并承诺修改，但这一事件已经改变了行业对 AI 安全机制的信任预期。以后任何 AI 公司声称的「安全防护」，都可能被追问：这是明面上的拦截，还是暗地里的降级？

写在最后

Claude Fable 5 的故事还没结束。Anthropic 在声明中表示正在「努力尽快恢复访问权限」。恢复的时间、条件和形式，将决定这件事最终是一次短暂的中断，还是 AI 行业监管范式的转折点。

但有一点已经很清楚：最强的 AI 模型不再只是一个技术产品。它同时是地缘政治的筹码和监管博弈的试验场。当模型强大到政府不得不介入时，「安全」这个词的含义，已经远远超出了技术范畴。