
Anthropic 新模型畀美國一封信掣停:AI 安全變成可用性風險
Fable 5 同 Mythos 5 下架,企業要睇嘅唔止 jailbreak
一封信就停用
Anthropic 喺 6 月 9 日先推出 Claude Fable 5 同 Claude Mythos 5,三日後就話收到美國政府出口管制指令,理由係國家安全。按公司公告,指令要求任何外籍人士,無論身處美國入面定外面,都唔可以接觸呢兩個模型,連 Anthropic 自己外籍員工都包埋。Anthropic 話做唔到逐個按國籍穩陣分流,所以暫停所有客戶存取;其他 Claude 模型暫時唔受影響。

圖片:Anthropic
呢兩個模型點解敏感
Fable 5 係 Anthropic 稱為 Mythos-class 嘅新級數,主打長時間 coding、知識工作同 vision 任務。Fable 5 面向一般用戶,但遇到高風險 cyber 題目會有保護層,甚至改用 Opus 4.8 回應;Mythos 5 就用同一底層模型,部分保護層放開,只畀少數 cyber 防守團隊同基建供應商透過 Project Glasswing 用。重點自然由快唔快、叻唔叻,轉去一個更硬淨嘅問題:呢類模型已經踩入漏洞研究、exploit 分析同關鍵軟件防守。
爭議位係 jailbreak。TechCrunch 指,觸發點係 Amazon 研究員據稱搵到方法繞過 Fable 5 guardrails;Anthropic 就話,政府信件冇公開具體技術細節,佢哋睇到嘅示範只係搵到少量已知、較輕微漏洞,而且其他公開模型都做到相近結果,包括 GPT-5.5。安全圈嘅反彈都好快:freefable.org 公開信由多名資安主管同研究員簽署,講明呢啲能力唔係 Anthropic 獨有,太快抽走工具反而削弱防守方。
我覺得美國政府關注 cyber 能力唔奇怪,尤其模型可以幫人自動讀 code、搵漏洞、寫修補建議,攻守兩邊都用得着。問題係,當一封冇公開細節嘅出口管制信,可以令一個剛推出三日嘅雲端模型全球停用,AI 安全已經牽涉模型評測之外嘅事:供應鏈同可用性風險。
對開發者同企業有咩實際意思
- 可用性:產品唔好死綁單一模型,尤其係 coding agent、code review、客服同內容生產流程;要有 fallback、model router 同基本 eval。
- 合規:Mythos-class 模型有 30 日資料保留要求。AWS 文件寫明,Bedrock 用戶 opt in 之後,資料會離開 AWS 嘅 data/security boundary。
- 安全:jailbreak 唔係一次性補洞。要睇供應商點公開風險、點做 red-team、點處理濫用監測同客戶通知。
呢件事甚至可能幫咗 Anthropic 做品牌宣傳:畀政府掣停嘅模型,自然令人覺得能力好誇張。但對真正要用 API 做產品嘅團隊,神秘感唔值錢,穩定、可審計、可替換先值錢。Fable 5 事件最值得記低嘅位係:AI 工具已經由 SaaS 功能,變成半個受管制基建。你愈靠佢寫 code、審 code、跑 agent,愈要準備退出方案。
參考來源
- TechCrunch — Is the US government’s Anthropic ban accidentally helping the brand? — original report
- Statement on the US government directive to suspend access to Fable 5 and Mythos 5 — Anthropic 官方聲明,確認出口管制指令範圍、全客戶停用安排、其他模型暫時唔受影響。
- Claude Fable 5 and Claude Mythos 5 — Anthropic 發布頁,交代 Fable 5、Mythos 5 嘅定位、guardrails、Project Glasswing 同模型用途。
- Open Letter on Transparent AI Cyber Protections — 資安界公開信,提供反對禁令嘅技術同政策理由,包括能力唔獨有同防守方受損。
- Data retention practices for Mythos-class models — Claude Help Center 官方資料,確認 Mythos-class prompt 同 output 30 日保留及 ZDR 影響。
- Anthropic Claude Fable 5 on AWS: Mythos-class capabilities with built-in safeguards now available — AWS 官方發布,補充 Bedrock 存取、資料保留設定,以及資料離開 AWS data/security boundary 嘅合規重點。
本文根據原文及公開資料整理;資料有出入時,以原文及官方資料為準。



