
Anthropic 叫全球 AI 開發慢一慢:Claude Code 已經寫到自家八成 code
重點放喺 coding agent 點改變工程管理
Anthropic 又拋咗一個聽落好大嘅主張:如果 AI 系統開始可以幫自己設計下一代模型,全球主要 AI lab 需要有一個可驗證嘅 slowdown,甚至 pause 選項。呢句聽落似科幻,但今次真正值得睇嘅位,唔係 Skynet 味恐慌,而係 coding agent 已經點樣改變工程隊日常。
Claude Code 已經唔係補全工具
Anthropic 自己披露,2026 年 5 月超過 80% merged production code 由 Claude 撰寫;2026 Q2 典型工程師每日 merge code 量,係 2024 嘅 8 倍。呢啲數字要打折睇,因為 lines of code 唔等於好 code,Anthropic 亦承認呢個只係粗略 proxy。但方向好清楚:工程師愈嚟愈似 reviewer、planner 同 experiment owner,唔再淨係打字寫 function 嘅人。
Claude Code 由 2025 年 2 月 research preview 開始,定位已經唔止係「幫你補一句 code」。佢可以讀 repo、改檔、跑測試、commit、推 GitHub,仲可以喺比較長嘅工作流入面自己試錯。Anthropic 話內部已經用 Claude 做自動 code review,事後分析指約三分之一過往 incident bug 本來有機會早啲畀捉到。換句話講,AI 唔單止寫 code,亦開始審 code。

圖片:Anthropic
slowdown 講法有幾多現實味
Anthropic 嘅推論係:當寫 code、跑實驗同 debug 嘅成本急跌,AI 研發本身會加速;再下一步,就係 AI 幫手訓練、評估、改良下一代 AI。佢話而家未到 recursive self-improvement,亦唔保證一定會到,但如果來得快過制度同 alignment research,風險就會變大。單一公司自己停低作用有限;Anthropic 想像嘅方案,係多國、多間 frontier lab 用同一條件暫停,仲要互相驗證冇人偷跑。
難位係,訓練 run 較導彈井易收埋得多,GPU、電力同 data pipeline 都唔係望兩眼就核實到。假如暫停只係畀較唔謹慎嘅對手追上,安全反而可能變差。呢點亦係佢份文最現實嘅地方:有 pause 掣之前,要先有 trust、telemetry 同 enforcement。核武條約都係幾十年磨出嚟;AI 公司冇咁多時間,亦未必真係有咁多誘因。

圖片:Anthropic
先唔好照單全收
呢份論述有商業味,呢點要講清楚。Anthropic 一邊講風險,一邊賣 Claude、Claude Code 同企業 security 產品;佢越能證明「我哋嘅 model 勁到要小心」,品牌 positioning 就越有利。Engadget 引用評論指,有人質疑呢類警告係 marketing ploy;呢個質疑合理,但唔代表數據冇參考價值。較穩陣嘅讀法:當佢係一間 frontier lab 公開自己 workflow 變化,同時帶住自己利益講治理。

圖片:Anthropic
對用 coding agent 嘅團隊有咩意思
香港細 team、startup、agency 或公司內部 IT,未必關心全球 pause 幾時真係落地,但要關心自己 pipeline 有冇跟上。當 agent 可以改十幾個檔、跑幾十個 command、開 PR,直接落地可以由三件事開始:
- 權限邊界:agent 淨係入到需要嘅 repo、目錄同工具。
- review gate:security、test、human approval 過晒先 merge。
- audit log:保留 prompt、diff、command 同決策理由,出事有得追。
我嘅睇法:Anthropic 呢次唔使當成即刻要踩 brake 嘅呼籲;更有價值嘅讀法,係佢將 coding agent 嘅變化拉返去工程治理。Claude Code、Copilot agent、Codex 呢條線都指向同一件事:軟件開發嘅瓶頸由「寫得出」轉去「審得切、管得住、信得過」。開發效率會升,但 review、資安、架構判斷同事故責任會更貴;想用 AI agent 提速,工程管理本身都要升級。
參考來源
- Engadget — Anthropic proposes a global slowdown of AI development — original report
- When AI builds itself — Anthropic 官方文章,披露 recursive self-improvement 論述、內部 coding agent 數據同 slowdown 條件。
- Task-Completion Time Horizons of Frontier AI Models — METR 官方 benchmark,解釋 AI agent 可完成任務時長點量度同限制。
- Claude 3.7 Sonnet and Claude Code — Anthropic 官方發布,交代 Claude Code research preview 起點同功能定位。
- How AI Is Transforming Work at Anthropic — Anthropic 內部使用分析,提供 Claude Code 工作複雜度、tool calls 同 human turns 變化背景。
- GitHub Introduces Coding Agent For GitHub Copilot — GitHub 官方背景,顯示 agentic coding 已經係主流開發平台競爭方向。
- Introducing Codex — OpenAI 官方背景,補充雲端 coding agent 同 sandbox / review 工作流脈絡。
本文根據原文及公開資料整理;資料有出入時,以原文及官方資料為準。



