Anthropic 叫全球 AI 開發慢一慢：Claude Code 已經寫到自家八成 code

圖片：via Engadget — https://www.engadget.com/2188066/anthropic-proposes-global-ai-development-slowdown/

TechLab 編輯部（譯）·2026-06-05

重點放喺 coding agent 點改變工程管理

Anthropic 又拋咗一個聽落好大嘅主張：如果 AI 系統開始可以幫自己設計下一代模型，全球主要 AI lab 需要有一個可驗證嘅 slowdown，甚至 pause 選項。呢句聽落似科幻，但今次真正值得睇嘅位，唔係 Skynet 味恐慌，而係 coding agent 已經點樣改變工程隊日常。

Claude Code 已經唔係補全工具

Anthropic 自己披露，2026 年 5 月超過 80% merged production code 由 Claude 撰寫；2026 Q2 典型工程師每日 merge code 量，係 2024 嘅 8 倍。呢啲數字要打折睇，因為 lines of code 唔等於好 code，Anthropic 亦承認呢個只係粗略 proxy。但方向好清楚：工程師愈嚟愈似 reviewer、planner 同 experiment owner，唔再淨係打字寫 function 嘅人。

Claude Code 由 2025 年 2 月 research preview 開始，定位已經唔止係「幫你補一句 code」。佢可以讀 repo、改檔、跑測試、commit、推 GitHub，仲可以喺比較長嘅工作流入面自己試錯。Anthropic 話內部已經用 Claude 做自動 code review，事後分析指約三分之一過往 incident bug 本來有機會早啲畀捉到。換句話講，AI 唔單止寫 code，亦開始審 code。

Anthropic 官方圖表，顯示 2021 至 2026 年每位工程師每季貢獻 code 量變化

圖片：Anthropic

slowdown 講法有幾多現實味

Anthropic 嘅推論係：當寫 code、跑實驗同 debug 嘅成本急跌，AI 研發本身會加速；再下一步，就係 AI 幫手訓練、評估、改良下一代 AI。佢話而家未到 recursive self-improvement，亦唔保證一定會到，但如果來得快過制度同 alignment research，風險就會變大。單一公司自己停低作用有限；Anthropic 想像嘅方案，係多國、多間 frontier lab 用同一條件暫停，仲要互相驗證冇人偷跑。

難位係，訓練 run 較導彈井易收埋得多，GPU、電力同 data pipeline 都唔係望兩眼就核實到。假如暫停只係畀較唔謹慎嘅對手追上，安全反而可能變差。呢點亦係佢份文最現實嘅地方：有 pause 掣之前，要先有 trust、telemetry 同 enforcement。核武條約都係幾十年磨出嚟；AI 公司冇咁多時間，亦未必真係有咁多誘因。

Anthropic 官方圖表，顯示 Claude Code 喺唔同難度任務嘅 session success rate 走勢

圖片：Anthropic

先唔好照單全收

呢份論述有商業味，呢點要講清楚。Anthropic 一邊講風險，一邊賣 Claude、Claude Code 同企業 security 產品；佢越能證明「我哋嘅 model 勁到要小心」，品牌 positioning 就越有利。Engadget 引用評論指，有人質疑呢類警告係 marketing ploy；呢個質疑合理，但唔代表數據冇參考價值。較穩陣嘅讀法：當佢係一間 frontier lab 公開自己 workflow 變化，同時帶住自己利益講治理。

Anthropic 官方圖表，顯示多個 Claude model 揀下一步研究方向嘅表現

圖片：Anthropic

對用 coding agent 嘅團隊有咩意思

香港細 team、startup、agency 或公司內部 IT，未必關心全球 pause 幾時真係落地，但要關心自己 pipeline 有冇跟上。當 agent 可以改十幾個檔、跑幾十個 command、開 PR，直接落地可以由三件事開始：

權限邊界：agent 淨係入到需要嘅 repo、目錄同工具。
review gate：security、test、human approval 過晒先 merge。
audit log：保留 prompt、diff、command 同決策理由，出事有得追。

我嘅睇法：Anthropic 呢次唔使當成即刻要踩 brake 嘅呼籲；更有價值嘅讀法，係佢將 coding agent 嘅變化拉返去工程治理。Claude Code、Copilot agent、Codex 呢條線都指向同一件事：軟件開發嘅瓶頸由「寫得出」轉去「審得切、管得住、信得過」。開發效率會升，但 review、資安、架構判斷同事故責任會更貴；想用 AI agent 提速，工程管理本身都要升級。

參考來源

Engadget — Anthropic proposes a global slowdown of AI development — original report
When AI builds itself — Anthropic 官方文章，披露 recursive self-improvement 論述、內部 coding agent 數據同 slowdown 條件。
Task-Completion Time Horizons of Frontier AI Models — METR 官方 benchmark，解釋 AI agent 可完成任務時長點量度同限制。
Claude 3.7 Sonnet and Claude Code — Anthropic 官方發布，交代 Claude Code research preview 起點同功能定位。
How AI Is Transforming Work at Anthropic — Anthropic 內部使用分析，提供 Claude Code 工作複雜度、tool calls 同 human turns 變化背景。
GitHub Introduces Coding Agent For GitHub Copilot — GitHub 官方背景，顯示 agentic coding 已經係主流開發平台競爭方向。
Introducing Codex — OpenAI 官方背景，補充雲端 coding agent 同 sandbox / review 工作流脈絡。