Anthropic 叫全球 AI 開發慢一慢:Claude Code 已經寫到自家八成 code
Tech News

Anthropic 叫全球 AI 開發慢一慢:Claude Code 已經寫到自家八成 code

圖片:via Engadget — https://www.engadget.com/2188066/anthropic-proposes-global-ai-development-slowdown/
TechLab 編輯部(譯)·

重點放喺 coding agent 點改變工程管理

Anthropic 又拋咗一個聽落好大嘅主張:如果 AI 系統開始可以幫自己設計下一代模型,全球主要 AI lab 需要有一個可驗證嘅 slowdown,甚至 pause 選項。呢句聽落似科幻,但今次真正值得睇嘅位,唔係 Skynet 味恐慌,而係 coding agent 已經點樣改變工程隊日常。

Claude Code 已經唔係補全工具

Anthropic 自己披露,2026 年 5 月超過 80% merged production code 由 Claude 撰寫;2026 Q2 典型工程師每日 merge code 量,係 2024 嘅 8 倍。呢啲數字要打折睇,因為 lines of code 唔等於好 code,Anthropic 亦承認呢個只係粗略 proxy。但方向好清楚:工程師愈嚟愈似 reviewer、planner 同 experiment owner,唔再淨係打字寫 function 嘅人。

Claude Code 由 2025 年 2 月 research preview 開始,定位已經唔止係「幫你補一句 code」。佢可以讀 repo、改檔、跑測試、commit、推 GitHub,仲可以喺比較長嘅工作流入面自己試錯。Anthropic 話內部已經用 Claude 做自動 code review,事後分析指約三分之一過往 incident bug 本來有機會早啲畀捉到。換句話講,AI 唔單止寫 code,亦開始審 code。

Anthropic 官方圖表,顯示 2021 至 2026 年每位工程師每季貢獻 code 量變化

圖片:Anthropic

slowdown 講法有幾多現實味

Anthropic 嘅推論係:當寫 code、跑實驗同 debug 嘅成本急跌,AI 研發本身會加速;再下一步,就係 AI 幫手訓練、評估、改良下一代 AI。佢話而家未到 recursive self-improvement,亦唔保證一定會到,但如果來得快過制度同 alignment research,風險就會變大。單一公司自己停低作用有限;Anthropic 想像嘅方案,係多國、多間 frontier lab 用同一條件暫停,仲要互相驗證冇人偷跑。

難位係,訓練 run 較導彈井易收埋得多,GPU、電力同 data pipeline 都唔係望兩眼就核實到。假如暫停只係畀較唔謹慎嘅對手追上,安全反而可能變差。呢點亦係佢份文最現實嘅地方:有 pause 掣之前,要先有 trust、telemetry 同 enforcement。核武條約都係幾十年磨出嚟;AI 公司冇咁多時間,亦未必真係有咁多誘因。

Anthropic 官方圖表,顯示 Claude Code 喺唔同難度任務嘅 session success rate 走勢

圖片:Anthropic

先唔好照單全收

呢份論述有商業味,呢點要講清楚。Anthropic 一邊講風險,一邊賣 Claude、Claude Code 同企業 security 產品;佢越能證明「我哋嘅 model 勁到要小心」,品牌 positioning 就越有利。Engadget 引用評論指,有人質疑呢類警告係 marketing ploy;呢個質疑合理,但唔代表數據冇參考價值。較穩陣嘅讀法:當佢係一間 frontier lab 公開自己 workflow 變化,同時帶住自己利益講治理。

Anthropic 官方圖表,顯示多個 Claude model 揀下一步研究方向嘅表現

圖片:Anthropic

對用 coding agent 嘅團隊有咩意思

香港細 team、startup、agency 或公司內部 IT,未必關心全球 pause 幾時真係落地,但要關心自己 pipeline 有冇跟上。當 agent 可以改十幾個檔、跑幾十個 command、開 PR,直接落地可以由三件事開始:

  • 權限邊界:agent 淨係入到需要嘅 repo、目錄同工具。
  • review gate:security、test、human approval 過晒先 merge。
  • audit log:保留 prompt、diff、command 同決策理由,出事有得追。

我嘅睇法:Anthropic 呢次唔使當成即刻要踩 brake 嘅呼籲;更有價值嘅讀法,係佢將 coding agent 嘅變化拉返去工程治理。Claude Code、Copilot agent、Codex 呢條線都指向同一件事:軟件開發嘅瓶頸由「寫得出」轉去「審得切、管得住、信得過」。開發效率會升,但 review、資安、架構判斷同事故責任會更貴;想用 AI agent 提速,工程管理本身都要升級。


參考來源

本文根據原文及公開資料整理;資料有出入時,以原文及官方資料為準。