Anthropic 報告了據稱是首次確認的幾乎完全由 AI 策劃的政府支持網路攻擊案例。
根據週四發布的部落格文章,該公司在 2025 年 9 月中旬觀察到與其 Claude Code 工具相關的異常行為後,偵測到了這次攻擊活動。
Anthropic 毫無疑問地確信,這次間諜行動是由一個中國政府支持的駭客組織執行的,涉及滲透約三十個高價值目標,包括多個國家的主要科技公司、銀行、化學製造商和政府機構。其中一些攻擊成功了。
這次攻擊與過去的網路行動不同之處不僅在於幕後黑手,還在於其執行方式。
Anthropic 表示,整個攻擊的大約 80 到 90% 是由 AI 執行的,人類操作員僅在少數關鍵決策時介入。
駭客越獄 Claude 並讓它以為自己在做合法工作
攻擊者首先圍繞 Claude Code(Anthropic 自己的 AI 模型)建立了一個自動攻擊框架,並欺騙它以為自己受僱於一家進行內部測試的網路安全公司。
他們通過越獄破解了 Claude 的安全過濾器,這種策略讓他們能夠通過向 AI 提供看似無害的小型、無上下文任務來繞過內建保護。Claude 不知道它被用於攻擊性操作,因為它在任何時候都沒有獲得完整的情況說明。
一旦模型投入使用,行動就迅速展開。Claude 掃描了每個目標的網路,識別出基礎設施中最敏感的部分,並為人類操作員總結了布局。然後,它開始尋找這些系統中的漏洞。利用其內建的編碼能力,Claude 編寫了自定義漏洞利用代碼,識別弱點,並檢索登錄憑證。隨後,它提取了大量內部數據,根據可能的價值進行組織,並標記了高訪問權限帳戶。
在 AI 獲得管理員級別控制權後,它創建了後門,使其能夠持續訪問被入侵的系統。完成後,Claude 撰寫了詳細的報告,記錄了它所做的一切(列出用戶名、被入侵的系統和憑證),以便攻擊框架可以在未來的行動中使用這些信息。
雖然 Claude 非常高效,但它並非完美無缺。有時它會編造密碼或錯誤地將公共數據識別為敏感數據。但這些故障很少見,並沒有減慢整體任務的進度。AI 執行的純粹速度,每秒處理數千個請求,遠遠超過了人類團隊所能完成的任何事情。
AI 代理現在執行精英駭客小隊的工作——幾乎不需要人參與
這次行動是一個轉折點,因為它顯示了 AI 在短短一年內取得了多大的進步。Claude 實際上在這裡運行循環、做出決策,並在沒有直接命令的情況下將複雜的序列連接在一起。
這個 AI 模型使用了來自模型上下文協議的工具,使其能夠訪問外部軟件,如密碼破解器、網路映射器和數據檢索器,這些以前只由人類控制。
Claude 系統現在能夠理解複雜的指令,自行編寫漏洞利用代碼,並在很少指導的情況下管理複雜的網路安全操作。這些 AI 代理不僅僅是協助駭客,它們就是駭客。而且它們每天都變得更加強大。
發現入侵後,Anthropic 立即開始了為期十天的調查,逐一禁止惡意帳戶。他們警告了受影響的組織,與當局合作傳遞情報,並擴展了他們的檢測系統以捕捉未來類似的操作。
但該公司並不假裝這是一次性問題。團隊表示,這些攻擊只會變得更加普遍,更容易實施。這是因為運行它們所需的技能不再局限於精英駭客。如果有人能夠越獄一個模型並將其插入正確的工具集,他們就可以進行大規模的行動,而不需要一個團隊甚至深入的技術知識。
隨著 AI 模型超越人類監督而發展,Anthropic 警告威脅升級
影響是巨大的,因為如果沒有深厚資金或技術技能的團隊可以使用自動化 AI 系統發起國家規模的攻擊,那麼反烏托邦肯定已經降臨。
Anthropic 的威脅情報團隊警告說,雖然他們只通過 Claude 追踪了這些活動,但類似的濫用可能正在其他前沿 AI 模型上發生。他們表示,這是網路戰爭新標準的開始。
那麼,為什麼還要繼續發布具有這些能力的模型呢?Anthropic 認為,這些相同的工具對於防禦至關重要,稱「執行攻擊的 AI 也是 Anthropic 分析師用來挖掘殘骸、尋找模式並理解行動全部規模的同類型 AI」。
不過,他們確實承諾改進其模型的內部安全層,以及完善其攻擊檢測分類器,並公開發布像這樣的案例研究,以便行業中的其他人可以做好準備。
然而,Anthropic 表示,僅僅依靠他們是不夠的。他們敦促所有開發大型模型的開發人員大力投資於安全。
他們還呼籲網路安全團隊開始將 AI 整合到威脅檢測、事件響應、漏洞掃描和安全運營中心自動化中,因為傳統方法已經不夠快了。
如果你正在閱讀這篇文章,你已經領先了。繼續關注我們的通訊。
來源:https://www.cryptopolitan.com/anthropic-china-ai%E2%80%91orchestrated-espionage/








