當網際網路中通常不可見的部分突然出現故障時,世界其餘地區很快就會注意到。這一點在11月18日變得明顯,當時網際網路基礎設施公司Cloudflare發生的廣泛停機導致錯誤訊息在無數網站上閃現,包括Google(及其各種相關服務)、X、ChatGPT等,持續超過三小時。
最終,一個常規軟體錯誤被歸咎於這一事件,Cloudflare的公關團隊聲稱一個內部配置檔案比預期增長得更大,導致處理公司流量的關鍵系統崩潰。到了下午,修復已經實施並發布了公開道歉。然而,這一事件引發了更廣泛的反思,去中心化計算市場Argentum AI的執行長Andrew Sobko強調:
Cloudflare停機期間ChatGPT用戶收到的錯誤訊息
然而Cloudflare只是最新倒下的骨牌,此前AWS在10月20日遭遇了多小時的中斷,路由和DNS問題迫使數百萬用戶面臨連接質量下降。不到十天後,Microsoft的Azure Front Door也經歷了自己的全球故障,一個部署在共享前門層的錯誤配置規則錯誤路由/阻止了大量託管應用程式的流量,持續約八小時。
經濟分析估計,該事件造成了介於48億美元至160億美元之間的直接和間接損失,這還不包括各種銀行、物流網絡、公共部門門戶和企業SaaS工具遭受的生產力延遲和交易失敗。事實上,AWS和Azure的停機似乎為Cloudflare的崩潰鋪平了道路,長期以來被視為孤立事件的情況很快開始呈現出一種模式。
甚至Tesla和X的擁有者Elon Musk,他曾公開嘲笑AWS在其停機期間,吹噓他的社交平台在沒有Amazon雲端基礎設施的情況下運作良好,本週當X本身被擊倒離線時不得不咬緊舌頭,證明繞過一個巨頭並不能使平台免於其他地方的停機。
無論如何,這些接連發生的事件表明,傳統的中心化雲服務模式,儘管有其便利性,卻帶有固有風險,因為當如此多的線上活動依賴於少數公司的基礎設施時,即使是潛在的錯誤或錯誤配置也可能觸發大規模中斷。
面對這些停機暴露出的裂縫,科技社區越來越多地尋找消除此類單點故障的方法。一個新興的答案是去中心化雲計算的概念,使得世界各地的網站和應用程式不再通過少數超級樞紐提供商傳輸,而是將負載分散到許多獨立節點上。
這正是Argentum AI帶來的願景。作為一個開放、以人為本的計算能力市場,它將計算能力轉變為全球共享資源,連接需要處理能力的人和組織與那些有多餘能力提供的人(類似於閒置GPU和伺服器的Airbnb)。
詳細來說,Argentum提供了一個去中心化的實時競價網絡,計算任務公開發布,多個提供商競爭執行它們。這種方法取代了對任何單一雲供應商的依賴,形成了一個透明的多提供商市場,所有提供商都在競相以具競爭力的價格提供能力。
這也意味著,如果一個數據中心或節點離線,其他節點已準備好接手,因為工作負載會動態路由到網絡中有足夠容量的任何地方。因此,單點故障的概念被從系統中設計出去,因為任何故障都意味著任務可以在聯合雲提供商網絡中的其他地方運行。
除了彈性外,Argentum AI的市場還帶來其他好處,成本效益就是一個主要例子。這是因為傳統的超大規模服務商要求客戶預留大量伺服器或GPU時間(通常為閒置容量付費),而Argentum的網絡則利用全球分佈的已閒置硬體。
通過解鎖這種潛在的計算能力,該平台相比傳統雲降低了計算任務的價格。每個任務、出價和結果都記錄在開放的區塊鏈分類帳上,確保價格和性能的完全透明。
總之,該模型將計算能力視為流動商品,如果一個地區的資源耗盡,市場會在其他地方尋找資源。這種靈活性不僅加速了項目開發,還民主化了對高端處理的訪問,防止小型公司和組織被主要雲提供商定價過高或優先級降低。
隨著雲計算時代進入新階段,問題是基礎設施的未來是否會繼續集中在少數巨大的孤島中,還是分散在許多手中。如果說2025年的停機有什麼啟示,那就是即使是最強大的科技巨頭也並非萬無一失。
作為回應,像Argentum AI這樣的平台開創了一種不同的願景,重新構想我們如何分配和訪問計算能力。隨著這一願景獲得牽引力,明日的網際網路將變得更具彈性和公平。事實上,下一次Cloudflare或AWS絆倒時,用戶可能甚至不會感覺到,因為工作負載已經轉移到其他地方。


