阿里巴巴集團控股有限公司收盤價為 $167.05,在 AI 基礎設施重大突破後,股價上漲了 1.19%。
阿里巴巴集團控股有限公司,BABA
該公司推出了一種計算池化解決方案,在模型服務操作中將 Nvidia GPU 使用量降低了 82%。這一進步使阿里雲在優化大規模 AI 部署的競爭中處於領先地位。
總部位於杭州的公司旗下雲計算部門阿里雲實施了一個名為 Aegaeon 的新系統,以提升 AI 效率。該解決方案允許單個 Nvidia H20 GPU 同時服務多達七個大型語言模型。在內部測試中,這一變化將 GPU 使用量從 1,192 個降低到了僅 213 個。
Aegaeon 通過在並行 AI 工作負載的模型推理過程中執行 Token 級自動擴展來運作。這一策略實現了動態資源重新分配,使同一 GPU 能夠在處理過程中切換模型。它還將模型切換任務的延遲降低了 97%。
該解決方案在阿里雲的百煉市場進行了超過三個月的 Beta 測試。它處理了數十個參數高達 720 億的模型,且服務質量沒有下降。Aegaeon 現已正式部署在阿里巴巴的模型市場中,為其專有的通義千問模型提供服務。
阿里雲發現,在實際 AI 任務中,只有少數模型被頻繁使用。儘管如此,許多 GPU 被分配給很少被調用的模型,導致資源利用率低。數據顯示,17.7% 的 GPU 僅服務了總推理請求的 1.35%。
通過 Aegaeon,公司透過池化和智能擴展策略解決了這種不平衡。該系統確保了 GPU 使用的一致性,並防止了在很少使用的模型上的閒置處理。阿里巴巴實現了更高的吞吐量,並為企業部署提升了硬件效率。
北京大學和阿里雲研究人員共同撰寫了一篇詳述這一創新的技術論文,並在韓國的 SOSP 2025 上發表。該研究強調,使用傳統 GPU 方法處理並行工作負載會產生不必要的成本。這一突破直接支持了中國在資源限制下實現 AI 基礎設施現代化的目標。
Nvidia 專門為中國的 AI 推理開發了 H20 GPU,以符合美國出口限制。然而,中國監管機構最近對該晶片可能存在的後門安全漏洞展開了調查。這種審查已影響了該晶片在中國的市場地位和採用情況。
華為和寒武紀等中國企業正在加速開發國產 GPU,以減少對外國的依賴。Nvidia 的 CEO 表示,該公司在中國高級 AI 晶片的市場份額已降低到了零。這一趨勢推動本地企業創新並本地化 AI 硬件供應鏈。
阿里巴巴的新方法強化了其市場地位,同時與國家技術自給自足的戰略保持一致。通過減少對美國晶片的依賴,阿里巴巴在中國不斷發展的 AI 生態系統中獲得了更強的立足點。股價上漲反映了市場對其技術主導的成本節約和可擴展性的信心。
文章「阿里巴巴集團控股有限公司 (BABA) 股價飆升,新 AI 池化技術將 Nvidia GPU 使用量降低了 82%」首次發表於 CoinCentral。


