隨著AI產業從模型訓練轉向大規模推論,Nvidia長年建立的CUDA與GPU霸權正遭遇前所未有的挑戰… The post AI晶片戰全面升溫 Nvidia的技術優勢能否持續? appeared first on 電子工程專輯.隨著AI產業從模型訓練轉向大規模推論,Nvidia長年建立的CUDA與GPU霸權正遭遇前所未有的挑戰… The post AI晶片戰全面升溫 Nvidia的技術優勢能否持續? appeared first on 電子工程專輯.

AI晶片戰全面升溫 Nvidia的技術優勢能否持續?

2026/02/06 12:00
閱讀時長 15 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

過去十年來,Nvidia長期主導用於機器學習(ML)與人工智慧(AI)的先進運算晶片市場。在其專屬的CUDA軟體生態系與高速產品演進的雙重推動下,Nvidia逐步成為AI處理器的代名詞,並於2025年一度攀升至5兆美元的市值高峰。

根據Nvidia公佈的財報資料,2025年2~10月期間,該公司來自AI相關晶片、網路連接裝置與支援AI成長之硬體產品的總銷售額高達1,478億美元,顯示其於AI基礎設施市場的關鍵地位。

然而,即使Nvidia最高效能的最新Grace Blackwell系列處理器持續供不應求,其長期建立的市場主導地位正開始出現鬆動。相較於以往僅需面對單一主要競爭對手,如今隨著產業結構逐步轉向高度專用化與分工明確的硬體架構,Nvidia正同時承受來自多方競爭壓力。

Nvidia強勁的營收成長與高毛利率,在相當程度上來看並非單純源於需求暴增,而是建立在供給稀缺的結構性條件之上。這種稀缺性主要來自先進製程與封裝產能的限制,其中最關鍵的瓶頸,正是台積電(TSMC)先進的CoWoS產能不足。

目前,Nvidia幾乎吸納了大部份可用的CoWoS產能,但圍繞先進晶片供應的競爭正迅速升溫。作為全球唯一具備大規模量產能力的代工廠,台積電已規劃在2026年前將CoWoS產能擴充至每月10萬片晶圓。隨著供應限制逐步緩解,Google、AMD等非Nvidia陣營的業界大廠,預期將成為最直接的受益者。

隨著整個AI產業逐步從探索與訓練大型基礎模型,轉向強調大規模、低成本且高效率的AI推論部署,Nvidia正面臨結構性的風險轉移。

業界主要的雲端服務供應商開始有系統地降低對Nvidia CUDA生態系的依賴,並加速投資自家設計的專用晶片,以支撐高吞吐量的推論工作負載。對於這些企業而言,推論階段的長期營運成本已超越模型訓練成本,這項轉變不僅改變了資本配置邏輯,也正重塑整個AI硬體市場的競爭基礎。

最大客戶逐漸變成競爭對手?

北美四大超大規模雲端服務商——Amazon Web Services (AWS)、Google、Meta與微軟(Microsoft)掌握了這一產業最大規模的資本支出。這些企業同步推進自研晶片策略,並非著眼於短期成本,而是為了在AI算力競賽中建立長期、可控且具差異化的競爭優勢。

1.Google率先押注自研AI晶片:Google (隸屬於Alphabet)是最早啟動自研AI晶片計畫的雲端業者,其TPU已成為產業中最具代表性的替代方案之一。最新一代TPU v7「Ironwood」明確針對AI推論場景進行最佳化設計。Ironwood具備大容量共享記憶體架構,最多可在單一「superpod」中連接9,216顆晶片,有效緩解大型專家混合模型(MoE)在推論階段面臨的記憶體瓶頸。

Meta Platforms預計自2027年起,可能租用甚至直接採購Google TPU晶片,用於其自有資料中心。此舉將標誌著Google角色的重大轉變,使其從單純的內部使用,進一步成為商用AI晶片供應商。部份市場報告估算指出,Google未來有機會攫取高達Nvidia年度營收約10%的市場份額,金額規模可達數十億美元。

Google各代TPU比較。

(來源:Google)

2.Amazon主打訓練效率與成本優化:AWS正以更具競爭力的價格效能比,積極吸引尋求替代Nvidia高價GPU方案的企業客戶。相較於傳統GPU,AWS宣稱其自研Trainium晶片可將AI訓練成本降低高達50%,主要鎖定中階AI模型與商業化應用。

除了AI加速器,AWS亦持續擴展其自研CPU產品線Graviton5。該晶片採用3nm製程,在一般運算工作負載中,效能較前一代提升最高可達25%。包括Anthropic在內的合作夥伴,已採用Trainium2進行模型訓練,進一步驗證AWS在Trainium軟體堆疊與Neuron SDK上的整體整合能力。

Amazon Trainium3自研晶片。

(來源:Amazon)

3.Meta以專用晶片釋放H100算力:Meta選擇高度專業化的發展路徑,其首款AI 推論加速器名為「訓練和推論加速器」(MTIA)專為高吞吐量應用設計,例如支援Facebook與Instagram的推薦系統。透過將這類穩定且可預測的工作負載轉移至客製化晶片,Meta得以保留珍貴的Nvidia H100算力,用於更前瞻與實驗性的AI研究。

4.微軟自研晶片進程受挫:相較之下,微軟的自研晶片計畫時程則明顯延誤。其下一代Maia晶片(代號Braga)已確定延後至2026年,使微軟在短期內陷入被動局面。由於自研晶片未能如期交付,微軟仍須持續以高價採購Nvidia Blackwell GPU,以滿足OpenAI日益龐大的算力需求。為分散成本與供應風險,微軟同時導入AMD的MI300X GPU,並迅速成為AMD在資料中心市場中最重要的客戶之一。

新興競爭者與Triton效應

在主要雲端服務供應商陸續建構自有AI系統的同時,AMD依然是整體市場中對抗Nvidia最具規模的替代選擇。AMD的MI300X晶片搭載192GB HBM3高頻寬記憶體,容量顯著高於Nvidia H100,使其在大型模型推論與記憶體密集型應用中具備成本優勢。AMD預期,其資料中心GPU年銷售額將達數十億美元規模,正式與Nvidia展開正面競爭。

AMD過往在軟體生態系上的弱勢,正透過OpenAI推出的Triton編譯器逐步改善。Triton使開發者能以高階抽象方式撰寫高效能程式碼,同時相容於Nvidia與AMD硬體,無須深度依賴CUDA或AMD ROCm。透過提升硬體的可互換性,Triton有效降低了從CUDA生態系轉移的技術門檻,進而壓低整體導入成本,也使企業在供應商選擇上擁有更大的彈性。

中國縮小技術落差

為了因應美國的出口管制,中國加速發展一套平行且相對獨立的自有AI運算生態系,更進一步放大了Nvidia所面臨的壓力。華為成為中國國內AI基礎設施的核心推動者,透過替代性架構設計,彌補無法取得EUV微影技術的先天限制。

華為主力晶片Ascend 910C由中芯國際(SMIC)以7nm DUV微影製程生產,並已展現可接受的穩定性。相關報告指出,其訓練效能可達Nvidia H100的60~80%,且在部份推論任務中已能與H100匹敵。

華為Ascend晶片。

(來源:華為)

上述效能表現,來自以「scale-out」為核心的系統設計。華為透過名為UnifiedBus的新型光學連結,將成千上萬顆Ascend NPU整合至如Atlas 950 SuperPoD等大型系統中。這種高速互連架構,彌補了製程成熟度不足的問題,使其仍具備執行先進模型訓練的能力。

然而,建立這套獨立算力體系的成本極為高昂。Ascend 910C在SMIC的製造良率僅約30~40%,明顯低於全球產業水準,但中國政府似乎願意為長期戰略目標承擔這些損失。華為旗下半導體子公司海思(HiSilicon)已規劃於2026年推出新一代Ascend晶片,包括2026年第一季上市的Ascend 950PR,以及於第四季推出、具備更高記憶體配置的950DT。

近期局勢更顯複雜。儘管美國總統川普(Trump)批准Nvidia先進的H200晶片出口,釋出限制可能鬆動的政策訊號,北京方面卻同步表態,將強化本土對先進AI晶片的管控。負責推動中國半導體自主化的監管機構,正評估僅允許有限度取得H200——亦即Nvidia次世代最具代表性的AI晶片之一。

同時,中國亦加速推進記憶體晶片的國產化進程。長鑫存儲(CXMT)計畫於2026年開始量產HBM3,有望在未來緩解潛在的記憶體相關制裁風險。

投資高度碎片化的市場

Nvidia已清楚意識到,在台積電先進產能持續受限的情況下,長期維持超高毛利將日益困難。為了分散風險並拓展新成長動能,Nvidia正積極投資其他市場領域,包括與諾基亞(Nokia)等電信基礎設施供應商合作。

儘管面臨多重挑戰,市場普遍預期Nvidia仍可在2026年前持續主導高毛利的先進模型訓練市場。然而,在高吞吐量、低成本為核心訴求的推論領域,主導權更可能逐步轉移至各大雲端服務供應商的客製化晶片方案。

下一階段的關鍵競爭,將聚焦於晶片互連技術本身。隨著傳統電連接逐漸逼近物理極限,光學連接正快速進入商用化階段。Marvell收購Celestial AI,以及Lightmatter推出用於高速晶片互連的3D光子晶圓,皆顯示至2026年,光學連結將成為頂級AI晶片的標準配置。此一趨勢亦將使Broadcom與Marvell等具備高速互連與光通訊技術的廠商,躍升為AI產業鏈中的關鍵供應者。

對Nvidia而言,當前的核心課題在於,如何在硬體高度專業化、競爭快速分化的產業環境中,同時維持獲利能力與市佔率優勢。未來的AI運算版圖,將不再由單一壟斷者主導,而是由多種專用系統,透過先進互連技術所構成的複合型生態系。

(參考原文:The Trillion-Dollar Race to Fragment the Nvidia Monopoly,by Pablo Valerio,Susan Hong編譯)

本文同步刊登於《電子工程專輯》雜誌20261-2月號

The post AI晶片戰全面升溫 Nvidia的技術優勢能否持續? appeared first on 電子工程專輯.

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT$30,000 等值 PRL + 15,000 USDT

充值並交易 PRL,即可提升您的獎勵!