NVIDIA在GTC 2026除了正式公布可預期的Vera Rubin世代產品陣容,也高調的宣布甫於2025年10月策略合作的Groq LPU產品納入NVIDIA產品陣容,不過與此同時,NVIDIA執行長黃仁勳展示眺望下一代產品Feynman的藍圖時,除了納入Groq LPU以及添加與下一代處理器Rosa外,對比2025年10月GTC華盛頓DC的藍圖,赫然發現2025年9月於AI Infra Summit公布的推論伺服產品Rubin CPX已悄悄從新版藍圖消失。
▲2025年底的GTC華盛頓DC曾在藍圖列出Rubin CPX
雖然不確定NVIDIA是否已經將Rubin CPX從產品規劃完全消滅,然而從Rubin CPX出現的脈絡與產品定位,Rubin CPX確實高機率已經被Groq 3 LPX取代;Rubin CPX定位於針對大規模情境推論應用所規劃的產品,鎖定處理百萬個詞元參數的AI模型與影片生成應用,且採用結合Vera CPU與Rubin GPU的單晶片設計,同時搭配高達128GB的GDDR 7記憶體,其產品策略即是以單位成本較低的處理器設計與記憶體降低成本,但專注於推論應用。
Rubin CPX的出現,是反映NVIDIA的加速系統雖在整體AI領域所向披靡,然而隨著AI技術由於DeepSeek出現的推波助瀾,整體需求由研究及探索轉向商用,使推論需求大幅提升;雖然NVIDIA的Blackwell架構仍在推論具有出色的表現,但從經濟效益卻不那麼理想,也因此引發一波由雲端服務商、大型服務業者發起的AI推論加速ASIC之亂,例如Google的TPU就是一個很好的例子,而Rubin CPX是NVIDIA在當時的時空情境提出的防堵手段。
▲當AI邁入商用化,低成本、高效率的AI推論ASIC就更為吃香
當原本NVIDIA的主要客戶為了降低成本、不想受限等因素紛紛另起爐灶,NVIDIA的Rubin CPX雖然具有與NVIDIA生態系無縫接軌的優勢,然而從務實面由於仍是基於GPU加速架構的基礎,雖然相對Vera Rubin DGX系統便宜,但恐怕整體成本效益仍不及專為特定功能而生的ASIC加速產品,為了對付ASIC,最根本的方式還是用你的魔法對付你
於是NVIDIA具體的手段就是找上由前Google TPU開發核心人員Jonathan Ross創辦的Groq,然而雙方的合作模式卻非由NVDIA直接收購Groq,而是簽署獨特的「推論技術非獨占授權協議」,具體而言就是直接把Jonathan Ross與Groq核心人員挖角進NVDIA,但Groq仍將持續營運,這也是GTC 2026年直接將Groq冠上NVIDIA旗下產品的原因;如果以比喻來說,可能類似當初Google自HTC收編部分手機開發團隊核心人員,但HTC仍保有原本的手機業務。
▲Groq是NVIDIA制衡原本客戶另起爐灶的重要策略
NVIDIA找上Groq的原因就是其產品是專為大型語言模型推論環節最佳化的LPU產品,因為Groq LPU不同於透過編程定義功能的GPU,是針對推論流程的最佳化架構,加上直接透過晶片上高速的SRAM設計具有極低的記憶體延遲,也註定Groq LPU理應能夠提供比Rubin CPX更佳的推論性能與經濟效益。
▲2026年GTC的藍圖已經確立Groq將在短時間迭代
在NVIDIA的藍圖可看到NVIDIA將積極的為Groq進行迭代更新,畢竟Groq才剛納入NVIDIA生態系,當前的設計架構仍是延續自Groq既有的計畫;從NVIDIA的藍圖可看到NVIDIA將在2027年與Rubin Ultra同步更新Groq,代號LP35的新晶片重點是添加對NVIDIA力拱的NVFP4精度的支援,這也是原本NVIDIA Rubin CPX主打的賣點之一,不過以現實層面,雖然Blackwell架構已經開始支援NVFP4,但從模型訓練、驗證到落實確實需要一段時間,目前業界主要的模型多仍停留在FP8精度或以上的精度。
而在Feynman世代,代號LP40的Groq晶片重點則是添加對NVLink的支援,也就是進一步獲得更高互聯頻寬與更低的多晶片延遲,也許也是進一步邁入NVIDIA的「Superchip」超級晶片陣容中,透過NVLink-C2C連貫多個Groq晶片,或是在既有的CPU+GPU的超級晶片設計進一步加入LPU,亦可能出現Rosa CPU+Groq LPU的超級晶片,也可以說到屆時的LP40才真正邁入為NVIDIA生態系原生設計的特色。
▲今日風光的NVIDIA也在創立的30年來多次遭遇危機
NVIDIA創立至今超過30年,雖然歷史不及AMD、蘋果、Intel及高通,也一度因為僅有GPU產品曾兩度陷入瀕臨倒閉的危機,但如今卻搖身一變成為運算領域呼風喚雨的霸主,以事後諸葛的觀察,關鍵除了將不被看好的CUDA加速運算堅持發展至今,另一點則在於快速而靈活的前瞻策略。
回顧NVIDIA的產品規劃,看到雲端虛擬化趨勢為GPU加入虛擬化功能,或在嘗試後退出手機及平板領域但把技術延伸至自駕車與自主AI機器人,或因為原本規劃的架構過時斷然中止原本嵌入式晶片計劃但旋即以採用新產品替補,或是將Tensor Core與光追加速器整合到消費級GPU開創當今新一代遊戲的電影級效果,乃自這次快速的透過吸收Groq技術補足業界對低成本、高效益的大規模AI推論需求。
對於看好大規模推論提前布局的業者而言,NVIDIA以Groq 3 LPX取代原本的Rubin CPX肯定是個噩夢,因為NVIDIA的加速運算平台仍是當前業界頂尖AI訓練不可或缺的平台,雖然目前的Groq 3 LPX還未與NVIDIA生態系磨合,然而隨著後續陸續加入對NVFP4、NVLink等NVDIA特色技術與功能,恐怕會與其它ASIC進一步拉開距離。
▲從Rubin CPX描述搭載具有Rubin架構GPU的SoC產品,筆者推測很可能是GB10的下一代晶片
筆者在撰寫這篇文章時也詢問參與GTC 2026會後黃仁勳聯訪的國外記者是否有問到Rubin CPX的進展,不過似乎並未有相關提問,故筆者先假設原本Rubin CPX的計畫可能已經終止的前提進行推測,雖然Rubin CPX產品可能因為Groq 3 LPX的出現被終止,但原本為了Rubin CPX投入的開發資源也許不會打水漂,有可能會以穢土轉生的方式出現、或者說不定原本Rubin CPX就是源自那樣的應用。
筆者個人的推測是Rubin CPX採用的SoC晶片極有可能就是做為NVIDIA與聯發科合作的GB10的後繼產品,因為在NVIDIA官方介紹,Rubin CPX採用的並非Vera Rubin DGX的超級晶片或加速GPU晶片,而是一顆結合Rubin GPU的SoC,倘若考慮到能源效率,確實使用GB10等級晶片搭配GDDR7記憶體會是相當具有經濟效益的AI加速運算產品,而在Rubin CPX計畫消失後,這顆新SoC則預期回歸原本用於DGX Spark或是下一代NVIDIA筆記型電腦使用。


