兩位消息人士說,OpenAI 曾洽談與 Cerebras 和 Groq 等新創公司合作,想取得速度更快的推論晶片。但 NVIDIA 以 200 億美元取得 Groq 技術授權,讓 OpenAI 的談判告吹;Sam Altman 則在 1 月 30 日記者會上證實,會透過與 Cerebras 的合作來滿足 coding 兩位消息人士說,OpenAI 曾洽談與 Cerebras 和 Groq 等新創公司合作,想取得速度更快的推論晶片。但 NVIDIA 以 200 億美元取得 Groq 技術授權,讓 OpenAI 的談判告吹;Sam Altman 則在 1 月 30 日記者會上證實,會透過與 Cerebras 的合作來滿足 coding

OpenAI 尋替代晶片!NVIDIA GPU 為何被嫌推論不夠力?

2026/02/03 12:09
閱讀時長 6 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

八位知情人士向《路透社》透露,OpenAI 從去年起就對 NVIDIA 部分最新 AI 晶片的表現感到不滿,開始尋找其他選擇。這個策略轉向可能讓 AI 產業兩大巨頭的關係出現變數,也為雙方進行中的千億美元投資協商增添變數。

問題核心在於 AI「推論」環節,也就是 ChatGPT 回應使用者提問時的運算過程。七位消息人士指出,OpenAI 認為 NVIDIA 硬體在軟體開發、AI 系統互動等特定場景的反應速度「還不夠快」。一位消息人士說,OpenAI 需要新硬體來滿足未來約一成的推論運算需求。

去年 9 月,NVIDIA 宣布打算投資 OpenAI 最高 1000 億美元,換取股份並讓 OpenAI 有資金採購先進晶片。原本預計數週內敲定的交易,如今已拖延數月。期間 OpenAI 轉向與 AMD 等廠商簽約,購買足以抗衡 NVIDIA 的 GPU。知情人士透露,OpenAI 不斷調整的產品規劃改變了其所需的運算資源類型,讓與 NVIDIA 之間的協商陷入膠著。

然而近日雙方都試圖淡化緊張關係。OpenAI 執行長 Sam Altman 在 X 平台發文稱,NVIDIA 製造「全球最頂尖的 AI 晶片」,OpenAI 希望長期都是「超級大客戶」。NVIDIA 執行長黃仁勳週六在台北的行程中,則駁斥關係緊張的說法是「胡說八道」,強調計劃大舉投資 OpenAI。

兩家公司的聲明也強調合作關係穩固。NVIDIA 表示客戶持續選擇其推論運算方案,因為能提供最佳效能和總持有成本。OpenAI 發言人則說,公司絕大多數推論運算仍仰賴 NVIDIA,其每美元推論效能最優異。

不過檯面下的動作透露不同訊息,兩位消息人士說,OpenAI 曾洽談與 Cerebras 和 Groq 等新創公司合作,想取得速度更快的推論晶片。但 NVIDIA 以 200 億美元取得 Groq 技術授權,讓 OpenAI 的談判告吹。Altman 則在 1 月 30 日記者會上證實,會透過與 Cerebras 的合作來滿足 coding 的速度需求。

OpenAI 尋找的替代方案,鎖定將大量記憶體(SRAM)直接整合在晶片上的技術。推論運算比訓練更吃記憶體,而 NVIDIA 和 AMD 的 GPU 仰賴外接記憶體,這會拖慢互動速度。消息人士說,OpenAI 內部在程式碼生成工具 Codex 上特別明顯感受到這個問題,員工把部分弱點歸咎於 NVIDIA 的 GPU 架構。

從商業競爭的角度來看,對手可能已經占得先機,Anthropic 的 Claude 和 Google 的 Gemini 更仰賴 Google 自製的張量處理單元(TPU),這些晶片本質上就是為推論運算量身打造,相較通用 GPU 能提供效能優勢。

Anthropic 早在 2023 年就開始了與 Google 的合作關係,後者在 2025 年 1 月又加碼投資了 Anthropic 10 億美元。

當 OpenAI 明確表達疑慮後,知情人士透露 NVIDIA 開始接觸 Cerebras 和 Groq 探詢收購。Cerebras 婉拒並轉與 OpenAI 合作,Groq 則在獲得投資人青睞、估值約 140 億美元後,於 12 月被 NVIDIA 以全現金取得技術授權。由於 NVIDIA 挖走 Groq 晶片設計師,Groq 目前專注雲端軟體銷售。

晶片業高層認為,NVIDIA 搶下 Groq 是要強化技術陣容,在快速演變的 AI 產業中保持競爭力。NVIDIA 雖在訓練大型 AI 模型的晶片領域仍獨霸一方,但推論已成新戰場。OpenAI 等業者另覓出路,正是對 NVIDIA AI 霸主地位的重大考驗。

核稿編輯:Mia

加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員

延伸閱讀:

  • Google 發表第七代 TPU「Ironwood」,劍指 AI 推論時代

  • 外媒曝:OpenAI 攜手台積電、博通,要打造自家首款 AI「推論」晶片

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT$30,000 等值 PRL + 15,000 USDT

充值並交易 PRL,即可提升您的獎勵!