買幣行情現貨交易合約GOLD 理財活動中心

更多

USD1 創世盛典

Anyscale 的 Ray Serve LLM 更新為 vLLM WideEP 部署啟用了 DP 群組容錯功能，降低了分散式 AI 推理系統的停機風險。（閱讀Anyscale 的 Ray Serve LLM 更新為 vLLM WideEP 部署啟用了 DP 群組容錯功能，降低了分散式 AI 推理系統的停機風險。（閱讀

Ray 2.55 為大規模 AI 模型部署新增容錯功能

來源：BlockChain News

2026/04/03 02:35

閱讀時長 5 分鐘

分享

Raydium

RAY$0.6045-3.51%

如需對本內容提供反饋或相關疑問，請通過郵箱 crypto.news@mexc.com 聯絡我們。

Ray 2.55 為大規模 AI 模型部署新增容錯功能

Joerg Hiller 2026年4月2日 18:35

Anyscale 的 Ray Serve LLM 更新為 vLLM WideEP 部署啟用了 DP 群組容錯功能,降低了分散式 AI 推理系統的停機風險。

Ray 2.55 為大規模 AI 模型部署新增容錯功能

Anyscale 發布了其 Ray Serve LLM 框架的重大更新,解決了執行大規模 AI 推理工作負載的組織所面臨的關鍵營運挑戰。Ray 2.55 為 vLLM Wide Expert Parallelism 部署引入了資料平行(DP)群組容錯功能——這項功能可防止單一 GPU 故障導致整個模型服務叢集停擺。

此更新針對專家混合(MoE)模型服務中的特定痛點。與每個副本獨立運作的傳統模型部署不同,像 DeepSeek-V3 這樣的 MoE 架構會將專家層分片到必須協同工作的 GPU 群組中。當這些配置中的一個 GPU 故障時,整個群組——可能跨越 16 到 128 個 GPU——就會無法運作。

技術問題

MoE 模型將專門的「專家」神經網路分散到多個 GPU 上。例如,DeepSeek-V3 每層包含 256 個專家,但每個標記只啟動 8 個。標記會透過調度和合併操作路由到持有所需專家的 GPU,這些操作需要所有參與的節點保持健康狀態。

以前,單一節點故障會破壞這些集體操作。查詢會繼續路由到受影響群組中倖存的副本,但每個請求都會失敗。恢復需要重啟整個系統。

Ray 如何解決問題

Ray Serve LLM 現在透過群組排程將每個 DP 群組視為原子單元。當一個節點故障時,系統會將整個群組標記為不健康,停止將流量路由到該群組,拆除故障群組,並將其作為一個單元重建。其他健康群組在整個過程中繼續處理請求。

此功能在 Ray 2.55 中預設啟用。現有的 DP 部署不需要更改程式碼——框架會自動處理群組級別的健康檢查、排程和恢復。

自動擴展也遵守這些界限。擴展和縮減操作以群組大小為增量進行,而不是以個別副本為單位,從而防止建立無法處理流量的部分群組。

營運影響

此更新帶來了一個重要的設計考量:群組寬度與群組數量的對比。根據 Anyscale 引用的 vLLM 基準測試,在專家平行大小為 32、72 和 96 時,每個 GPU 的吞吐量保持相對穩定。這意味著營運人員可以在不犧牲效率的情況下調整為更小的群組——而更小的群組意味著故障發生時影響範圍更小。

Anyscale 指出,這種編排層級的彈性補充了 vLLM 社群中正在進行的引擎層級彈性工作。vLLM Elastic Expert Parallelism RFC 解決了執行時如何動態調整群組內拓撲的問題,而 Ray Serve LLM 則管理哪些群組存在並接收流量。

對於大規模部署 DeepSeek 風格模型的組織來說,實際好處很明確:GPU 故障成為局部事件,而非全系統性的停機。程式碼範例和重現步驟可在 Anyscale 的 GitHub 儲存庫中取得。

圖片來源:Shutterstock

Ray
vLLM
AI 基礎設施
機器學習
分散式運算

市場機遇

Raydium 圖標

Raydium實時價格 (RAY)

$0.6045

$0.6045$0.6045

+0.01%

USD

Raydium (RAY) 實時價格圖表

只要一分鐘，20 USDT 免費拿！

只要一分鐘，20 USDT 免費拿！

只要一分鐘，20 USDT 免費拿！

充值 $100，多拿 $300 GOLD 倉位！

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

川普聲稱美國武裝伊朗抗議者，預測明天與伊朗達成協議

川普聲稱美國武裝伊朗抗議者，預測明天與伊朗達成協議

川普聲稱美國已武裝伊朗抗議者，預測明天與伊朗達成協議的貼文出現在 BitcoinEthereumNews.com 上。川普聲稱美國已武裝伊朗

BitcoinEthereumNews2026/04/05 21:50

ETH 接下來會突破還是暴跌至 $1.8K?

ETH 接下來會突破還是暴跌至 $1.8K?

該文章「ETH 接下來會突破還是暴跌至 $1.8K？」出現在 BitcoinEthereumNews.com。首頁 » ETH '; } function loadTrinityPlayer(targetWrapper, theme,extras

BitcoinEthereumNews2026/04/05 23:29

川普警告若伊朗協議週二前未達成將升級軍事行動

川普警告若伊朗協議週二前未達成將升級軍事行動

川普警告，若伊朗協議未能在週二前達成，將面臨軍事升級的貼文出現在 BitcoinEthereumNews.com 上。川普總統已警告將進行軍事升級

BitcoinEthereumNews2026/04/05 22:17

1,500,000 WLFI 靜待領取

1,500,000 WLFI 靜待領取

1,500,000 WLFI 靜待領取

越早投入收益越高，質押 USD1 賺 WLFI！

熱門新聞

Kiyosaki 呼籲持有 Bitcoin 和黃金，因 1974 年轉變已繞一整圈

奈及利亞投資900萬美元於研究以推動數位經濟目標

透過社交工程手法竊取 $280M

川普威脅奪取伊朗石油，談判面臨破局風險

XRP 於第二波回調展開時守住 1.30 美元

實時快訊

羅伯特·清崎預測全球市場將崩盤，並建議買入黃金、白銀、比特幣和以太幣。

作者：Crypto Profe00:41

與比特幣和以太坊不同，XRP 挑戰了銀行的商業模式，因而引發 SEC 對 Ripple 的針對性行動。

作者：Ripple Bull Winkle | Crypto Researcher 🚀🚨00:16

Brad 強調 XRP 具備與 SWIFT 14% 整合的潛力，估計將帶來 15.5 兆美元的市場影響。

作者：Ripple Bull Winkle | Crypto Researcher 🚀🚨00:01

在掃過外部區間高點後，BTC 週線收盤轉為偏空，隨後出現再平衡以及劇烈的看跌反轉。

作者：無名先生00:00

Sui 上的 Ferra 結合 AMM 機制與社交功能，強化流動性深度與資本效率。

作者：陈较瘦｜🐬TermMax2026/04/05 23:36

快速閱讀

Cardano (ADA) 最新價格：最新市場動態

Cardano (ADA) 看漲價格預測

XRP 2026年價格預測：能否重回歷史高點？機構、分析師全面解讀

BEEG是什麼意思？起源、用例和生態系統

BEEG是什麼？2026最新版完整指南

加密貨幣價格

比特幣圖標

比特幣

BTC

$67,281.89$67,281.89

-0.03%

以太幣圖標

以太幣

ETH

$2,054.49$2,054.49

+0.03%

Stakestone 圖標

Stakestone

STO

$0.17992$0.17992

-4.56%

Solana 圖標

Solana

SOL

-0.06%

瑞波幣圖標

瑞波幣

XRP

+0.11%

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT

充值並交易 PRL，即可提升您的獎勵！