Darius Baruo
2025年12月02日 19:09 (UTC +8)
NVIDIA 推出 Mistral 3,這是一系列新的 AI 模型,提供無與倫比的準確性和效率。針對 NVIDIA GPU 優化,這些模型增強了各行業的 AI 部署。
NVIDIA 已發布其最新的 AI 模型系列 Mistral 3,為開發者和企業承諾前所未有的準確性和效率。據 NVIDIA 開發者部落格報導,這些模型已針對 NVIDIA GPU 進行優化,從高端數據中心到邊緣平台都能部署。
Mistral 3 模型系列
Mistral 3 系列包含為各種應用量身打造的多樣化模型。它擁有一個具有 6750 億參數的大規模稀疏多模態和多語言模型,以及更小、更密集的模型,稱為 Ministral 3,提供 3B、8B 和 14B 參數大小。每種模型大小都有三種變體:Base、Instruct 和 Reasoning,總共提供九種模型。
這些模型在 NVIDIA Hopper GPU 上訓練,並可通過 Hugging Face 上的 Mistral AI 獲取。開發者可以使用不同的模型精度格式和開源框架部署這些模型,確保與各種 NVIDIA GPU 的兼容性。
性能和優化
NVIDIA 的 Mistral Large 3 模型在 GB200 NVL72 平台上實現了卓越的性能,利用了為大型專家混合(MoE)模型量身定制的一系列優化。性能提升比前幾代增加了 10 倍,Mistral Large 3 模型在用戶體驗、成本效率和能源使用方面展現出顯著的提升。
這種性能提升歸功於 NVIDIA 的 TensorRT-LLM Wide Expert Parallelism、使用 NVFP4 的低精度推理,以及 NVIDIA Dynamo 框架,它增強了長上下文工作負載的性能。
邊緣部署和多功能性
Ministral 3 模型專為邊緣部署設計,為各種應用提供靈活性和性能。這些模型針對 NVIDIA GeForce RTX AI PC、DGX Spark 和 Jetson 平台進行了優化。本地開發受益於 NVIDIA 加速,提供快速推理速度和改進的數據隱私。
特別是 Jetson 開發者可以利用 vLLM 容器實現高效的令牌處理,使這些模型成為邊緣計算環境的理想選擇。
未來發展和開源社區
展望未來,NVIDIA 計劃通過即將推出的性能優化(如推測性解碼)進一步增強 Mistral 3 模型。此外,NVIDIA 與 vLLM 和 SGLang 等開源社區的合作旨在擴展內核集成和並行支持。
通過這些發展,NVIDIA 繼續支持開源 AI 社區,為開發者提供一個強大的平台,以高效構建和部署 AI 解決方案。Mistral 3 模型可在 Hugging Face 上下載,或直接通過 NVIDIA 的構建平台進行測試。
圖片來源:Shutterstock
來源:https://blockchain.news/news/nvidia-mistral-3-models-boost-ai-efficiency








