NVIDIA Blackwell ने 3.2x गति लाभ के साथ वित्त AI बेंचमार्क को तोड़ा

Iris Coleman 05 मार्च, 2026 18:17

NVIDIA का GB200 NVL72 वित्तीय ट्रेडिंग में LLM इंफरेंस के लिए नया STAC-AI रिकॉर्ड स्थापित करता है, Hopper आर्किटेक्चर की तुलना में 3.2x तक प्रदर्शन प्रदान करता है।

NVIDIA Blackwell ने 3.2x गति लाभ के साथ वित्त AI बेंचमार्क को तोड़ा

NVIDIA की Blackwell आर्किटेक्चर ने वित्तीय LLM इंफरेंस के लिए STAC-AI बेंचमार्क पर अब तक के सबसे तेज़ परिणाम पोस्ट किए हैं, GB200 NVL72 पिछली पीढ़ी के Hopper की तुलना में 3.2x तक सिंगल-GPU प्रदर्शन सुधार प्रदान करता है। 5 मार्च, 2026 के परिणाम उन ट्रेडिंग फर्मों के लिए महत्वपूर्ण हैं जो असंरचित डेटा विश्लेषण से अल्फा निकालने की दौड़ में हैं।

स्ट्रैटेजिक टेक्नोलॉजी एनालिसिस सेंटर, जो 15 वर्षों से अधिक समय से वित्तीय प्रौद्योगिकी वर्कलोड को बेंचमार्क कर रहा है, ने EDGAR 10-K फाइलिंग का उपयोग करके वास्तविक दुनिया के परिदृश्यों के खिलाफ Blackwell का परीक्षण किया—वे घने वार्षिक रिपोर्ट जिन्हें क्वांट फंड निवेश संकेतों के लिए पार्स करते हैं। Meta के Llama 3.1 मॉडल चलाते हुए, GB200 NVL72 ने मध्यम-लंबाई के वित्तीय प्रॉम्प्ट पर 37,480 शब्द प्रति सेकंड हासिल किए, जबकि दोहरी GH200 सिस्टम के लिए 8,237 WPS की तुलना में।

कच्चे आंकड़े कहानी बताते हैं

EDGAR4 डेटा के साथ Llama 3.1 8B मॉडल पर, Blackwell ने Hopper के 51.5 RPS की तुलना में 224 अनुरोध प्रति सेकंड संसाधित किए—सिस्टम स्तर पर 4.3x सुधार। कम्प्यूटेशनल रूप से भारी कार्यों पर अंतर बढ़ गया: लंबे-संदर्भ EDGAR5 फाइलिंग पर 70B पैरामीटर मॉडल ने थ्रूपुट को 41.4 WPS से 150 WPS तक बढ़ते देखा।

इन लाभों को क्या संभव बनाता है? NVIDIA का नया NVFP4 क्वांटाइजेशन फॉर्मेट, जो Blackwell के लिए विशेष है, सटीकता का त्याग किए बिना मॉडल को छोटे मेमोरी फुटप्रिंट में संपीड़ित करता है। Hopper ने FP8 क्वांटाइजेशन चलाया; Blackwell पर चार-बिट सटीकता की आर्किटेक्चरल छलांग थ्रूपुट डेल्टा को अनलॉक करती है।

इंटरैक्टिव प्रदर्शन ट्रेडिंग के लिए महत्वपूर्ण है

बैच प्रोसेसिंग एक बात है। रियल-टाइम ट्रेडिंग निर्णयों के लिए तेज़ प्रतिक्रियाओं की आवश्यकता होती है। यहां, Blackwell ने अधिकतम थ्रूपुट की ओर धकेले जाने पर भी कम प्रतिक्रिया समय (time-to-first-token के समान) और बेहतर इंटरवर्ड लेटेंसी बनाए रखी। मिलान उपयोग स्तरों पर, GB200 NVL72 ने अधिकांश परीक्षण परिदृश्यों में प्रतिक्रियाशीलता मेट्रिक्स पर GH200 को लगातार हराया।

आय कॉल पर भावना विश्लेषण चलाने या ताज़ा समाचार पार्स करने वाले ट्रेडिंग डेस्क के लिए, वह लेटेंसी लाभ सीधे तेज़ निर्णय लेने में अनुवाद करता है। बेंचमार्क ने स्पष्ट रूप से टोकनाइजेशन सहित पूर्ण इंफरेंस पाइपलाइन का परीक्षण किया—वह काम जिसे वास्तविक तैनाती छोड़ नहीं सकती।

बाजार संदर्भ

NVIDIA के शेयर 5 मार्च को $181.41 पर कारोबार कर रहे थे, दिन में 1.1% ऊपर, कंपनी का बाजार पूंजीकरण $4.42 ट्रिलियन पर बैठा था। Blackwell आर्किटेक्चर, जिसे GTC 2024 में घोषित किया गया था, विशेष रूप से जेनरेटिव AI वर्कलोड के लिए डिज़ाइन किया गया था। CEO Jensen Huang ने इसे "एक नई औद्योगिक क्रांति" को शक्ति प्रदान करने के रूप में स्थापित किया, और ये बेंचमार्क परिणाम वित्तीय क्षेत्र में उस दावे के लिए ठोस सबूत प्रदान करते हैं।

GB200 Grace Blackwell सुपरचिप दो B200 GPU को एक Grace CPU के साथ जोड़ती है, जिसमें पुनर्डिज़ाइन किए गए AI Tensor Cores और पांचवीं पीढ़ी का NVLink 576 GPU तक स्केलिंग के लिए शामिल है। पिछले MLPerf परिणामों ने Llama 3.1 405B पर 2.2x प्रशिक्षण लाभ दिखाया; ये STAC-AI आंकड़े पुष्टि करते हैं कि समान लाभ इंफरेंस तक विस्तारित होते हैं।

Hopper अभी भी प्रासंगिक है

ध्यान देने योग्य: तीन साल पुरानी Hopper आर्किटेक्चर ने सम्मानजनक आंकड़े पोस्ट किए। मौजूदा GH200 तैनाती वाली ट्रेडिंग फर्में रातोंरात अप्रचलित नहीं हैं। लेकिन नए निर्माण या फर्मों के लिए जहां इंफरेंस गति सीधे रिटर्न को प्रभावित करती है, Blackwell का अर्थशास्त्र आकर्षक दिखता है—NVIDIA पिछली पीढ़ियों की तुलना में LLM इंफरेंस संचालन लागत में 25x तक की कमी का दावा करता है।

पूर्ण STAC रिपोर्ट, विभिन्न आगमन दरों में विस्तृत इंटरैक्टिव मोड मेट्रिक्स सहित, STAC के आधिकारिक चैनलों के माध्यम से उपलब्ध हैं। AI इंफ्रास्ट्रक्चर अपग्रेड का मूल्यांकन करने वाली वित्तीय संस्थाओं के पास अब खरीद निर्णयों को सूचित करने के लिए ऑडिट किया गया तृतीय-पक्ष डेटा है।

छवि स्रोत: Shutterstock