NVIDIA ने अपने नवीनतम GB300 NVL72 सिस्टम जारी किए हैं। ये पुराने Hopper प्लेटफॉर्म की तुलना में प्रति मेगावाट बिजली में 50 गुना अधिक काम संभाल सकते हैं। इसका मतलब है कि प्रोसेस की गई जानकारी के प्रत्येक भाग के लिए लागत 35 गुना कम हो जाती है।
Signal65 ने GB200 NVL72 पर अलग से परीक्षण किया और पाया कि यह प्रति वाट 10 गुना से अधिक जानकारी प्रोसेस करता है, लागत को पहले की तुलना में दसवें हिस्से तक घटा देता है।
सुधार लगातार जारी हैं। NVIDIA की TensorRT-LLM लाइब्रेरी अपग्रेड ने अकेले GB200 को तत्काल प्रतिक्रिया की आवश्यकता वाले कार्यों के लिए केवल चार महीनों में पांच गुना प्रदर्शन बढ़ावा दिया। Dynamo, Mooncake और SGLang टूल्स पर काम करने वाली टीमें दक्षता को और भी अधिक बढ़ा रही हैं।
ये AI टूल्स विफल हो जाते हैं यदि लैग टाइम हो या वे पर्याप्त संदर्भ याद नहीं रख सकें। कंपनियों को इन्हें वास्तविक व्यावसायिक स्थितियों में काम करने की आवश्यकता है, न कि केवल डेमो में।
कोड लिखने और डिजिटल सहायकों के रूप में काम करने वाले आर्टिफिशियल इंटेलिजेंस टूल्स अब सभी AI-संबंधित खोजों का लगभग आधा हिस्सा हैं, जो एक साल पहले केवल 11% था।
ये संख्याएं OpenRouter की State of Inference रिपोर्ट से आती हैं और दिखाती हैं कि इस क्षेत्र में चीजें कितनी तेजी से बदल रही हैं।
इस अचानक उछाल ने कंपनियों को ऐसा हार्डवेयर बनाने के लिए तेजी से काम करने पर मजबूर कर दिया है जो इसके साथ तालमेल बिठा सके। इन AI सहायकों को तुरंत प्रतिक्रिया देने और संपूर्ण सॉफ्टवेयर प्रोजेक्ट्स से संदर्भ याद रखने की आवश्यकता होती है, जो कंप्यूटिंग पावर पर गंभीर मांग डालता है।
बाजार विस्फोट ने तकनीकी दिग्गजों की प्रभुत्व की लड़ाई को बढ़ावा दिया
इसमें शामिल धन बहुत बड़ा है। AI एजेंट बाजार 2024 में 4.92 बिलियन डॉलर का था। अनुमान इसे 2025 के लिए 6.016 बिलियन डॉलर बताते हैं, फिर 2035 तक 44.97 बिलियन डॉलर तक बढ़ने का अनुमान है। यह अगले दशक के लिए हर साल 22.28% की वृद्धि है। बैंक, अस्पताल, स्टोर और फैक्ट्रियां शुरुआती अपनाने वाले हैं।
व्यवसाय इन एजेंटों को ग्राहक प्रबंधन प्रणालियों, योजना टूल्स और सुरक्षा सेटअप में डाल रहे हैं ताकि पैसे बचाए जा सकें और अधिक काम किया जा सके। जो वैकल्पिक तकनीक के रूप में शुरू हुआ वह बुनियादी ढांचा बन रहा है।
Cryptopolitan द्वारा रिपोर्ट किए गए अनुसार, Alibaba ने अभी-अभी चीन के बाजार को लक्षित करते हुए Qwen3.5 लॉन्च किया है, जो पहले की तुलना में 60% कम प्रोसेसिंग लागत का दावा करता है। मॉडल स्क्रीन देख सकता है और फोन और कंप्यूटर में कार्य कर सकता है। यह ByteDance के Doubao ऐप के साथ सीधी टक्कर में है, और एक DeepSeek अपडेट भी आ रहा है।
OpenAI ने 15 तारीख को Peter Steinberger को नियुक्त किया। उन्होंने OpenClaw बनाया, एक ओपन-सोर्स AI एजेंट। CEO Sam Altman ने कहा कि Steinberger अगली पीढ़ी के व्यक्तिगत एजेंटों पर काम का नेतृत्व करेंगे और उन्हें स्मार्ट सहायकों के बारे में महान विचारों वाला एक प्रतिभाशाली व्यक्ति बताया जो उपयोगी काम कर सकते हैं।
प्रतिभा संकट जिसे कोई हल नहीं कर सकता
94% व्यावसायिक नेताओं का कहना है कि उनके पास AI कौशल की कमी है। 2028 तक, 44% को अभी भी 20 से 40% की कमी होने की उम्मीद है। Workera का कहना है कि ये अंतराल विलंबित उत्पादों, गुणवत्ता के मुद्दों और खोई हुई बिक्री से 2026 में वैश्विक अर्थव्यवस्था को 5.5 ट्रिलियन डॉलर का नुकसान पहुंचा सकते हैं।
अभी AI प्रतिभा की मांग दुनिया भर में आपूर्ति से 3.2 से एक है। AI नौकरियां नियमित सॉफ्टवेयर पदों की तुलना में 67% अधिक भुगतान करती हैं। फिर भी 85% कार्यालय कर्मचारी अपने समय पर इस चीज़ के बारे में सीख रहे हैं, और 83% का कहना है कि वे औपचारिक प्रशिक्षण प्राप्त करने के बजाय ज्यादातर खुद को सिखा रहे हैं।
जब कंपनियां विशेष विक्रेताओं से AI टूल्स खरीदती हैं, तो वे 67% समय सफल होती हैं। आंतरिक निर्माण केवल लगभग एक तिहाई बार काम करते हैं।
Salesforce ने 2025 की शुरुआत में 119% एजेंट वृद्धि देखी और इन उत्पादों के लिए आवर्ती राजस्व में 500 मिलियन डॉलर को पार किया। उन्होंने तीन महीनों में 6,000 एंटरप्राइज़ ग्राहक जोड़े।
व्यवसाय संभवतः उन्हें बनाने के बजाय समाधान खरीदेंगे। यह बाजार के कुछ बड़े खिलाड़ियों के आसपास केंद्रित होने की ओर इशारा करता है जो वास्तव में काम करने वाला वितरित कर सकते हैं।
स्रोत: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/

