Alphabet के Google डिवीजन ने बुधवार को दो विशेष आर्टिफिशियल इंटेलिजेंस प्रोसेसर पेश किए, जो पहली बार है जब इसकी टेंसर प्रोसेसिंग यूनिट आर्किटेक्चर को ट्रेनिंग और इनफरेंस ऑपरेशन के लिए अलग-अलग चिप्स में विभाजित किया गया है।
TPU 8t विशेष रूप से AI मॉडल ट्रेनिंग के लिए इंजीनियर किया गया है, जबकि इसका समकक्ष TPU 8i विशेष रूप से इनफरेंस—प्रशिक्षित मॉडलों को वास्तविक दुनिया के अनुप्रयोगों में तैनात करने की प्रक्रिया—पर केंद्रित है। Broadcom ने सह-विकास भागीदार के रूप में काम किया, जो दस वर्षों से अधिक समय तक फैले सहयोग को आगे बढ़ा रहा है।
Alphabet Inc., GOOGL
यह पिछले दृष्टिकोणों से एक रणनीतिक बदलाव का प्रतिनिधित्व करता है। पहले के TPU पुनरावृत्तियों ने एक ही प्रोसेसर में ट्रेनिंग और इनफरेंस दोनों क्षमताओं को संयोजित किया था। Google इस बदलाव का श्रेय एजेंटिक AI सिस्टम के उभरने को देता है—स्वायत्त मॉडल जो न्यूनतम मानवीय निगरानी के साथ निरंतर फीडबैक लूप में काम करते हैं—जिन्हें अधिक उद्देश्य-निर्मित सिलिकॉन की आवश्यकता होती है।
इनफरेंस-उन्मुख TPU 8i प्रति प्रोसेसर 384 मेगाबाइट SRAM पैक करता है—Ironwood की क्षमता से तीन गुना। Google के अनुसार, यह आर्किटेक्चरल सुधार "वेटिंग रूम" बाधा को समाप्त करता है, जिससे वे विलंबता स्पाइक्स कम होते हैं जो तब होते हैं जब एकाधिक उपयोगकर्ता एक साथ किसी मॉडल से क्वेरी करते हैं।
Ironwood की तुलना में, TPU 8i 80% बेहतर लागत दक्षता प्राप्त करता है। परिचालन के संदर्भ में, संगठन बजट बढ़ाए बिना लगभग दोगुनी उपयोगकर्ता मांग को समायोजित कर सकते हैं।
चिप प्रति वाट 2x तक बेहतर ऊर्जा दक्षता भी प्रदर्शित करता है, जो डायनामिक पावर मैनेजमेंट तकनीक द्वारा सक्षम है जो वास्तविक समय की वर्कलोड आवश्यकताओं के आधार पर ऊर्जा खपत को नियंत्रित करती है।
पहली बार, दोनों प्रोसेसर होस्ट प्रोसेसर के रूप में Google के Axion CPU का उपयोग करते हैं, जो व्यक्तिगत चिप प्रदर्शन तक सुधार सीमित करने के बजाय सिस्टम आर्किटेक्चर स्तर पर अनुकूलन सक्षम करता है।
ट्रेनिंग क्षमताओं के संदर्भ में, TPU 8t सुपरपॉड कॉन्फ़िगरेशन 2 पेटाबाइट हाई-बैंडविड्थ मेमोरी के साथ 9,600 प्रोसेसर तक के क्लस्टर का समर्थन करता है। यह Ironwood की इंटरचिप कम्युनिकेशन बैंडविड्थ से दोगुना है, और Google का दावा है कि यह फ्रंटियर मॉडल विकास की समयसीमा को महीनों से घटाकर कुछ हफ्तों तक सीमित कर सकता है।
ट्रेनिंग प्रोसेसर समकक्ष मूल्य बिंदु पर सातवीं पीढ़ी के Ironwood आर्किटेक्चर की तुलना में 2.8 गुना कम्प्यूटेशनल प्रदर्शन प्रदान करता है।
शुरुआती अपनाना गति पकड़ रहा है। Citadel Securities ने Google के TPU इंफ्रास्ट्रक्चर का उपयोग करके क्वांटिटेटिव रिसर्च प्लेटफॉर्म विकसित किए। अमेरिकी ऊर्जा विभाग की सभी सत्रह राष्ट्रीय प्रयोगशालाएं प्रोसेसर पर AI को-साइंटिस्ट एप्लिकेशन चलाती हैं। Anthropic ने Google TPU कंप्यूटिंग क्षमता के कई गीगावाट उपयोग करने की प्रतिबद्धता जताई है।
DA Davidson के विश्लेषकों ने सितंबर में अनुमान लगाया था कि Google का TPU डिवीजन, Google DeepMind के साथ मिलकर, $900 बिलियन के करीब मूल्यांकन का आदेश दे सकता है।
Google TPUs के लिए एक विशेष वितरण मॉडल बनाए रखता है—वे सीधी खरीद के लिए उपलब्ध नहीं हैं और केवल Google Cloud सेवाओं के माध्यम से ही एक्सेस किए जा सकते हैं। Nvidia Google को GPU हार्डवेयर की आपूर्ति जारी रखता है, और कंपनी ने पुष्टि की कि जब Nvidia का आगामी Vera Rubin प्लेटफॉर्म इस साल के अंत में लॉन्च होगा, तो वह इसे पेश करने वाले शुरुआती क्लाउड सेवा प्रदाताओं में होगा।
प्रोसेसर को Google DeepMind के साथ घनिष्ठ सहयोग में इंजीनियर किया गया था, जिसने Gemini भाषा मॉडल को प्रशिक्षित करने और Search और YouTube प्लेटफॉर्म को संचालित करने वाले एल्गोरिदम को अनुकूलित करने के लिए उन्हें तैनात किया है।
Google ने घोषणा की कि TPU 8t और TPU 8i दोनों 2025 के अंत में क्लाउड प्लेटफॉर्म ग्राहकों के लिए सामान्य उपलब्धता तक पहुंचेंगे।
The post Alphabet (GOOGL) Unveils Dual-Purpose 8th-Gen TPU Chips Developed With Broadcom appeared first on Blockonomi.