यह पोस्ट Character.ai Unveils Efficient Techniques for Large-Scale Pretraining BitcoinEthereumNews.com पर प्रकाशित हुई। Tony Kim दिसंबर 23, 2025 21:56 Character.aiयह पोस्ट Character.ai Unveils Efficient Techniques for Large-Scale Pretraining BitcoinEthereumNews.com पर प्रकाशित हुई। Tony Kim दिसंबर 23, 2025 21:56 Character.ai

Character.ai ने बड़े पैमाने पर प्री-ट्रेनिंग के लिए कुशल तकनीकों का अनावरण किया



Tony Kim
Dec 23, 2025 21:56

Character.ai ने बड़े पैमाने पर प्रीट्रेनिंग को अनुकूलित करने के लिए नवीन तरीकों का खुलासा किया है, जो AI मॉडल प्रशिक्षण में दक्षता बढ़ाने के लिए Squinch, डायनामिक क्लैम्पिंग और Gumbel Softmax जैसी तकनीकों पर केंद्रित है।

Character.ai, AI क्षेत्र में एक उल्लेखनीय खिलाड़ी, ने हाल ही में बड़े पैमाने पर ट्रांसफॉर्मर प्रशिक्षण को अनुकूलित करने के अपने शुरुआती प्रयासों में अंतर्दृष्टि साझा की है। कंपनी, जिसने तब से अपना ध्यान ओपन-सोर्स मॉडल फाउंडेशन पर केंद्रित किया है, ने मूल रूप से Character.AI ब्लॉग के अनुसार प्रशिक्षण दक्षता और गति बढ़ाने के लिए विभिन्न तकनीकों की खोज की थी।

ग्रेडिएंट कम्प्रेशन: Squinch

Character.ai के प्रयासों में उजागर की गई प्रमुख नवाचारों में से एक Squinch के रूप में जाना जाने वाला ग्रेडिएंट कम्प्रेशन एल्गोरिदम है। सह-संस्थापक Noam Shazeer द्वारा विकसित, यह 6-बिट कम्प्रेशन तकनीक वितरित प्रशिक्षण के दौरान संचार बैंडविड्थ को महत्वपूर्ण रूप से कम करने के लिए डिज़ाइन की गई थी जबकि मॉडल सटीकता बनाए रखी गई। एल्गोरिदम प्रभावी रूप से ग्रेडिएंट को प्रति तत्व 6 बिट्स तक संकुचित करता है, प्रशिक्षण क्लस्टर के बैंडविड्थ उपयोग को अनुकूलित करता है।

प्रेसिजन रेगुलराइजेशन: Attention Z-Reg

Character.ai ने Attention Z-Reg भी विकसित किया, एक रेगुलराइजेशन विधि जो संख्यात्मक स्थिरता सुनिश्चित करने के लिए attention logits पर लागू की जाती है। यह तकनीक bfloat16 प्रतिनिधित्व की सटीकता बनाए रखने में मदद करती है, जो बड़े मॉडल के प्रशिक्षण को अनुकूलित करने के लिए महत्वपूर्ण है।

क्वांटाइजेशन स्थिरता: डायनामिक क्लैम्पिंग

डायनामिक क्लैम्पिंग एक अन्य तकनीक है जिसका उपयोग क्वांटाइजेशन स्थिरता बढ़ाने के लिए किया जाता है। यह इनपुट वेट के रूट मीन स्क्वायर के आधार पर क्लैम्पिंग रेंज की गतिशील गणना करके छोटे एक्टिवेशन मानों को शून्य तक गिरने से रोकता है। यह विधि क्वांटाइजेशन त्रुटियों को कम करके प्रशिक्षण स्थिरता में सुधार करती है।

कुशल Attention API: Visibility Mask

Visibility Mask की शुरुआत, प्रशिक्षण और इन्फरेंस के दौरान अंतर-टोकन संबंधों का प्रतिनिधित्व करने के लिए एक उपकरण, ने प्रशिक्षण प्रणालियों की दक्षता में सुधार किया है। यह API बैचों के भीतर attention रेंज को प्रबंधित करने में मदद करता है, ट्री-स्ट्रक्चर्ड दस्तावेज़ संबंधों और द्विदिशात्मक attention का समर्थन करता है।

डिस्टिलेशन ऑप्टिमाइजेशन: Gumbel Softmax

मॉडल डिस्टिलेशन के क्षेत्र में, Character.ai ने टीचर मॉडल की फिडेलिटी बनाए रखते हुए स्टोरेज और बैंडविड्थ लागत को कम करने के लिए Gumbel Softmax तकनीक का लाभ उठाया है। इस दृष्टिकोण में टीचर मॉडल आउटपुट के सबसेट की सैंपलिंग शामिल है, अधिक कुशल स्टूडेंट मॉडल प्रशिक्षण के लिए सॉफ्ट टारगेट मानों को संरक्षित करता है।

Character.ai के प्रीट्रेनिंग को अनुकूलित करने के प्रयासों ने अधिक कुशल AI मॉडल प्रशिक्षण का मार्ग प्रशस्त किया है, यहां तक कि जब कंपनी ओपन-सोर्स मॉडल के लिए पोस्ट-ट्रेनिंग रीइन्फोर्समेंट लर्निंग की ओर बढ़ रही है। Squinch और Gumbel Softmax सहित ये तकनीकें, AI दक्षता और स्केलेबिलिटी को आगे बढ़ाने के लिए कंपनी की प्रतिबद्धता को रेखांकित करती हैं।

छवि स्रोत: Shutterstock

स्रोत: https://blockchain.news/news/character-ai-unveils-efficient-techniques-for-large-scale-pretraining

मार्केट अवसर
Sleepless AI लोगो
Sleepless AI मूल्य(AI)
$0.03704
$0.03704$0.03704
+1.17%
USD
Sleepless AI (AI) मूल्य का लाइव चार्ट
अस्वीकरण: इस साइट पर बाहर से पोस्ट किए गए लेख, सार्वजनिक प्लेटफार्म से लिए गए हैं और केवल सूचना देने के उद्देश्यों के लिए उपलब्ध कराए गए हैं. वे निश्चित तौर पर MEXC के विचारों को नहीं दिखाते. सभी संबंधित अधिकार मूल लेखकों के पास ही हैं. अगर आपको लगता है कि कोई कॉन्टेंट तीसरे पक्ष के अधिकारों का उल्लंघन करता है, तो कृपया उसे हटाने के लिए service@support.mexc.com से संपर्क करें. MEXC किसी कॉन्टेंट की सटीकता, पूर्णता या समयबद्धता के संबंध में कोई गारंटी नहीं देता है और प्रदान की गई जानकारी के आधार पर की गई किसी भी कार्रवाई के लिए जिम्मेदार नहीं है. यह कॉन्टेंट वित्तीय, कानूनी या अन्य प्रोफ़ेशनल सलाह नहीं है, न ही इसे MEXC द्वारा अनुशंसा या समर्थन माना जाना चाहिए.

आपको यह भी पसंद आ सकता है

निवेश के लिए सर्वश्रेष्ठ क्रिप्टो: ट्रम्प क्रिप्टो होल्डर्स को राहत देंगे क्योंकि DeepSnitch AI 2026 के लिए शीर्ष निवेश विकल्प बनता है

निवेश के लिए सर्वश्रेष्ठ क्रिप्टो: ट्रम्प क्रिप्टो होल्डर्स को राहत देंगे क्योंकि DeepSnitch AI 2026 के लिए शीर्ष निवेश विकल्प बनता है

YouTube पर अपने पसंदीदा वीडियो और संगीत का आनंद लें, मूल सामग्री अपलोड करें, और दोस्तों, परिवार और दुनिया के साथ साझा करें।
शेयर करें
Blockchainreporter2025/12/24 21:40
एथेरियम व्हेल ने अतिरिक्त 40,975 ETH खरीदकर कुल होल्डिंग को $1.69B तक पहुंचाया

एथेरियम व्हेल ने अतिरिक्त 40,975 ETH खरीदकर कुल होल्डिंग को $1.69B तक पहुंचाया

Ethereum व्हेल ने 40,975 ETH खरीदे, कुल राशि $1.69B तक पहुंची, Aave से $881.5M उधार लिया, जो लीवरेज्ड संचय रणनीति का संकेत देता है। एक Ethereum व्हेल, जिसे जाना जाता है
शेयर करें
LiveBitcoinNews2025/12/24 20:30
Polymarket तीसरे पक्ष के प्रदाता की सुरक्षा समस्या को उपयोगकर्ता खाता हैक के लिए जिम्मेदार ठहराता है

Polymarket तीसरे पक्ष के प्रदाता की सुरक्षा समस्या को उपयोगकर्ता खाता हैक के लिए जिम्मेदार ठहराता है

पॉलीमार्केट, एक विकेन्द्रीकृत प्रेडिक्शन मार्केट प्लेटफॉर्म, ने स्वीकार किया कि तीसरे पक्ष से जुड़ी सुरक्षा समस्या के कारण कई उपयोगकर्ता खातों को नुकसान हुआ
शेयर करें
Cryptopolitan2025/12/24 21:15