Google और अफ्रीकी शोध संस्थानों के एक संघ ने WAXAL डेटासेट लॉन्च किया है, जो महाद्वीप पर आर्टिफिशियल इंटेलिजेंस (AI) की एक प्रमुख चुनौती को ठीक करने का एक बड़ा नया प्रयास है, जो अधिकांश अफ्रीकी भाषाओं की व्याख्या और समझ में असमर्थता है।
यह परियोजना 21 उप-सहारा अफ्रीकी भाषाओं में फैला एक बड़ा, खुला स्पीच डेटासेट प्रदान करती है और AI अर्थव्यवस्था से बाहर रखे गए 100 मिलियन से अधिक लोगों तक वॉयस टेक्नोलॉजी लाती है।
WAXAL डेटासेट Google द्वारा वित्त पोषित और स्थानीय विश्वविद्यालयों तथा सामुदायिक समूहों द्वारा संचालित तीन साल के सहयोग का उत्पाद है।
इसमें 1,250 घंटे की ट्रांसक्राइब्ड, प्राकृतिक स्पीच और 20 घंटे से अधिक की स्टूडियो-ग्रेड रिकॉर्डिंग शामिल हैं, जिसका उद्देश्य उच्च-निष्ठा सिंथेटिक आवाजें बनाना है। यह हौसा, योरूबा, लुगांडा, इग्बो और अचोली जैसी भाषाओं को लक्षित करता है, जिनमें से कई को करोड़ों लोग बोलते हैं लेकिन वाणिज्यिक स्पीच सिस्टम में काफी हद तक अदृश्य रहते हैं।
वैश्विक AI की सभी बातों के बावजूद, वॉयस टेक्नोलॉजी अभी भी अंग्रेजी और यूरोपीय और एशियाई भाषाओं की एक संकीर्ण मुट्ठी भर की ओर भारी झुकाव रखती है। 2,000 से अधिक भाषाओं का घर अफ्रीका, हाशिये पर छोड़ दिया गया है।
यह अंतर अकादमिक नहीं है; यह आकार देता है कि डिजिटल सेवाओं का उपयोग कौन कर सकता है, शिक्षा और स्वास्थ्य देखभाल उपकरणों तक किसकी पहुंच है, और आधुनिक AI प्लेटफॉर्म के शीर्ष पर कंपनियां बनाने का मौका किसे मिलता है। Google ने इस कार्य को एक लंबे समय से चले आ रहे डेटा अंतर को कम करने की दिशा में एक कदम के रूप में प्रस्तुत किया, जिसने कई अफ्रीकी भाषाओं को वॉयस असिस्टेंट और अन्य उपकरणों से दूर रखा है।
इस असंतुलन को सीधे संबोधित करने से परे, परियोजना डेटा जितनी ही महत्वपूर्ण है।
पहले की पहलों के विपरीत जहां अफ्रीकी स्पीच डेटा निकाला गया और कहीं और स्वामित्व में था, WAXAL का नेतृत्व अफ्रीकी संस्थानों द्वारा जमीन पर किया गया था। युगांडा में माकेरेरे विश्वविद्यालय, घाना विश्वविद्यालय, और रवांडा में डिजिटल उमुगांडा ने Google Research Africa के तकनीकी समर्थन के साथ डेटा संग्रह, सामुदायिक जुड़ाव और भाषा संरक्षण की देखरेख की।
महत्वपूर्ण रूप से, वे संस्थान डेटा का स्वामित्व बनाए रखते हैं। यह एक ऐसे क्षेत्र में एक उल्लेखनीय बदलाव है जिसकी अक्सर खुलेपन के बैनर तले निष्कर्षण गतिशीलता को पुनः उत्पन्न करने के लिए आलोचना की जाती है।
Google Research Africa की प्रमुख आयशा वाल्कॉट-ब्रायंट के अनुसार, "WAXAL का अंतिम प्रभाव अफ्रीका में लोगों का सशक्तिकरण है। यह डेटासेट छात्रों, शोधकर्ताओं और उद्यमियों को अपनी शर्तों पर, अपनी भाषाओं में प्रौद्योगिकी बनाने के लिए महत्वपूर्ण आधार प्रदान करता है, अंततः 100 मिलियन से अधिक लोगों तक पहुंचता है।"
"हम अफ्रीकी नवप्रवर्तकों को नए शैक्षिक उपकरणों से लेकर वॉयस-सक्षम सेवाओं तक सब कुछ बनाने के लिए इस डेटा का उपयोग करते हुए देखने के लिए उत्सुक हैं जो पूरे महाद्वीप में ठोस आर्थिक अवसर पैदा करते हैं", उन्होंने जोड़ा।
आयशा वाल्कॉट-ब्रायंट, Google Research Africa की प्रमुख
इस फ्रेमिंग को शामिल विश्वविद्यालयों द्वारा प्रतिध्वनित किया गया है। माकेरेरे विश्वविद्यालय में एक वरिष्ठ व्याख्याता जॉयस नाकातुम्बा-नबेन्दे ने कहा:
"अफ्रीका में AI का वास्तविक प्रभाव होने के लिए, इसे हमारी भाषाएं बोलनी चाहिए और हमारे संदर्भों को समझना चाहिए। WAXAL डेटासेट हमारे शोधकर्ताओं को उच्च-गुणवत्ता वाला डेटा देता है जो उन्हें स्पीच टेक्नोलॉजी बनाने के लिए चाहिए जो हमारे अद्वितीय समुदायों को प्रतिबिंबित करती हैं। युगांडा में, इसने पहले से ही हमारी स्थानीय शोध क्षमता को मजबूत किया है और नई छात्र- और संकाय-नेतृत्व वाली परियोजनाओं का समर्थन किया है।"
घाना विश्वविद्यालय में, एसोसिएट प्रोफेसर आइजैक वियाफे ने सार्वजनिक जुड़ाव के पैमाने की ओर इशारा किया:
"घाना विश्वविद्यालय में हमारे लिए, WAXAL का प्रभाव डेटा से परे है। इसने हमें अपने स्वयं के भाषा संसाधन बनाने और AI शोधकर्ताओं की एक नई पीढ़ी को प्रशिक्षित करने के लिए सशक्त बनाया है। 7,000 से अधिक स्वयंसेवक हमसे जुड़े क्योंकि वे चाहते थे कि उनकी आवाजें और भाषाएं डिजिटल भविष्य में हों। आज, उस सामूहिक प्रयास ने स्वास्थ्य, शिक्षा और कृषि जैसे क्षेत्रों में नवाचार का एक पारिस्थितिकी तंत्र जगाया है। यह साबित करता है कि जब डेटा मौजूद होता है, तो संभावना हर जगह फैलती है।"
सतर्क आशावाद के लिए कारण है। ओपन स्पीच डेटासेट स्थानीय स्टार्टअप और शोधकर्ताओं के लिए बाधाओं को कम कर सकते हैं जिनके पास बड़े पैमाने पर डेटा एकत्र करने के संसाधनों की कमी है। वे विदेशी API पर निर्भरता को भी कम कर सकते हैं जो अफ्रीकी भाषाओं का अच्छी तरह से समर्थन करते हैं, यदि बिल्कुल भी।
WAXAL डेटासेट
फिर भी, डेटासेट परिणामों की गारंटी नहीं देते हैं; विश्वसनीय वॉयस सिस्टम बनाने के लिए निरंतर निवेश, स्थानीय तैनाती, और वाणिज्यिक मार्गों की आवश्यकता होती है जो देश में मूल्य बनाए रखते हैं। फंडर और आयोजक के रूप में Google की भूमिका जांच को आमंत्रित करेगी, विशेष रूप से इस बारे में कि भविष्य में वैश्विक कंपनियों द्वारा WAXAL डेटा का उपयोग कैसे किया जाता है।
अभी के लिए, WAXAL डेटासेट की रिलीज एक अधिक भाषाई रूप से समावेशी AI पारिस्थितिकी तंत्र की दिशा में एक ठोस कदम को चिह्नित करती है। यह अफ्रीका की AI चुनौतियों को हल नहीं करती है, लेकिन यह एक मूलभूत को संबोधित करती है। वॉयस अक्सर प्रौद्योगिकी के साथ सबसे प्राकृतिक इंटरफेस है। यह सुनिश्चित करना कि AI अफ्रीका को अपनी सभी विविधता में बोलते हुए सुन सके, बहुत समय से बाकी है।
Google 21 अफ्रीकी भाषाओं में AI को प्रशिक्षित करने के लिए, जिसमें योरूबा, हौसा और इग्बो शामिल हैं, यह पोस्ट पहली बार Technext पर प्रकाशित हुई।

