Google koos Aafrika uurimisinstitutsioonide konsortsiumiga on käivitanud WAXAL-i andmekogu, mis on suur algatus, et lahendada üks tehisintellekti (AI) peamisi väljakutseid kontinendil: võimetus tõlgendada ja mõista enamikku Aafrika keeli.
Selle projektiga loovad nad mahuka, avatud kõneandmekogu, mis hõlmab 21 Sahaarast lõuna poolt asuvat Aafrika keelt ning toovad häältehnoloogia ligi 100 miljoni inimeseni, kes on seni jäänud AI-majandusest eemale.
WAXAL-i andmekogu on kolmeaastase Google’i rahastatud koostöö tulemus, mida juhtisid kohalikud ülikoolid ja kogukonnagruppidel.
Kogus on 1250 tundi transkribeeritud, naturaalset kõnet ning üle 20 tunni stuudiokvaliteediga salvestusi, mille eesmärk on luua kõrge täpsusega sünteetilised hääled. Projekti fookuses on keeled nagu Hausa, Yoruba, Luganda, Igbo ja Acholi, millest paljusid räägib kümneid miljoneid inimesi, kuid mis jäävad kaubanduslike kõnesüsteemide jaoks suuresti nähtamatuteks.
Ülemaailmse AI-st räägitakse küll palju, kuid häältehnoloogiad põhinevad endiselt valdavalt inglise keelel ja kitsal hulgal Euroopa ning Aasia keeltest. Aafrika, kus elab üle 2000 keele, on jäänud marginaalsesse positsiooni.
Seda lõhet ei saa pidada akadeemiliseks – see määrab, kes saab kasutada digitaalseid teenuseid, kes saab ligipääsu haridus- ja tervishoiuvahenditele ning kes saab luua ettevõtteid kaasaegsete AI-platvormide baasil. Google käsitles seda tööd sammuna pikka aega kestnud andmevahekorra vähendamise suunas, mis on hoidnud paljusid Aafrika keeli häälteenustest ja muudest tööriistadest eemal.
Peale selle, et projekt otseselt parandab ebakõla, on selle tähtsus sama suur kui andmete omamine.
Võrreldes varasemate algatustega, kus Aafrika kõneandmeid koguti ja neid omistati mujal, juhatas WAXAL-i Aafrika institutsioonid kohapeal. Uganda Makerere Ülikool, Ghana Ülikool ja Rwanda Digital Umuganda juhtisid andmete kogumist, kogukonna kaasamist ja keele haldamist, tehnilist tuge pakus Google Research Africa.
Oluliselt on need institutsioonid andmete omanikeks. See on märkimisväärne muutus valdkonnas, mida on sageli kritiseeritud avatuse lipu all ekstraktiivsete dünaamikate taaselustamise eest.
Google Research Africa juhi Aisha Walcott-Bryanti sõnul: “WAXAL-i lõplik mõju on Aafrika inimeste võimestamine. See andmekogu annab tudengitele, teadlastele ja ettevõtjatele kriitilise aluse, et luua tehnoloogiat oma tingimustel, oma keeltes, jõudes lõpuks üle 100 miljoni inimeseni.”
“Ootame põnevusega, kuidas Aafrika innovaatorid kasutavad neid andmeid, et luua kõike alates uutest haridusvahenditest kuni häältega toimivate teenusteni, mis loovad Aafrikas tangiblesed majanduslikud võimalused,” lisas ta.
Aisha Walcott-Bryant, Google Research Africa juht
Seda raamistikku kordavad ka osalenud ülikoolid. Makerere Ülikooli vanemlektor Joyce Nakatumba-Nabende ütles:
“Selleks, et AI saaks Aafrikas tõelist mõju avaldada, peab see rääkima meie keeli ja mõistma meie kontekste. WAXAL-i andmekogu annab meie teadlastele kvaliteetsed andmed, mida nad vajavad kõnetehnoloogiate loomiseks, mis peegeldavad meie unikaalseid kogukondi. Ugandas on see juba tugevdanud meie kohalikku teaduslikku võimekust ja toetanud uusi tudengite ja õppejõudude juhitavaid projekte.”
Ghana Ülikoolis rõhutas dotsent Isaac Wiafe avaliku kaasamise ulatust:
“Ghana Ülikoolis on WAXAL-i mõju palju enamat kui lihtsalt andmed. See on andnud meile võimaluse luua oma keeleressursse ja koolitada uut põlvkonda AI-teadlasi. Üle 7000 vabatahtlikku liitus meiega, sest nad soovisid, et nende hääled ja keeled kuuluksid digitaalsesse tulevikku. Tänaseks on see ühiskondlik pingutus käivitanud innovatsiooniekosüsteemi valdkondades nagu tervis, haridus ja põllumajandus. See tõestab, et kui andmed on olemas, laienevad võimalused igal pool.”
On põhjust olla ettevaatlikult optimistlik. Avatud kõneandmekogud võivad vähendada barjääre kohalikele startupidele ja teadlastele, kellel puuduvad ressursid andmete suuremahuliseks kogumiseks. Samuti võivad nad vähendada sõltuvust välismaistest APIdest, mis harva toetavad Aafrika keeli korralikult, kui üldse.
WAXAL-i andmekogu
Ometi ei taga andmekogud automaatselt tulemusi; usaldusväärsete häälte süsteemide loomine nõuab püsivat investeeringut, kohalikku juurutamist ja kommertspäraseid teedeloomeid, mis hoiavad väärtust riigis. Google’i roll rahastaja ja koordineerijana kutsub kindlasti üles kriitikat, eriti selle osas, kuidas WAXAL-i andmeid tulevikus globaalsed ettevõtted kasutavad.
Seni tähendab WAXAL-i andmekogu vabastamine konkreetset sammu keeleliselt kaasavama AI-ökosüsteemi suunas. See ei lahenda Aafrika AI-väljakutseid, kuid katab ühe fundamentaalse probleemi. Hääl on tihtipeale kõige loomulikum liides tehnoloogiaga. Veenduda, et AI suudab kuulda Aafrika rääkimist kogu selle mitmekesisusega, on ammu olnud viivitamatu.
Postitus “Google koolitab AI-d 21 Aafrika keeles, sealhulgas Yoruba, Hausa ja Igbo” ilmus esmakordselt Technextis.


