Google ja Aafrika teadusasutuste konsortsium on käivitanud WAXAL-i andmekogu, mis on suur uus algatus, et… Postitus: Google hakkab AI-d õpetama 21 Aafrika keelesGoogle ja Aafrika teadusasutuste konsortsium on käivitanud WAXAL-i andmekogu, mis on suur uus algatus, et… Postitus: Google hakkab AI-d õpetama 21 Aafrika keeles

Google plaanib koolitada tehisintellekti 21 Aafrika keeles, sealhulgas Yoruba, Hausa ja Igbo.

2026/02/02 22:00
4 minutiline lugemine
Selle sisu kohta tagasiside või murede korral võtke meiega ühendust aadressil crypto.news@mexc.com

Google koos Aafrika uurimisinstitutsioonide konsortsiumiga on käivitanud WAXAL-i andmekogu, mis on suur algatus, et lahendada üks tehisintellekti (AI) peamisi väljakutseid kontinendil: võimetus tõlgendada ja mõista enamikku Aafrika keeli.

Selle projektiga loovad nad mahuka, avatud kõneandmekogu, mis hõlmab 21 Sahaarast lõuna poolt asuvat Aafrika keelt ning toovad häältehnoloogia ligi 100 miljoni inimeseni, kes on seni jäänud AI-majandusest eemale.

WAXAL-i andmekogu on kolmeaastase Google’i rahastatud koostöö tulemus, mida juhtisid kohalikud ülikoolid ja kogukonnagruppidel.

Kogus on 1250 tundi transkribeeritud, naturaalset kõnet ning üle 20 tunni stuudiokvaliteediga salvestusi, mille eesmärk on luua kõrge täpsusega sünteetilised hääled. Projekti fookuses on keeled nagu Hausa, Yoruba, Luganda, Igbo ja Acholi, millest paljusid räägib kümneid miljoneid inimesi, kuid mis jäävad kaubanduslike kõnesüsteemide jaoks suuresti nähtamatuteks.

Google ja Aafrika ülikoolid käivitavad WAXAL-i andmekogu, et koolitada AI-d 21 Aafrika keeles, sealhulgas Yoruba, Hausa ja Igbo

Ülemaailmse AI-st räägitakse küll palju, kuid häältehnoloogiad põhinevad endiselt valdavalt inglise keelel ja kitsal hulgal Euroopa ning Aasia keeltest. Aafrika, kus elab üle 2000 keele, on jäänud marginaalsesse positsiooni.

Seda lõhet ei saa pidada akadeemiliseks – see määrab, kes saab kasutada digitaalseid teenuseid, kes saab ligipääsu haridus- ja tervishoiu­vahenditele ning kes saab luua ettevõtteid kaasaegsete AI-platvormide baasil. Google käsitles seda tööd sammuna pikka aega kestnud andmevahekorra vähendamise suunas, mis on hoidnud paljusid Aafrika keeli häälteenustest ja muudest tööriistadest eemal.

Miks on WAXAL-i andmekogu oluline Aafrika AI-arhitektuurile

Peale selle, et projekt otseselt parandab ebakõla, on selle tähtsus sama suur kui andmete omamine.

Võrreldes varasemate algatustega, kus Aafrika kõneandmeid koguti ja neid omistati mujal, juhatas WAXAL-i Aafrika institutsioonid kohapeal. Uganda Makerere Ülikool, Ghana Ülikool ja Rwanda Digital Umuganda juhtisid andmete kogumist, kogukonna kaasamist ja keele haldamist, tehnilist tuge pakus Google Research Africa.

Oluliselt on need institutsioonid andmete omanikeks. See on märkimisväärne muutus valdkonnas, mida on sageli kritiseeritud avatuse lipu all ekstraktiivsete dünaamikate taaselustamise eest.

Google Research Africa juhi Aisha Walcott-Bryanti sõnul: “WAXAL-i lõplik mõju on Aafrika inimeste võimestamine. See andmekogu annab tudengitele, teadlastele ja ettevõtjatele kriitilise aluse, et luua tehnoloogiat oma tingimustel, oma keeltes, jõudes lõpuks üle 100 miljoni inimeseni.”

“Ootame põnevusega, kuidas Aafrika innovaatorid kasutavad neid andmeid, et luua kõike alates uutest haridusvahenditest kuni häältega toimivate teenusteni, mis loovad Aafrikas tangiblesed majanduslikud võimalused,” lisas ta. 

Google ja Aafrika ülikoolid käivitavad WAXAL-i andmekogu, et koolitada AI-d 21 Aafrika keeles, sealhulgas Yoruba, Hausa ja IgboAisha Walcott-Bryant, Google Research Africa juht

Seda raamistikku kordavad ka osalenud ülikoolid. Makerere Ülikooli vanemlektor Joyce Nakatumba-Nabende ütles:

“Selleks, et AI saaks Aafrikas tõelist mõju avaldada, peab see rääkima meie keeli ja mõistma meie kontekste. WAXAL-i andmekogu annab meie teadlastele kvaliteetsed andmed, mida nad vajavad kõnetehnoloogiate loomiseks, mis peegeldavad meie unikaalseid kogukondi. Ugandas on see juba tugevdanud meie kohalikku teaduslikku võimekust ja toetanud uusi tudengite ja õppejõudude juhitavaid projekte.”

Ghana Ülikoolis rõhutas dotsent Isaac Wiafe avaliku kaasamise ulatust: 

“Ghana Ülikoolis on WAXAL-i mõju palju enamat kui lihtsalt andmed. See on andnud meile võimaluse luua oma keeleressursse ja koolitada uut põlvkonda AI-teadlasi. Üle 7000 vabatahtlikku liitus meiega, sest nad soovisid, et nende hääled ja keeled kuuluksid digitaalsesse tulevikku. Tänaseks on see ühiskondlik pingutus käivitanud innovatsiooniekosüsteemi valdkondades nagu tervis, haridus ja põllumajandus. See tõestab, et kui andmed on olemas, laienevad võimalused igal pool.”

On põhjust olla ettevaatlikult optimistlik. Avatud kõneandmekogud võivad vähendada barjääre kohalikele startupidele ja teadlastele, kellel puuduvad ressursid andmete suuremahuliseks kogumiseks. Samuti võivad nad vähendada sõltuvust välismaistest APIdest, mis harva toetavad Aafrika keeli korralikult, kui üldse.

Google ja Aafrika ülikoolid käivitavad WAXAL-i andmekogu, et koolitada AI-d 21 Aafrika keeles, sealhulgas Yoruba, Hausa ja IgboWAXAL-i andmekogu

Ometi ei taga andmekogud automaatselt tulemusi; usaldusväärsete häälte süsteemide loomine nõuab püsivat investeeringut, kohalikku juurutamist ja kommertspäraseid teede­loomeid, mis hoiavad väärtust riigis. Google’i roll rahastaja ja koordineerijana kutsub kindlasti üles kriitikat, eriti selle osas, kuidas WAXAL-i andmeid tulevikus globaalsed ettevõtted kasutavad.

Seni tähendab WAXAL-i andmekogu vabastamine konkreetset sammu keeleliselt kaasavama AI-ökosüsteemi suunas. See ei lahenda Aafrika AI-väljakutseid, kuid katab ühe fundamentaalse probleemi. Hääl on tihtipeale kõige loomulikum liides tehnoloogiaga. Veenduda, et AI suudab kuulda Aafrika rääkimist kogu selle mitmekesisusega, on ammu olnud viivitamatu.

Postitus “Google koolitab AI-d 21 Aafrika keeles, sealhulgas Yoruba, Hausa ja Igbo” ilmus esmakordselt Technextis.

Lahtiütlus: Sellel saidil taasavaldatud artiklid pärinevad avalikelt platvormidelt ja on esitatud ainult informatiivsel eesmärgil. Need ei kajasta tingimata MEXC seisukohti. Kõik õigused jäävad algsetele autoritele. Kui arvate, et sisu rikub kolmandate isikute õigusi, võtke selle eemaldamiseks ühendust aadressil crypto.news@mexc.com. MEXC ei garanteeri sisu täpsust, täielikkust ega ajakohasust ega vastuta esitatud teabe põhjal võetud meetmete eest. Sisu ei ole finants-, õigus- ega muu professionaalne nõuanne ega seda tohiks pidada MEXC soovituseks ega toetuseks.

$30,000 in PRL + 15,000 USDT

$30,000 in PRL + 15,000 USDT$30,000 in PRL + 15,000 USDT

Deposit & trade PRL to boost your rewards!