Google และกลุ่มสถาบันวิจัยแห่งแอฟริกาได้เปิดตัวชุดข้อมูล WAXAL ซึ่งเป็นความพยายามครั้งสำคัญในการแก้ไขหนึ่งในความท้าทายหลักของปัญญาประดิษฐ์ (AI) ในทวีปนี้ คือความไม่สามารถในการตีความและเข้าใจภาษาแอฟริกันส่วนใหญ่
โครงการนี้นำเสนอชุดข้อมูลเสียงพูดขนาดใหญ่แบบเปิดที่ครอบคลุม 21 ภาษาในแอฟริกาใต้ทะเลทรายซาฮารา และนำเทคโนโลยีเสียงมาสู่ผู้คนกว่า 100 ล้านคนที่ถูกกีดกันออกจากเศรษฐกิจ AI
ชุดข้อมูล WAXAL เป็นผลผลิตจากความร่วมมือเป็นเวลาสามปีที่ได้รับทุนจาก Google และนำโดยมหาวิทยาลัยท้องถิ่นและกลุ่มชุมชน
ประกอบด้วยการบันทึกเสียงพูดธรรมชาติที่ถอดความแล้ว 1,250 ชั่วโมง และการบันทึกระดับสตูดิโอมากกว่า 20 ชั่วโมง มุ่งเป้าไปที่การสร้างเสียงสังเคราะห์ความคมชัดสูง เป้าหมายคือภาษาต่างๆ เช่น Hausa, Yoruba, Luganda, Igbo และ Acholi ซึ่งหลายภาษามีผู้พูดหลายสิบล้านคน แต่ยังคงไม่ปรากฏในระบบเสียงพูดเชิงพาณิชย์
แม้จะมีการพูดถึง AI ระดับโลก แต่เทคโนโลยีเสียงยังคงเอนเอียงไปทางภาษาอังกฤษและภาษายุโรปและเอเชียเพียงไม่กี่ภาษา แอฟริกาซึ่งเป็นที่ตั้งของภาษามากกว่า 2,000 ภาษา ถูกทิ้งไว้ที่ขอบ
ช่องว่างนั้นไม่ใช่เพียงทางวิชาการ มันกำหนดว่าใครสามารถใช้บริการดิจิทัล ใครสามารถเข้าถึงเครื่องมือด้านการศึกษาและสุขภาพ และใครจะสามารถสร้างบริษัทบนแพลตฟอร์ม AI สมัยใหม่ Google กำหนดกรอบงานนี้เป็นขั้นตอนสู่การลดช่องว่างข้อมูลที่มีมายาวนานซึ่งทำให้ภาษาแอฟริกันจำนวนมากไม่สามารถใช้งานผู้ช่วยเสียงและเครื่องมืออื่นๆ ได้
นอกจากการแก้ไขความไม่สมดุลนี้โดยตรงแล้ว โครงการนี้มีความสำคัญพอๆ กับข้อมูลเอง
แตกต่างจากความริเริ่มก่อนหน้านี้ที่ข้อมูลเสียงพูดแอฟริกันถูกดึงออกและเป็นเจ้าของโดยที่อื่น WAXAL ถูกนำโดยสถาบันแอฟริกันในพื้นที่ มหาวิทยาลัย Makerere ในยูกันดา มหาวิทยาลัยกานา และ Digital Umuganda ในรวันดา ดูแลการรวบรวมข้อมูล การมีส่วนร่วมของชุมชน และการดูแลภาษา โดยได้รับการสนับสนุนด้านเทคนิคจาก Google Research Africa
สิ่งสำคัญคือสถาบันเหล่านั้นยังคงเป็นเจ้าของข้อมูล นี่เป็นการเปลี่ยนแปลงที่โดดเด่นในสาขาที่มักถูกวิพากษ์วิจารณ์ว่าทำซ้ำพลวัตการแสวงหาประโยชน์ภายใต้ชื่อแบนเนอร์ของความเปิดกว้าง
ตาม Aisha Walcott-Bryant หัวหน้า Google Research Africa "ผลกระทบสูงสุดของ WAXAL คือการเสริมพลังให้กับผู้คนในแอฟริกา ชุดข้อมูลนี้ให้รากฐานที่สำคัญสำหรับนักศึกษา นักวิจัย และผู้ประกอบการในการสร้างเทคโนโลยีตามเงื่อนไขของตนเอง ในภาษาของตนเอง และในที่สุดก็เข้าถึงผู้คนกว่า 100 ล้านคน"
"เราตั้งตารอที่จะเห็นนักนวัตกรรมแอฟริกันใช้ข้อมูลนี้เพื่อสร้างทุกอย่างตั้งแต่เครื่องมือการศึกษาใหม่ไปจนถึงบริการที่ใช้เสียงซึ่งสร้างโอกาสทางเศรษฐกิจที่จับต้องได้ทั่วทั้งทวีป" เธอเสริม
Aisha Walcott-Bryant หัวหน้า Google Research Africa
กรอบแนวคิดนั้นสะท้อนโดยมหาวิทยาลัยที่เกี่ยวข้อง Joyce Nakatumba-Nabende อาจารย์อาวุโสที่มหาวิทยาลัย Makerere กล่าวว่า:
"เพื่อให้ AI มีผลกระทบที่แท้จริงในแอฟริกา มันต้องพูดภาษาของเราและเข้าใจบริบทของเรา ชุดข้อมูล WAXAL ให้ข้อมูลคุณภาพสูงที่นักวิจัยของเราต้องการเพื่อสร้างเทคโนโลยีเสียงพูดที่สะท้อนชุมชนที่ไม่เหมือนใครของเรา ในยูกันดา มันได้เสริมสร้างความสามารถในการวิจัยในท้องถิ่นของเราและสนับสนุนโครงการที่นำโดยนักศึกษาและคณาจารย์ใหม่ๆ"
ที่มหาวิทยาลัยกานา ผู้ช่วยศาสตราจารย์ Isaac Wiafe ชี้ไปที่ขนาดของการมีส่วนร่วมของสาธารณะ:
"สำหรับเราที่มหาวิทยาลัยกานา ผลกระทบของ WAXAL นั้นเกินกว่าข้อมูลเอง มันเสริมพลังให้เราสร้างทรัพยากรภาษาของเราเองและฝึกอบรมนักวิจัย AI รุ่นใหม่ อาสาสมัครกว่า 7,000 คนเข้าร่วมกับเราเพราะพวกเขาต้องการให้เสียงและภาษาของพวกเขาเป็นส่วนหนึ่งของอนาคตดิจิทัล วันนี้ ความพยายามร่วมกันนั้นได้จุดประกายระบบนิเวศของนวัตกรรมในสาขาต่างๆ เช่น สุขภาพ การศึกษา และเกษตรกรรม นี่พิสูจน์ว่าเมื่อข้อมูลมีอยู่ ความเป็นไปได้ก็ขยายออกไปทุกที่"
มีเหตุผลสำหรับความมองในแง่ดีอย่างระมัดระวัง ชุดข้อมูลเสียงพูดแบบเปิดสามารถลดอุปสรรคสำหรับสตาร์ทอัพและนักวิจัยในท้องถิ่นที่ขาดทรัพยากรในการรวบรวมข้อมูลในระดับใหญ่ พวกเขายังสามารถลดการพึ่งพา API ต่างประเทศที่ไม่ค่อยสนับสนุนภาษาแอฟริกันได้ดี หรือไม่สนับสนุนเลย
ชุดข้อมูล WAXAL
อย่างไรก็ตาม ชุดข้อมูลไม่ได้รับประกันผลลัพธ์ การสร้างระบบเสียงที่เชื่อถือได้ต้องการการลงทุนอย่างต่อเนื่อง การปรับใช้ในท้องถิ่น และเส้นทางเชิงพาณิชย์ที่รักษามูลค่าไว้ในประเทศ บทบาทของ Google ในฐานะผู้ให้ทุนและผู้จัดประชุมจะได้รับการตรวจสอบอย่างละเอียด โดยเฉพาะอย่างยิ่งเกี่ยวกับวิธีที่ข้อมูล WAXAL ถูกใช้โดยบริษัทระดับโลกในอนาคต
สำหรับตอนนี้ การเปิดตัวชุดข้อมูล WAXAL เป็นก้าวที่ชัดเจนสู่ระบบนิเวศ AI ที่ครอบคลุมทางภาษามากขึ้น มันไม่ได้แก้ไขความท้าทาย AI ของแอฟริกา แต่มันแก้ไขปัญหาพื้นฐาน เสียงมักเป็นอินเทอร์เฟซที่เป็นธรรมชาติที่สุดกับเทคโนโลยี การทำให้แน่ใจว่า AI สามารถได้ยินแอฟริกาพูด ในความหลากหลายทั้งหมด เป็นสิ่งที่ล่าช้ามานาน
โพสต์ Google ฝึก AI ใน 21 ภาษาแอฟริกัน รวมถึง Yoruba, Hausa และ Igbo ปรากฏครั้งแรกบน Technext


