أطلقت جوجل وكونسورتيوم من المؤسسات البحثية الأفريقية مجموعة بيانات WAXAL، وهي جهد جديد رئيسي لـ... المنشور جوجل لتدريب الذكاء الاصطناعي على 21 لغة أفريقيةأطلقت جوجل وكونسورتيوم من المؤسسات البحثية الأفريقية مجموعة بيانات WAXAL، وهي جهد جديد رئيسي لـ... المنشور جوجل لتدريب الذكاء الاصطناعي على 21 لغة أفريقية

جوجل تدرب الذكاء الاصطناعي على 21 لغة أفريقية، بما في ذلك اليوروبا والهوسا والإيغبو

أطلقت Google وكونسورتيوم من المؤسسات البحثية الأفريقية مجموعة بيانات WAXAL، وهي جهد جديد كبير لتصحيح أحد التحديات الرئيسية للذكاء الاصطناعي في القارة، وهو عدم قدرته على تفسير وفهم معظم اللغات الأفريقية.

يقدم المشروع مجموعة بيانات كلام كبيرة ومفتوحة تغطي 21 لغة أفريقية جنوب الصحراء الكبرى وتجلب تقنية الصوت إلى أكثر من 100 مليون شخص مستبعدين من اقتصاد الذكاء الاصطناعي.

مجموعة بيانات WAXAL هي نتاج تعاون استمر ثلاث سنوات بتمويل من Google وبقيادة جامعات محلية ومجموعات مجتمعية.

تتضمن 1,250 ساعة من الكلام الطبيعي المنسوخ وأكثر من 20 ساعة من التسجيلات بجودة الاستوديو تهدف إلى بناء أصوات اصطناعية عالية الدقة. تستهدف لغات مثل الهوسا واليوروبا واللوغندا والإيغبو والأشولي، والتي يتحدث بها الكثير منها عشرات الملايين لكنها تظل غير مرئية إلى حد كبير لأنظمة الكلام التجارية.

Google and African universities launch the WAXAL dataset to train AI in 21 African languages, including Yoruba, Hausa and Igbo

على الرغم من كل الحديث عن الذكاء الاصطناعي العالمي، لا تزال تقنيات الصوت تميل بشكل كبير نحو الإنجليزية وحفنة ضيقة من اللغات الأوروبية والآسيوية. أفريقيا، موطن أكثر من 2,000 لغة، تُركت على الهامش.

هذه الفجوة ليست أكاديمية؛ فهي تشكل من يمكنه استخدام الخدمات الرقمية، ومن يمكنه الوصول إلى أدوات التعليم والرعاية الصحية، ومن يمكنه بناء شركات فوق منصات الذكاء الاصطناعي الحديثة. أطرت Google العمل كخطوة نحو تضييق فجوة البيانات طويلة الأمد التي أبقت العديد من اللغات الأفريقية بعيدة عن المساعدين الصوتيين والأدوات الأخرى.

لماذا تهم مجموعة بيانات WAXAL بنية الذكاء الاصطناعي في أفريقيا

بالإضافة إلى معالجة هذا الخلل مباشرة، يهم المشروع بقدر أهمية البيانات نفسها.

على عكس المبادرات السابقة حيث تم استخراج بيانات الكلام الأفريقية وامتلاكها في مكان آخر، قادت WAXAL على الأرض مؤسسات أفريقية. أشرفت جامعة ماكيريري في أوغندا وجامعة غانا وDigital Umuganda في رواندا على جمع البيانات والمشاركة المجتمعية وإدارة اللغة، بدعم تقني من Google Research Africa.

والأهم من ذلك، تحتفظ هذه المؤسسات بملكية البيانات. هذا تحول ملحوظ في مجال غالباً ما ينتقد لإعادة إنتاج ديناميكيات استخراجية تحت راية الانفتاح.

وفقاً لعائشة والكوت-براينت، رئيسة Google Research Africa، "التأثير النهائي لـ WAXAL هو تمكين الناس في أفريقيا. توفر مجموعة البيانات هذه الأساس الحاسم للطلاب والباحثين ورواد الأعمال لبناء التكنولوجيا بشروطهم الخاصة، بلغاتهم الخاصة، للوصول أخيراً إلى أكثر من 100 مليون شخص."

"نتطلع إلى رؤية المبتكرين الأفارقة يستخدمون هذه البيانات لإنشاء كل شيء من أدوات تعليمية جديدة إلى خدمات صوتية تخلق فرصاً اقتصادية ملموسة عبر القارة"، أضافت. 

Google and African universities launch the WAXAL dataset to train AI in 21 African languages, including Yoruba, Hausa and Igboعائشة والكوت-براينت، رئيسة Google Research Africa

هذا الإطار تردد صداه من قبل الجامعات المشاركة. قالت جويس ناكاتومبا-نابيندي، محاضرة كبيرة في جامعة ماكيريري:

"لكي يكون للذكاء الاصطناعي تأثير حقيقي في أفريقيا، يجب أن يتحدث لغاتنا ويفهم سياقاتنا. تمنح مجموعة بيانات WAXAL باحثينا البيانات عالية الجودة التي يحتاجونها لبناء تقنيات الكلام التي تعكس مجتمعاتنا الفريدة. في أوغندا، عززت بالفعل قدرتنا البحثية المحلية ودعمت مشاريع جديدة يقودها الطلاب وأعضاء هيئة التدريس."

في جامعة غانا، أشار الأستاذ المشارك إسحاق ويافي إلى حجم المشاركة العامة: 

"بالنسبة لنا في جامعة غانا، يتجاوز تأثير WAXAL البيانات نفسها. لقد مكننا من بناء موارد لغوية خاصة بنا وتدريب جيل جديد من باحثي الذكاء الاصطناعي. انضم إلينا أكثر من 7,000 متطوع لأنهم أرادوا أن تنتمي أصواتهم ولغاتهم إلى المستقبل الرقمي. اليوم، أشعل هذا الجهد الجماعي نظاماً بيئياً للابتكار في مجالات مثل الصحة والتعليم والزراعة. هذا يثبت أنه عندما توجد البيانات، تتوسع الإمكانيات في كل مكان."

هناك سبب للتفاؤل الحذر. يمكن لمجموعات بيانات الكلام المفتوحة أن تخفض الحواجز أمام الشركات الناشئة المحلية والباحثين الذين يفتقرون إلى الموارد لجمع البيانات على نطاق واسع. يمكنها أيضاً تقليل الاعتماد على واجهات برمجة التطبيقات الأجنبية التي نادراً ما تدعم اللغات الأفريقية بشكل جيد، إن وجدت.

Google and African universities launch the WAXAL dataset to train AI in 21 African languages, including Yoruba, Hausa and Igboمجموعة بيانات WAXAL

ومع ذلك، لا تضمن مجموعات البيانات النتائج؛ يتطلب بناء أنظمة صوتية موثوقة استثماراً مستداماً ونشراً محلياً ومسارات تجارية تحافظ على القيمة داخل البلد. سيدعو دور Google كممول ومنسق إلى التدقيق، خاصة حول كيفية استخدام بيانات WAXAL من قبل الشركات العالمية في المستقبل.

في الوقت الحالي، يمثل إصدار مجموعة بيانات WAXAL خطوة ملموسة نحو نظام ذكاء اصطناعي أكثر شمولاً لغوياً. إنه لا يحل تحديات الذكاء الاصطناعي في أفريقيا، لكنه يعالج تحدياً أساسياً. غالباً ما يكون الصوت هو الواجهة الأكثر طبيعية مع التكنولوجيا. التأكد من أن الذكاء الاصطناعي يمكنه سماع أفريقيا تتحدث، بكل تنوعها، قد فات أوانه منذ فترة طويلة.

ظهر المنشور Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo لأول مرة على Technext.

إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني service@support.mexc.com لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.

قد يعجبك أيضاً

SOL وSHIB تضغطان على المكابح بينما ZKP Crypto تغمر السوق بـ 190 مليون توكن يومياً: أفضل عملة مشفرة للشراء أصبحت مثيرة للاهتمام

SOL وSHIB تضغطان على المكابح بينما ZKP Crypto تغمر السوق بـ 190 مليون توكن يومياً: أفضل عملة مشفرة للشراء أصبحت مثيرة للاهتمام

تعرف على سبب توقف SOL وSHIB عند العتبات الحرجة، بينما يغير إصدار ZKP لـ 190 مليون توكن يوميًا، وإطار مزاد البيع المسبق، ومجموعة الجوائز بقيمة 5 ملايين دولار كيفية تقييم المتداولين
مشاركة
Blockchainreporter2026/02/03 00:00
تزايد اهتمام منصات التداول بـ Ozak AI يثير تكهنات بإدراجات كبرى قد تؤدي لتسارع سعري بمقدار 500 ضعف

تزايد اهتمام منصات التداول بـ Ozak AI يثير تكهنات بإدراجات كبرى قد تؤدي لتسارع سعري بمقدار 500 ضعف

يتم الترويج بشكل متزايد لـ Ozak AI ($OZ) كواحد من أكثر مشاريع العملات المشفرة الواعدة من الجيل التالي، نظرًا لتجدد الاهتمام بالتوكن بين منصات التداول. Suiting
مشاركة
LiveBitcoinNews2026/02/02 23:04
البنك المركزي يحذر: باقات النقود في عيد الحب قد تُوقع الكينيين في مشاكل قانونية

البنك المركزي يحذر: باقات النقود في عيد الحب قد تُوقع الكينيين في مشاكل قانونية

في حين أن الجهة التنظيمية قالت إنها لا تعترض على تقديم النقد كهدية، إلا أنها شددت على أن هذا الاستخدام يجب ألا يتضمن أي إجراء يغير أو يشوه الأوراق النقدية
مشاركة
Techcabal2026/02/02 23:56