গুগল এবং আফ্রিকান গবেষণা প্রতিষ্ঠানগুলোর একটি কনসোর্টিয়াম WAXAL ডেটাসেট চালু করেছে, যা মহাদেশে কৃত্রিম বুদ্ধিমত্তার (AI) একটি বড় চ্যালেঞ্জ সমাধানের জন্য একটি প্রধান নতুন প্রচেষ্টা, যা বেশিরভাগ আফ্রিকান ভাষা ব্যাখ্যা এবং বুঝতে অক্ষমতা।
এই প্রকল্পটি ২১টি উপ-সাহারান আফ্রিকান ভাষা জুড়ে একটি বৃহৎ, উন্মুক্ত স্পিচ ডেটাসেট সরবরাহ করে এবং AI অর্থনীতি থেকে বাদ পড়া ১০০ মিলিয়নেরও বেশি মানুষের কাছে ভয়েস প্রযুক্তি নিয়ে আসে।
WAXAL ডেটাসেট গুগল দ্বারা অর্থায়িত এবং স্থানীয় বিশ্ববিদ্যালয় ও কমিউনিটি গ্রুপগুলোর নেতৃত্বে তিন বছরের সহযোগিতার ফল।
এতে ১,২৫০ ঘণ্টার ট্রান্সক্রাইবড, স্বাভাবিক স্পিচ এবং ২০ ঘণ্টারও বেশি স্টুডিও-গ্রেড রেকর্ডিং রয়েছে যার লক্ষ্য উচ্চ-মানের সিন্থেটিক ভয়েস তৈরি করা। এটি হাউসা, ইওরুবা, লুগান্ডা, ইগবো এবং অ্যাচোলির মতো ভাষাগুলোকে লক্ষ্য করে, যার মধ্যে অনেকগুলো লক্ষ লক্ষ মানুষ দ্বারা কথিত কিন্তু বাণিজ্যিক স্পিচ সিস্টেমে অনেকাংশে অদৃশ্য রয়ে গেছে।
বৈশ্বিক AI নিয়ে সমস্ত আলোচনার জন্য, ভয়েস প্রযুক্তিগুলো এখনও ইংরেজি এবং ইউরোপীয় এবং এশিয়ান ভাষাগুলোর একটি সংকীর্ণ মুঠোর দিকে ব্যাপকভাবে ঝুঁকে আছে। আফ্রিকা, যেখানে ২,০০০-এর বেশি ভাষা রয়েছে, তা প্রান্তে রেখে দেওয়া হয়েছে।
এই ব্যবধানটি একাডেমিক নয়; এটি নির্ধারণ করে কে ডিজিটাল সেবা ব্যবহার করতে পারে, কে শিক্ষা এবং স্বাস্থ্যসেবা সরঞ্জাম অ্যাক্সেস করতে পারে, এবং কে আধুনিক AI প্ল্যাটফর্মের উপরে কোম্পানি তৈরি করতে পারে। গুগল এই কাজটিকে দীর্ঘস্থায়ী ডেটা ব্যবধান সংকুচিত করার দিকে একটি পদক্ষেপ হিসাবে উল্লেখ করেছে যা অনেক আফ্রিকান ভাষাকে ভয়েস অ্যাসিস্ট্যান্ট এবং অন্যান্য সরঞ্জাম থেকে দূরে রেখেছে।
এই ভারসাম্যহীনতা সরাসরি সমাধান করার বাইরেও, প্রকল্পটি ডেটার মতোই গুরুত্বপূর্ণ।
পূর্ববর্তী উদ্যোগগুলোর বিপরীতে যেখানে আফ্রিকান স্পিচ ডেটা নিষ্কাশিত এবং অন্যত্র মালিকানাধীন ছিল, WAXAL স্থানীয়ভাবে আফ্রিকান প্রতিষ্ঠানগুলো দ্বারা পরিচালিত হয়েছিল। উগান্ডার মাকেরেরে বিশ্ববিদ্যালয়, ঘানা বিশ্ববিদ্যালয়, এবং রুয়ান্ডার ডিজিটাল উমুগান্ডা গুগল রিসার্চ আফ্রিকার প্রযুক্তিগত সহায়তায় ডেটা সংগ্রহ, কমিউনিটি সম্পৃক্ততা এবং ভাষা তত্ত্বাবধান করেছে।
গুরুত্বপূর্ণভাবে, সেই প্রতিষ্ঠানগুলো ডেটার মালিকানা ধরে রাখে। এটি একটি উল্লেখযোগ্য পরিবর্তন যে ক্ষেত্রে প্রায়ই খোলামেলা ব্যানারের অধীনে নিষ্কাশনমূলক গতিশীলতা পুনরুত্পাদনের জন্য সমালোচিত হয়।
গুগল রিসার্চ আফ্রিকার প্রধান আইশা ওয়ালকট-ব্রায়ান্টের মতে, "WAXAL-এর চূড়ান্ত প্রভাব হল আফ্রিকার মানুষের ক্ষমতায়ন। এই ডেটাসেট শিক্ষার্থী, গবেষক এবং উদ্যোক্তাদের তাদের নিজস্ব শর্তে, তাদের নিজস্ব ভাষায় প্রযুক্তি তৈরি করার জন্য গুরুত্বপূর্ণ ভিত্তি প্রদান করে, অবশেষে ১০০ মিলিয়নেরও বেশি মানুষের কাছে পৌঁছায়।"
"আমরা আফ্রিকান উদ্ভাবকদের এই ডেটা ব্যবহার করে নতুন শিক্ষামূলক সরঞ্জাম থেকে ভয়েস-সক্ষম সেবা পর্যন্ত সবকিছু তৈরি করতে দেখার জন্য উন্মুখ যা মহাদেশ জুড়ে বাস্তব অর্থনৈতিক সুযোগ সৃষ্টি করে", তিনি যোগ করেছেন।
আইশা ওয়ালকট-ব্রায়ান্ট, গুগল রিসার্চ আফ্রিকার প্রধান
এই ফ্রেমিং জড়িত বিশ্ববিদ্যালয়গুলো দ্বারা প্রতিধ্বনিত হয়। মাকেরেরে বিশ্ববিদ্যালয়ের একজন সিনিয়র প্রভাষক জয়েস নাকাতুম্বা-নাবেন্দে বলেছেন:
"আফ্রিকায় AI-এর প্রকৃত প্রভাব থাকার জন্য, এটি অবশ্যই আমাদের ভাষা বলতে এবং আমাদের প্রসঙ্গ বুঝতে হবে। WAXAL ডেটাসেট আমাদের গবেষকদের উচ্চ-মানের ডেটা দেয় যা তাদের আমাদের অনন্য কমিউনিটিগুলো প্রতিফলিত করে এমন স্পিচ প্রযুক্তি তৈরি করতে প্রয়োজন। উগান্ডায়, এটি ইতিমধ্যে আমাদের স্থানীয় গবেষণা সক্ষমতা শক্তিশালী করেছে এবং নতুন শিক্ষার্থী- এবং অনুষদ-নেতৃত্বাধীন প্রকল্পগুলোকে সমর্থন করেছে।"
ঘানা বিশ্ববিদ্যালয়ে, সহযোগী অধ্যাপক আইজ্যাক উইয়াফে জনসাধারণের সম্পৃক্ততার মাপকাঠি নির্দেশ করেছেন:
"ঘানা বিশ্ববিদ্যালয়ে আমাদের জন্য, WAXAL-এর প্রভাব ডেটার বাইরে যায়। এটি আমাদের আমাদের নিজস্ব ভাষা সংস্থান তৈরি করতে এবং AI গবেষকদের একটি নতুন প্রজন্মকে প্রশিক্ষণ দিতে ক্ষমতায়িত করেছে। ৭,০০০-এর বেশি স্বেচ্ছাসেবক আমাদের সাথে যোগ দিয়েছেন কারণ তারা চেয়েছিল তাদের কণ্ঠস্বর এবং ভাষা ডিজিটাল ভবিষ্যতে অন্তর্ভুক্ত হোক। আজ, সেই যৌথ প্রচেষ্টা স্বাস্থ্য, শিক্ষা এবং কৃষির মতো ক্ষেত্রে উদ্ভাবনের একটি ইকোসিস্টেম সৃষ্টি করেছে। এটি প্রমাণ করে যে যখন ডেটা বিদ্যমান থাকে, সম্ভাবনা সর্বত্র প্রসারিত হয়।"
সতর্ক আশাবাদের কারণ রয়েছে। উন্মুক্ত স্পিচ ডেটাসেটগুলো স্থানীয় স্টার্টআপ এবং গবেষকদের জন্য বাধা কমাতে পারে যাদের বড় আকারে ডেটা সংগ্রহের সংস্থান নেই। তারা বিদেশী API-এর উপর নির্ভরতাও কমাতে পারে যা খুব কমই আফ্রিকান ভাষাগুলোকে ভালভাবে সমর্থন করে, যদি একেবারে করে।
WAXAL ডেটাসেট
তবুও, ডেটাসেটগুলো ফলাফলের গ্যারান্টি দেয় না; নির্ভরযোগ্য ভয়েস সিস্টেম তৈরির জন্য টেকসই বিনিয়োগ, স্থানীয় স্থাপনা এবং বাণিজ্যিক পথ প্রয়োজন যা দেশে মূল্য রাখে। গুগলের অর্থায়নকারী এবং আহ্বায়ক হিসাবে ভূমিকা পরীক্ষার আমন্ত্রণ জানাবে, বিশেষত ভবিষ্যতে বৈশ্বিক কোম্পানিগুলো দ্বারা WAXAL ডেটা কীভাবে ব্যবহার করা হয় তার চারপাশে।
আপাতত, WAXAL ডেটাসেটের মুক্তি আরও ভাষাগতভাবে অন্তর্ভুক্তিমূলক AI ইকোসিস্টেমের দিকে একটি কংক্রিট পদক্ষেপ চিহ্নিত করে। এটি আফ্রিকার AI চ্যালেঞ্জগুলো সমাধান করে না, তবে এটি একটি মৌলিক সমাধান করে। ভয়েস প্রায়ই প্রযুক্তির সাথে সবচেয়ে স্বাভাবিক ইন্টারফেস। AI যে আফ্রিকাকে তার সমস্ত বৈচিত্র্যে কথা বলতে শুনতে পারে তা নিশ্চিত করা দীর্ঘকাল বিলম্বিত।
পোস্ট ইওরুবা, হাউসা এবং ইগবো সহ ২১টি আফ্রিকান ভাষায় AI প্রশিক্ষণের জন্য গুগল প্রথম Technext-এ প্রকাশিত হয়েছে।


