Google và một tập đoàn các tổ chức nghiên cứu châu Phi đã ra mắt bộ dữ liệu WAXAL, một nỗ lực mới lớn để… Bài viết Google đào tạo AI bằng 21 ngôn ngữ châu PhiGoogle và một tập đoàn các tổ chức nghiên cứu châu Phi đã ra mắt bộ dữ liệu WAXAL, một nỗ lực mới lớn để… Bài viết Google đào tạo AI bằng 21 ngôn ngữ châu Phi

Google đào tạo AI trong 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo

2026/02/02 22:00
Đọc trong 6 phút

Google và một tập đoàn các tổ chức nghiên cứu châu Phi đã ra mắt bộ dữ liệu WAXAL, một nỗ lực lớn mới nhằm khắc phục một trong những thách thức chính của trí tuệ nhân tạo (AI) trên lục địa này, đó là khả năng diễn giải và hiểu hầu hết các ngôn ngữ châu Phi.

Dự án cung cấp một bộ dữ liệu giọng nói mở lớn bao gồm 21 ngôn ngữ châu Phi cận Sahara và mang công nghệ giọng nói đến hơn 100 triệu người bị loại trừ khỏi nền kinh tế AI.

Bộ dữ liệu WAXAL là sản phẩm của sự hợp tác ba năm được tài trợ bởi Google và do các trường đại học địa phương cũng như các nhóm cộng đồng dẫn đầu.

Nó bao gồm 1.250 giờ lời nói tự nhiên được phiên âm và hơn 20 giờ ghi âm chất lượng studio nhằm xây dựng các giọng nói tổng hợp có độ trung thực cao. Nó nhắm đến các ngôn ngữ như Hausa, Yoruba, Luganda, Igbo và Acholi, nhiều ngôn ngữ trong số này được hàng chục triệu người nói nhưng vẫn phần lớn vô hình đối với các hệ thống giọng nói thương mại.

Google và các trường đại học châu Phi ra mắt bộ dữ liệu WAXAL để đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo

Bất chấp tất cả những cuộc nói chuyện về AI toàn cầu, các công nghệ giọng nói vẫn nghiêng nhiều về tiếng Anh và một số ít ngôn ngữ châu Âu và châu Á. Châu Phi, nơi có hơn 2.000 ngôn ngữ, đã bị bỏ lại ở lề.

Khoảng cách đó không chỉ mang tính học thuật; nó định hình ai có thể sử dụng các dịch vụ kỹ thuật số, ai có thể tiếp cận các công cụ giáo dục và chăm sóc sức khỏe, và ai có thể xây dựng công ty trên các nền tảng AI hiện đại. Google đóng khung công việc này như một bước tiến hướng tới việc thu hẹp khoảng cách dữ liệu lâu đời đã khiến nhiều ngôn ngữ châu Phi không có mặt trên trợ lý giọng nói và các công cụ khác.

Tại sao bộ dữ liệu WAXAL quan trọng đối với kiến trúc AI của châu Phi

Ngoài việc giải quyết trực tiếp sự mất cân bằng này, dự án còn quan trọng như chính dữ liệu.

Không giống như các sáng kiến trước đó, nơi dữ liệu giọng nói châu Phi được trích xuất và sở hữu ở nơi khác, WAXAL được dẫn dắt tại chỗ bởi các tổ chức châu Phi. Đại học Makerere ở Uganda, Đại học Ghana và Digital Umuganda ở Rwanda giám sát việc thu thập dữ liệu, gắn kết cộng đồng và quản lý ngôn ngữ, với sự hỗ trợ kỹ thuật từ Google Research Africa.

Quan trọng là, các tổ chức đó giữ quyền sở hữu dữ liệu. Đó là một sự thay đổi đáng chú ý trong một lĩnh vực thường bị chỉ trích vì tái tạo động lực khai thác dưới danh nghĩa cởi mở.

Theo Aisha Walcott-Bryant, Trưởng phòng Google Research Africa, "Tác động cuối cùng của WAXAL là trao quyền cho người dân ở châu Phi. Bộ dữ liệu này cung cấp nền tảng quan trọng cho sinh viên, nhà nghiên cứu và doanh nhân để xây dựng công nghệ theo các điều khoản của riêng họ, bằng ngôn ngữ của riêng họ, cuối cùng tiếp cận hơn 100 triệu người."

"Chúng tôi mong muốn nhìn thấy các nhà đổi mới châu Phi sử dụng dữ liệu này để tạo ra mọi thứ từ các công cụ giáo dục mới đến các dịch vụ kích hoạt bằng giọng nói tạo ra cơ hội kinh tế hữu hình trên khắp lục địa", cô nói thêm. 

Google và các trường đại học châu Phi ra mắt bộ dữ liệu WAXAL để đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và IgboAisha Walcott-Bryant, Trưởng phòng Google Research Africa

Khung đó được các trường đại học tham gia lặp lại. Joyce Nakatumba-Nabende, một giảng viên cao cấp tại Đại học Makerere, cho biết:

"Để AI có tác động thực sự ở châu Phi, nó phải nói ngôn ngữ của chúng ta và hiểu bối cảnh của chúng ta. Bộ dữ liệu WAXAL cung cấp cho các nhà nghiên cứu của chúng tôi dữ liệu chất lượng cao mà họ cần để xây dựng các công nghệ giọng nói phản ánh các cộng đồng độc đáo của chúng tôi. Ở Uganda, nó đã tăng cường năng lực nghiên cứu địa phương của chúng tôi và hỗ trợ các dự án mới do sinh viên và giảng viên dẫn đầu."

Tại Đại học Ghana, Phó Giáo sư Isaac Wiafe chỉ ra quy mô tham gia của công chúng: 

"Đối với chúng tôi tại Đại học Ghana, tác động của WAXAL vượt ra ngoài chính dữ liệu. Nó đã trao quyền cho chúng tôi xây dựng tài nguyên ngôn ngữ của riêng mình và đào tạo một thế hệ nhà nghiên cứu AI mới. Hơn 7.000 tình nguyện viên đã tham gia cùng chúng tôi vì họ muốn giọng nói và ngôn ngữ của họ thuộc về tương lai kỹ thuật số. Hôm nay, nỗ lực tập thể đó đã châm ngòi cho một hệ sinh thái đổi mới trong các lĩnh vực như y tế, giáo dục và nông nghiệp. Điều này chứng minh rằng khi dữ liệu tồn tại, khả năng mở rộng ở mọi nơi."

Có lý do cho sự lạc quan thận trọng. Các bộ dữ liệu giọng nói mở có thể giảm rào cản cho các startup địa phương và nhà nghiên cứu thiếu nguồn lực để thu thập dữ liệu ở quy mô lớn. Chúng cũng có thể giảm sự phụ thuộc vào API mới ngoại quốc hiếm khi hỗ trợ tốt các ngôn ngữ châu Phi, nếu có.

Google và các trường đại học châu Phi ra mắt bộ dữ liệu WAXAL để đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và IgboBộ dữ liệu WAXAL

Tuy nhiên, các bộ dữ liệu không đảm bảo kết quả; việc xây dựng các hệ thống giọng nói đáng tin cậy đòi hỏi đầu tư bền vững, triển khai địa phương và các con đường thương mại giữ giá trị trong nước. Vai trò của Google với tư cách là nhà tài trợ và người triệu tập sẽ mời gọi sự giám sát, đặc biệt là xung quanh cách dữ liệu WAXAL được sử dụng bởi các công ty toàn cầu trong tương lai.

Hiện tại, việc phát hành bộ dữ liệu WAXAL đánh dấu một bước tiến cụ thể hướng tới một hệ sinh thái AI toàn diện hơn về mặt ngôn ngữ. Nó không giải quyết các thách thức AI của châu Phi, nhưng nó giải quyết một vấn đề nền tảng. Giọng nói thường là giao diện tự nhiên nhất với công nghệ. Đảm bảo AI có thể nghe châu Phi nói, với tất cả sự đa dạng của nó, đã quá muộn.

Bài đăng Google đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo xuất hiện đầu tiên trên Technext.

Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ service@support.mexc.com để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.

Có thể bạn cũng thích

Jeff Scanlon Thảo luận về Tầm nhìn của PaymentEarth cho Giao dịch Ngoại hối Minh bạch và Hiệu quả Thương mại Toàn cầu

Jeff Scanlon Thảo luận về Tầm nhìn của PaymentEarth cho Giao dịch Ngoại hối Minh bạch và Hiệu quả Thương mại Toàn cầu

Trong một cuộc trò chuyện gần đây với Xraised, Jeff Scanlon, CEO và Chủ tịch của PaymentEarth, thảo luận về cách tiếp cận đổi mới của công ty trong việc chuyển đổi
Chia sẻ
Globalfintechseries2026/02/09 22:02
Báo cáo Crypto buổi sáng: XRP tăng vọt 63,1 triệu USD trên thị trường tăng giá ETF riêng của mình, 23,799,579,141 SHIB: Cá voi Coinbase nắm giữ hàng tỷ Shiba Inu rồi biến mất, Dự đoán thị trường Crypto của người tạo ra Dogecoin trong Super Bowl đã thành hiện thực

Báo cáo Crypto buổi sáng: XRP tăng vọt 63,1 triệu USD trên thị trường tăng giá ETF riêng của mình, 23,799,579,141 SHIB: Cá voi Coinbase nắm giữ hàng tỷ Shiba Inu rồi biến mất, Dự đoán thị trường Crypto của người tạo ra Dogecoin trong Super Bowl đã thành hiện thực

Thứ Hai, 9 tháng 2, 2026: XRP thu hút 63,1 triệu USD vào các quỹ ETF trong khi Bitcoin và Ethereum chứng kiến dòng vốn rút ra, một cá voi liên kết với Coinbase chuyển 23,8 tỷ SHIB ra khỏi sàn giao dịch
Chia sẻ
Coinstats2026/02/09 22:12
ETF Dogecoin Sẽ Đi Vào Hoạt Động Hôm Nay

ETF Dogecoin Sẽ Đi Vào Hoạt Động Hôm Nay

Bài đăng Dogecoin ETF Sẵn sàng Giao Dịch Hôm nay xuất hiện trên BitcoinEthereumNews.com. Altcoin 18 Tháng 9 2025 | 09:35 Thị trường Mỹ sắp chứng kiến một khoảnh khắc đầu tiên trong lịch sử đầu tư tiền điện tử. Bắt đầu từ ngày 18 tháng 9, các nhà đầu tư dự kiến sẽ có thể mua các quỹ giao dịch trao đổi (ETF) liên kết trực tiếp với XRP và Dogecoin, đưa hai tài sản kỹ thuật số được nhận diện rộng rãi nhất vào các Tài khoản trung gian chính thống. Các sản phẩm — REX-Osprey XRP ETF (XRPR) và REX-Osprey Dogecoin ETF (DOJE) — được ra mắt thông qua quan hệ đối tác giữa REX Shares và Osprey Funds. Đây đánh dấu lần đầu tiên tiếp cận spot XRP và spot DOGE sẽ có sẵn dưới hình thức ETF cho các nhà giao dịch Mỹ, một bước đi mà các nhà phân tích mô tả là lịch sử đối với không gian tài sản kỹ thuật số rộng lớn hơn. Các tiếng nói trong ngành nhanh chóng nhấn mạnh tầm quan trọng của việc ra mắt này. Chủ tịch ETF Store Nate Geraci lưu ý rằng việc ra mắt không chỉ giới thiệu ETF Dogecoin đầu tiên mà còn cuối cùng cung cấp quyền tiếp cận spot XRP cho các nhà đầu tư truyền thống. Các nhà phân tích ETF của Bloomberg Eric Balchunas và James Seyffart xác nhận rằng giao dịch sẽ bắt đầu vào ngày 18 tháng 9, sau một sự chậm trễ ngắn so với lịch trình ban đầu. Cả hai ETF đều được đặt dưới một bản cáo bạch duy nhất cũng bao gồm các quỹ dự kiến cho TRUMP và BONK, mặc dù những lần ra mắt đó vẫn chưa nhận được ngày xác nhận. Bằng cách đóng gói các token này trong cấu trúc ETF, các nhà đầu tư sẽ không còn cần phải điều hướng qua các sàn giao dịch tiền điện tử hoặc ví để tiếp cận — thay vào đó, việc tiếp cận sẽ đơn giản như mua cổ phần thông qua Tài khoản trung gian. Sự xuất hiện của các sản phẩm này có thể tạo tiền đề cho làn sóng ETF mới dựa trên altcoin, mở rộng bối cảnh vượt ra ngoài Bitcoin và Ethereum và mở cửa cho việc áp dụng chính thống các token phổ biến khác. Tác giả Alexander Zdravkov là người luôn tìm kiếm logic đằng sau mọi thứ. Anh thông thạo tiếng Đức và có hơn 3 năm kinh nghiệm trong không gian tiền điện tử, nơi anh khéo léo xác định những...
Chia sẻ
BitcoinEthereumNews2025/09/18 14:38