Intron สตาร์ทอัพด้าน AI ในลากอสได้เปิดตัว Sahara-v2 อย่างเป็นทางการ ซึ่งเป็นโมเดล AI เสียงรุ่นที่สองอันเป็นเรือธงของบริษัท ยกระดับมาตรฐานการรู้จำเสียงพูดระดับโลกอย่างมีประสิทธิภาพ โมเดลนี้รองรับภาษาแอฟริกันใหม่ 24 ภาษาและเชี่ยวชาญสำเนียงภาษาอังกฤษแอฟริกันที่แตกต่างกันกว่า 500 สำเนียง ทำให้การครอบคลุมภาษาทั้งหมดของบริษัทเพิ่มขึ้นเป็น 57 ภาษาอย่างไม่เคยมีมาก่อน
เป็นเวลาหลายปีที่การโต้ตอบกับผู้ช่วยเสียงระดับโลกอย่าง Siri, Alexa หรือเครื่องมือแปลงข้อความเป็นเสียงมาตรฐานให้ความรู้สึกเหมือนกำลังพูดกับกำแพงที่ไม่เข้าใจภาษาของคุณโดยพื้นฐาน เราทุกคนเคยมีประสบการณ์นี้ พยายามใช้คำสั่งเสียงแต่กลับมีวลีท้องถิ่นอย่าง "No worry, e go better" ถูกถอดเสียงเป็น "No war eagle butter" ที่ไร้สาระ มันตลกในตอนแรก แต่เมื่อ "Wanjiru" ถูกแปลงเป็นดิจิทัลเป็น "One zero" และ "Chukwuebuka" กลายเป็น "Check wheelchair baker" อย่างไม่มีเหตุผล มุกตลกก็จางหายไปอย่างรวดเร็ว
ความล้มเหลวในการถอดเสียงซ้ำๆ เหล่านี้มีมากกว่าแค่ข้อผิดพลาดทางเทคนิค มันคือรูปแบบหนึ่งของการกีดกันทางดิจิทัลอย่างแท้จริง โมเดล AI ชั้นนำระดับโลกที่สร้างขึ้นจากชุดข้อมูลตะวันตกเป็นหลักไม่สามารถตอบโจทย์ได้เลย พวกมันไม่ได้ถูกออกแบบมาสำหรับความหลากหลายของเสียงในการพูดของเรา ที่คำเดียวสามารถมีความหมายได้หกแบบต่างกันขึ้นอยู่กับการออกเสียง พวกมันสะดุดกับการสลับรหัสภาษาตามจังหวะธรรมชาติของเราและไม่สามารถเข้าใจได้ว่าสำนักงานเดียวอาจมีพนักงานที่มีสำเนียงต่างกันสิบแบบ เมื่อผู้ช่วยเสียงเข้าใจผิดคำและชื่อพื้นฐาน พวกมันก็ขัดขวางผู้ใช้หลายล้านคนจากทางลัดดิจิทัลที่ทำให้ชีวิตสมัยใหม่ง่ายขึ้น
Intron
Sahara-v2 เชื่อมช่องว่างสำคัญนี้เพราะมันไม่ได้สร้างขึ้นจากสมมติฐานหรือฝึกในสตูดิโอเงียบที่ปราศจากเชื้อโรค Intron สร้างโมเดลนี้โดยออกไปตามท้องถนนและฟัง ชุดข้อมูลมีขนาดใหญ่และเป็นท้องถิ่นอย่างมาก: คลิปเสียงกว่า 14 ล้านคลิป รวมเวลาการพูดมากกว่า 50,000 ชั่วโมง จากผู้พูดกว่า 40,000 คน เสียงเหล่านี้เป็นตัวแทนของภาษาแอฟริกันและกลุ่มชนต่างถิ่น 64 ภาษาจากกว่า 30 ประเทศ สิ่งสำคัญคือพวกมันถูกบันทึกในที่ที่ AI จำเป็นต้องทำงานจริง ในคลินิกที่แออัด ตลาดที่มีเสียงดัง ศูนย์บริการลูกค้าที่พลุกพล่าน และห้องพิจารณาคดี
แนวทางจากพื้นฐานในโลกแห่งความจริงนี้ทำให้ Sahara-v2 สามารถแซงหน้าชื่อใหญ่ที่สุดในเทคโนโลยีระดับโลกได้ เมื่อเปรียบเทียบกับยักษ์ใหญ่ในอุตสาหกรรมอย่าง Gemini-3, GPT-4, Whisper, ElevenLabs, AWS และ Azure โมเดลของ Intron นำคะแนนอย่างเด่นชัด
มีอัตราความแม่นยำที่ดีกว่า 68.6% ในชื่อ องค์กร และสถานที่แอฟริกัน และคมชัดกว่า 55.6% ในการถอดเสียงตัวเลข เศษส่วน และสกุลเงิน นอกจากนี้ยังมีความต้านทานที่มากกว่า 36.5% ต่อภาพหลอนของ AI ที่เกิดจากเสียงรบกวนพื้นหลังและผู้พูดที่ทับซ้อนกัน พร้อมกับประสิทธิภาพที่เพิ่มขึ้น 46.7% ในสาขาเฉพาะทางอย่างการดูแลสุขภาพ กฎหมาย โทรคมนาคม และการเงิน
นอกเหนือจากเกณฑ์มาตรฐานที่น่าประทับใจ Sahara-v2 เป็นเครื่องมือเพิ่มผลผลิตที่จริงจังที่ออกแบบมาสำหรับการใช้งานองค์กรในโลกแห่งความจริง สนับสนุนด้วย API ที่แข็งแกร่งที่สามารถติดตั้งได้ในเวลาเพียงห้านาที โครงสร้างพื้นฐานกำลังขับเคลื่อนธนาคารเสียง กระบวนการ KYC อัตโนมัติ และระบบกรอกข้อมูลอัตโนมัติสำหรับทุกอย่างตั้งแต่ข้อมูลสุขภาพไปจนถึงแบบฟอร์มเปิดบัญชีอย่างกระตือรือร้น ผู้ใช้องค์กรในช่วงแรกรายงานว่าเทคโนโลยีนี้ลดเวลาประมวลผลด้านการบริหารลงได้ถึง 4.4 เท่า
เพื่อตอบสนองต่อความเป็นจริงทางภาษาที่เป็นเอกลักษณ์ของทวีป Intron ได้เปิดตัวคุณสมบัติระดับภูมิภาคที่เฉพาะเจาะจงอย่างมาก ร่วมมือกับ Penda Health ของเคนยา พวกเขาแนะนำโมเดลการรู้จำเสียงพูดอัตโนมัติ (ASR) สองภาษาสวาฮิลี-อังกฤษเป็นครั้งแรกของโลก จับภาพได้อย่างสมบูรณ์แบบว่าผู้คนสลับภาษาอย่างเป็นธรรมชาติกลางประโยคอย่างไร
สำหรับตลาดที่นี่ พวกเขาได้เปิดตัวโมเดลแปลงข้อความเป็นเสียง (TTS) ภาษาเฮาซาเนทีฟ ทำให้สามารถใช้บอทเสียงแบบเวลาแฝงต่ำตลอด 24/7 และสำหรับรัฐบาลและองค์กรที่กำลังจัดการกับข้อกังวลเรื่องความเป็นส่วนตัวของข้อมูล การเปิดตัว Sahara-v2 รวมถึงการสนับสนุนออฟไลน์ใหม่ ที่ช่วยให้ข้อมูลยังคงปลอดภัยและอยู่ในท้องถิ่นเพื่อการปฏิบัติตาม AI อธิปไตย
Sahara-v2 ของ Intron
องค์กรและลูกค้าภาครัฐในหกประเทศกำลังใช้ระบบนี้อยู่แล้ว Ayo Oluleye หัวหน้าฝ่ายข้อมูลและข้อมูลเชิงลึกที่ ARM Investments กล่าวว่า "การใช้โมเดล AI ของ Intron เราเห็นการปรับปรุงอย่างมีนัยสำคัญในการถอดเสียงและสรุปเมื่อเทียบกับโมเดลที่เราสำรวจก่อนหน้านี้ ระบบของพวกเขาจับบริบทและความแตกต่างเล็กน้อยได้ดีกว่า ส่งผลให้ได้ผลลัพธ์ที่แม่นยำมากขึ้น" Sarah Morris, CPO ที่ Audere สะท้อนเช่นนี้ รายงานอัตราความสำเร็จของ API มากกว่า 99% และความแม่นยำที่ยอดเยี่ยมในสำเนียงแอฟริกาใต้
พร้อมกับการเปิดตัว Sahara-v2, Intron ยังเปิดตัวรายงาน Africa Voice AI Report 2026 ฉบับแรก สิ่งพิมพ์นี้นำเสนอมุมมองที่ครอบคลุมและเป็นครั้งแรกของระบบนิเวศ โดยรายละเอียดบทเรียนที่ได้จากการปรับใช้ AI เสียงในสภาพแวดล้อมที่ซับซ้อนเพื่อแนะนำสตาร์ทอัพ นักลงทุน และผู้กำหนดนโยบาย
อ่านเพิ่มเติม: Google ฝึก AI ใน 21 ภาษาแอฟริกัน รวมถึงโยรูบา เฮาซา และอิกโบ
ภาษาใหม่ล่าสุดรวมถึงฝรั่งเศสแอฟริกัน, แอฟริกานส์, อาคัน, อัมฮารา, อาหรับ, เบมบา, ฟูลานี, กา, เฮาซา, อิกโบ, คินยาร์วันดา, ลูกันดา, โอโรโม, เปดี และพิดจิน อื่นๆ ได้แก่ เซโซโท, โชนา, สวาฮิลี, ตสวานา, ทวี, วูลอฟ, คอซา, โยรูบา และซูลู ด้วยการเพิ่มเติมเหล่านี้ ประตูสู่โลกดิจิทัลกำลังเปิดกว้างในที่สุด
ตามที่ CEO ของ Intron คือ Tobi Olatunji กล่าวไว้ว่า "Sahara-v2 พิสูจน์ว่าเมื่อเทคโนโลยีถูกสร้างขึ้นด้วยความเข้าใจทางวัฒนธรรมและภาษาอย่างลึกซึ้ง สิ่งที่น่าอัศจรรย์สามารถเกิดขึ้นได้ และเราเพิ่งเริ่มต้นเท่านั้น"
โพสต์ Intron เปิดตัว Sahara-v2 โมเดล AI เสียงที่รองรับภาษาแอฟริกันใหม่ 24 ภาษา ปรากฏครั้งแรกบน Technext


