Для миллионов людей цифровой мир по-прежнему начинается с незаметного перевода. Дома они говорят на одном языке, думают на нём, играют на нём, а затем переключаются на другой, чтобы искать, печатать, учиться или использовать повседневные приложения без затруднений. Это не потому, что людям не хватает многоязычных способностей, а потому, что многие цифровые системы до сих пор не встречают пользователей там, где они находятся, — на их родном языке.
Международный день родного языка, отмечаемый ЮНЕСКО 21 февраля, напоминает, что язык — это больше, чем общение. Это идентичность, принадлежность и культурная преемственность. По мере того как образование, услуги и работа переходят на экраны, доступ на родном языке становится практической мерой инклюзивности.
Разрыв проявляется в повседневных технологиях: предиктивный текст, который не работает за пределами «глобальных» языков, голосовой ввод, который спотыкается на местных акцентах, перевод, который теряет смысл, и распознавание текста, которое не может прочитать местные шрифты. Эти трения кажутся незначительными, пока вы не увидите, как они формируют то, кто легко участвует в онлайн-пространстве, а кто должен постоянно адаптироваться.
Интернет никогда не был лингвистически нейтральным. Цифровые экосистемы выросли вокруг горстки языков, которые доминируют в контенте, программном обеспечении и всё чаще в обучающих данных ИИ. Языки с большим цифровым присутствием имеют преимущество; многие африканские и азиатские языки остаются недостаточно представленными в данных, которые питают популярные приложения.
Дисбаланс становится самоусиливающимся. Плохая поддержка означает, что меньше людей используют язык в цифровом формате, меньшее использование производит меньше данных, а меньше данных сохраняет инструменты слабыми. Со временем это формирует не только технологии, но и образование, экономическое участие и сохранение культуры.
ЮНЕСКО последовательно связывает многоязычное образование с более высокими результатами обучения, особенно в ранние годы, потому что дети лучше всего учатся, когда понимают язык обучения. Тем не менее многие учащиеся сталкиваются с цифровым контентом на языках, которые не отражают язык дома, что формирует понимание и уверенность.
ИИ сейчас находится на перепутье. Следующая фаза цифрового роста формируется голосовыми интерфейсами, переводом в реальном времени и обучением на основе ИИ. Если эти системы будут хорошо работать только для «богатых данными» языков, языковой разрыв будет расширяться. Однако ИИ также может помочь его закрыть, если лингвистическое разнообразие будет рассматриваться как часть цифровой инклюзивности, а не как дополнительная функция. Huawei позиционирует это как проблему экосистемы, потому что доступ к языку определяет, кто может уверенно участвовать в цифровой жизни, сформированной ИИ. На практике это означает проектирование многоязычного участия как ожидание по умолчанию, а не специальный проект.
Прогресс реален, но неравномерен. Многоязычные возможности всё более очевидны в повседневных задачах, таких как набор текста, поиск, перевод сообщений и чтение текста, захваченного на изображениях. Этот сдвиг сигнализирует о чём-то большем, чем удобство, — родные языки становятся пригодными для использования в тех же цифровых пространствах, где всё чаще происходит участие. Вопрос в том, распространяется ли этот прогресс за пределы «больших» языков и рассматриваются ли языки с недостаточными ресурсами как часть цифровой инфраструктуры, а не как дополнение.
Ванашри Говендер, старший PR-менеджер по медиа и коммуникациям, Huawei Южная Африка
Сделать языки цифровыми требует большего, чем добрая воля. Это требует наборов данных, которые отражают то, как люди на самом деле говорят и пишут с учётом акцентов, диалектов и контекстов. Это требует основ, таких как шрифты, клавиатуры, распознавание речи, перевод и распознавание текста, которые могут справиться с реальным лингвистическим разнообразием. И это требует координации: университеты, государственные учреждения, языковые сообщества, разработчики и платформы работают над общими ресурсами и общим прогрессом.
Существует также измерение доверия. Языковые данные несут культурное значение и знания сообщества. Построение более сильной языковой поддержки должно осуществляться ответственно, с осторожностью в отношении конфиденциальности, согласия, представительства и владения.
Вот почему языковая инклюзивность не может находиться на периферии. По мере того как правительства оцифровывают услуги, школы внедряют смешанное обучение, а малые предприятия полагаются на цифровые платформы, язык становится шлюзом к участию. Если родитель не может понять школьное сообщение, потому что оно приходит на незнакомом языке, или предприниматель не может ориентироваться на платформе на языке, который он знает лучше всего, инклюзивность остаётся неполной.
В Huawei мы рассматриваем это как приоритет экосистемы — вопрос о том, для кого создаются цифровые услуги и какие языки признаются по умолчанию. Когда вашего языка нет в Интернете, доступ к обучению, услугам и возможностям ограничен. Нам нужны цифровые экосистемы, которые признают больше людей на языках, на которых они живут. Это не решение об одном продукте. Это долгосрочное направление, которое охватывает технологические решения, инвестиции, партнёрства и наращивание потенциала.
Международный день родного языка — это приглашение рассматривать лингвистическое разнообразие как часть технического задания для цифрового будущего. Цель не в том, чтобы относиться к каждому языку одинаково; это обеспечить, чтобы каждое сообщество могло полностью участвовать в цифровой жизни, не обменивая идентичность на доступ.
Следующее десятилетие ИИ решит, станет ли цифровой мир более инклюзивным по умолчанию или более эксклюзивным по дизайну. Если мы хотим цифровую экономику, которая работает для всех, доступ на родном языке должен быть частью плана — в политике, образовании, инвестициях в платформы и партнёрствах, которые помогают большему количеству языков стать видимыми, функциональными и ценными в Интернете.


