День родного языка: как кыргызский язык внедрялся в Google Translate

Вчера, 21 февраля, отмечался Международный день родного языка, провозглашенный Генеральной конференцией ЮНЕСКО 17 ноября 1999 года, с целью содействия языковому и культурному разнообразию и многоязычию. 12 лет назад Фонд "Сорос-Кыргызстан" поддержал проект "Мы хотим кыргызский язык в Google Translate" общественного фонда "Кыргызское интернет-сообщество" [ISOC]. С тех пор была проделана большая работа по внедрению кыргызского языка в Google Translate. Об этом сообщают авторы проекта.

По их данным, в 2011 году группа энтузиастов вела активную дискуссию по поводу того, как развить кыргызский язык как в интернете, так и в повседневном использовании в группе на Фейсбуке, которую назвали We want Kyrgyz language in Google Translate ("Мы хотим Кыргызский язык в Google Translate"). На тот момент Google Translate поддерживал всего 64 языка, языков среди стран Центральноазиатского региона не было. Для того чтобы кыргызский язык попал в этот сервис, тогда необходимо было предоставить компании Google более 1 000 000 кыргызских слов в предложениях с аналогичным переводом на английском языке для статистического машинного перевода - принципа работы Google Translate, который строится на подборе фрагментов текста из сотен миллионов документов. Проект получил поддержку также от посольства США, оператора сотовой связи Билайн, аппарата президента Кыргызской Республики, Национального центра информационных технологий, Национальной комиссии по государственному языку.

В 2012 году собранная база данных готовых переводов была предоставлена компании Google на рассмотрение. В базу было загружено 1 054 596 слов, которые были полностью проверены и утверждены старшими переводчиками. Тем не менее колоссальная и скрупулезная работа энтузиастов и переводчиков не была принята из-за изменения технологического подхода корпорации к включению новых языков. В результате увеличения таких запросов от других стран была создана платформа сообщества Google Translate, предлагающая фразы для перевода, а переводчики-волонтеры в странах должны были обеспечить их перевод. "Вся наработанная до этого база перевода оказалась не нужна", - сказала Лира Самыкбаева, бывшая директор информационной программы Фонда "Сорос-Кыргызстан". "Однако к тому времени движение добровольных переводчиков в Кыргызстане достаточно сильно развилось, что позволило быстрыми темпами реализовать поставленные задачи по переводу 800 тысяч пар фраз," - добавила она.

В 2016 году в Google Translate наконец появился кыргызский язык. Директор общественного фонда "Биздин мурас" Чоробек Сааданбеков рассказал, что в Кыргызстане около 700 волонтеров перевели примерно около 4 миллионов слов. При этом студенты Кыргызско-Турецкого университета "Манас" перевели больше половины всей работы. Он также отметил вклад Тилека Мамутова, который в то время работал в подразделении компании Google.

В 2022 году на круглом столе "Системы и технологии искусственного интеллекта: риски, возможности и подходы к регулированию в Кыргызстане" директор ОФ "Гражданская инициатива интернет-политики" Татту Мамбеталиева сообщила, что улучшение переводческих функций Google зависит от активности самих кыргызстанцев, которые пишут максимальное количество замечаний. В сервисе есть специальное окошко, куда можно написать, что-то или иное выражение неправильно перевели. Благодаря этому с каждым разом система улучшается.


Сообщи свою новость:     Telegram    Whatsapp



НАВЕРХ  
НАЗАД