Google додасть 110 нових мов до свого перекладача, зокрема кримськотатарську
Google анонсував значне розширення свого перекладача, додавши підтримку 110 нових мов, включаючи кримськотатарську та ромську. Це стане найбільшим розширенням Google-перекладача за весь час його існування.
Про це повідомляє пресслужба Google.
Так, для розширення різноманітності мов сервіс використовує штучний інтелект. Додавання нових мов стало можливим завдяки великій мовній моделі PaLM 2. Зокрема, в Google-перекладачі будуть підтримуватися:
- Афар: Тональна мова, якою розмовляють у Джибуті, Еритреї та Ефіопії.
- Кантонська мова: Одна з найбільш запитуваних мов для Google-перекладача.
- Кримськотатарська мова: Тюркська мова кримських татар, яка потребує додаткового захисту за класифікацією UNESCO.
- Менська мова: Кельтська мова острова Мен.
- Нко: Стандартизована форма західноафриканських мов мандінка, що об’єднує багато діалектів.
- Панджабі (Шахмукхі): Різновид панджабі, який пишеться персько-арабським письмом (шахмукхі) і є найпоширенішою мовою в Пакистані.
- Тамазігська мова (амазігська): Берберська мова, якою розмовляють у Північній Африці.
- Ток-пісін: Креольська мова на основі англійської, яка є мовою міжнаціонального спілкування в Папуа-Новій Гвінеї.
“На мовах від кантонської до кекчі розмовляють понад 614 мільйонів носіїв, що відкриває доступ до перекладу для близько 8% населення світу. Деякі з цих мов є одними з найбільших світових мов з більш ніж 100 мільйонами носіїв. Іншими мовами розмовляють невеликі громади корінних народів, а деякі майже не мають носіїв мови, але наразі тривають активні зусилля щодо їхнього відродження. Близько чверті нових мов походять з Африки, що є нашим найбільшим розширенням африканських мов наразі”, – йдеться у повідомленні.
Тож Google продовжує розширювати мовні можливості свого перекладача, роблячи його доступнішим для користувачів по всьому світу.
Нагадаємо, що минулого року український стартап Respeecher ініціював проєкт, щоб прискорити появу кримськотатарської мови у багатьох звичних сервісах: помічниках у телефонах, чатботах та автоматичних перекладачах. Його команда тренує нейромережу для розпізнавання кримськотатарської мови та збирає для цього 1 тисячу голосів її носіїв.