Google Переводчик добавляет поддержку 24 новых языков и теперь суммарно поддерживает более 130 языков

Google Переводчик добавляет поддержку 24 новых языков и теперь суммарно поддерживает более 130 языков

На ежегодной конференции Google I/O 2022 в своей вступительной речи Сундар Пичаи анонсировал добавление в Google Переводчик поддержки новых 24 языков. 

Используя достижения машинного обучения и модель Zero-Shot Machine Translation, компания разработала монолингвальный подход, при котором алгоритм учится переводить новый язык, не видя его прямого перевода. Сотрудничая с носителями языка и учреждениями, Google пришла к выводу, что качество этих переводов достаточно высокое, чтобы быть полезными, и компания будем продолжать их совершенствовать.

Two boxes, one showing a question in English — “What’s the weather like today?” — the other showing its translation in Quechua. There is a microphone symbol below the English question and a loudspeaker symbol below the Quechua answer.

С 11 мая Google переводчик можно будет использовать для перевода ряда новых языков на ваш местный диалект, что поможет жителям таких регионов, как Боливия, Чили, Индия, Кения, Эфиопия, Сьерра-Леоне и многих других, получить прямой перевод. Суммарно на этих языках говорят более 300 миллионов человек.

Полный список новых языков приведен ниже. 

  • Ассамский - используется примерно 25 миллионами человек на северо-востоке Индии
  • Аймара - используется примерно 2 миллионами человек в Боливии, Чили и Перу
  • Бамбара - используется примерно 14 миллионами человек в Мали
  • Бходжпури - используется примерно 50 миллионами человек в Северной Индии, Непале и Фиджи
  • Дивехи - используется примерно 300 000 человек на Мальдивах
  • Догри - используется примерно 3 миллионами человек в северной Индии
  • Эве - используется примерно 7 миллионами человек в Гане и Того
  • Гуарани - используется примерно 7 миллионами человек в Парагвае и Боливии, Аргентине и Бразилии
  • Илокано - используется примерно 10 миллионами человек на севере Филиппин
  • Конкани - используется примерно 2 миллионами человек в Центральной Индии
  • Крио - используется примерно 4 миллионами человек в Сьерра-Леоне
  • Курдский (сорани) - используется примерно 8 миллионами человек, в основном в Ираке
  • Лингала - используется примерно 45 миллионами человек в Демократической Республике Конго, Республике Конго,
  • Центральноафриканской Республике, Анголе и Республике Южный Судан.
  • Луганда - используется примерно 20 миллионами человек в Уганде и Руанде
  • Майтхили - используется примерно 34 миллионами человек в северной Индии
  • Мейтейлон (манипури) - используется примерно 2 миллионами человек на северо-востоке Индии
  • Мизо - используется примерно 830 000 человек на северо-востоке Индии
  • Оромо - используется примерно 37 миллионами человек в Эфиопии и Кении
  • Кечуа - используется примерно 10 миллионами человек в Перу, Боливии, Эквадоре и близлежащих странах.
  • Санскрит - используется примерно 20 000 человек в Индии
  • Курдский язык сорани - используется примерно 14 миллионами человек в Южной Африке
  • Тигринья - используется примерно 8 миллионами человек в Эритрее и Эфиопии
  • Тсонга - используется примерно 7 миллионами человек в Эсватини, Мозамбике, Южной Африке и Зимбабве.
  • Тви - используется примерно 11 миллионами человек в Гане