Google Переводчик добавляет поддержку 24 новых языков и теперь суммарно поддерживает более 130 языков
На ежегодной конференции Google I/O 2022 в своей вступительной речи Сундар Пичаи анонсировал добавление в Google Переводчик поддержки новых 24 языков.
Используя достижения машинного обучения и модель Zero-Shot Machine Translation, компания разработала монолингвальный подход, при котором алгоритм учится переводить новый язык, не видя его прямого перевода. Сотрудничая с носителями языка и учреждениями, Google пришла к выводу, что качество этих переводов достаточно высокое, чтобы быть полезными, и компания будем продолжать их совершенствовать.
С 11 мая Google переводчик можно будет использовать для перевода ряда новых языков на ваш местный диалект, что поможет жителям таких регионов, как Боливия, Чили, Индия, Кения, Эфиопия, Сьерра-Леоне и многих других, получить прямой перевод. Суммарно на этих языках говорят более 300 миллионов человек.
Полный список новых языков приведен ниже.
- Ассамский - используется примерно 25 миллионами человек на северо-востоке Индии
- Аймара - используется примерно 2 миллионами человек в Боливии, Чили и Перу
- Бамбара - используется примерно 14 миллионами человек в Мали
- Бходжпури - используется примерно 50 миллионами человек в Северной Индии, Непале и Фиджи
- Дивехи - используется примерно 300 000 человек на Мальдивах
- Догри - используется примерно 3 миллионами человек в северной Индии
- Эве - используется примерно 7 миллионами человек в Гане и Того
- Гуарани - используется примерно 7 миллионами человек в Парагвае и Боливии, Аргентине и Бразилии
- Илокано - используется примерно 10 миллионами человек на севере Филиппин
- Конкани - используется примерно 2 миллионами человек в Центральной Индии
- Крио - используется примерно 4 миллионами человек в Сьерра-Леоне
- Курдский (сорани) - используется примерно 8 миллионами человек, в основном в Ираке
- Лингала - используется примерно 45 миллионами человек в Демократической Республике Конго, Республике Конго,
- Центральноафриканской Республике, Анголе и Республике Южный Судан.
- Луганда - используется примерно 20 миллионами человек в Уганде и Руанде
- Майтхили - используется примерно 34 миллионами человек в северной Индии
- Мейтейлон (манипури) - используется примерно 2 миллионами человек на северо-востоке Индии
- Мизо - используется примерно 830 000 человек на северо-востоке Индии
- Оромо - используется примерно 37 миллионами человек в Эфиопии и Кении
- Кечуа - используется примерно 10 миллионами человек в Перу, Боливии, Эквадоре и близлежащих странах.
- Санскрит - используется примерно 20 000 человек в Индии
- Курдский язык сорани - используется примерно 14 миллионами человек в Южной Африке
- Тигринья - используется примерно 8 миллионами человек в Эритрее и Эфиопии
- Тсонга - используется примерно 7 миллионами человек в Эсватини, Мозамбике, Южной Африке и Зимбабве.
- Тви - используется примерно 11 миллионами человек в Гане