Машинный перевод и автоматический словарь в Яндексе

Много сложных и одновременно интересных технологий входит в каждый большой продукт, над созданием которого работают люди. В браузере Yandex также реализованы многие разработки, которые не могут быть не замеченными. Например, в обозреватель интегрирована одна из облачных технологий Яндекса — собственный переводчик. Всего несколько месяцев назад вышел Яндекс.Перевод, который отличается от других немногочисленных сервисов уникальной технологией. Во время его разработки специалистам удалось объединить статистические подходы машинного перевода и соответственно традиционные лингвистические инструментарии. Стоит вспомнить, что 15-20 лет назад использовались синтаксические переводчики и вручную составлялись таблицы соответствия фраз на разных языках.

Это дает понять, насколько значимый шаг в развитии машинного перевода делает появление автословаря. Только в конце 1990-ых стал меняться процесс создания синтаксических переводчиков. Появились первые статистические переводчики, где стали использовать параллельные тексты. Большой базой таких параллельных текстов стали некоторые документы ООН. Однако у специалистов не получилось создать на подобной лексике общелексический переводчик. Решением проблемы стало использование параллельных документов. Не все предложения в таких текстах последовательны переводами друг друга. Нужно сделать специальное выравнивание, чтобы составить таблицы соответствия слов. В итоге, например, каждому русскому слову соответствовали 20 английских.

Добавить комментарий

Ваш адрес email не будет опубликован.