Rambler's Top100
Все новости Новости компаний

Язык до «Яндекса» доведет

17 марта 2011

Вчера «Яндекс» запустил сервис Яндекс.Перевод, основанный на собственной системе машинного перевода. Теперь на сайте translate.yandex.ru все желающие смогут быстро перевести любой текст или веб-страницу.

На данный момент сервис проходит бета-тестирование. В настоящее время доступны три языка – английский, русский и украинский. Переводить можно с английского и украинского на русский и обратно. В дальнейшемразработчики обещают добавлять и другие языковые пары.

Система машинного перевода Яндекса основана на статистике. Она анализирует миллионы текстов — переводов друг друга на разные языки — и создаёт специальные словари. Чтобы «выучить» язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках. Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов — чаще всего такие адреса различается только пометками, например, «en» или «us» для английской версии и «ru» для русской.

Для каждого изученного текста система строит список уникальных признаков. Это могут быть редко используемые слова, числа, специальные знаки, находящиеся в тексте в определённой последовательности. Когда система набирает достаточное количество текстов с признаками, она начинает искать параллельные тексты ещё и с их помощью — сравнивая признаки новых текстов и уже изученных.

Чтобы переводчик соответствовал современным стандартам качества, система должна изучить сотни миллионов фраз на разных языках. Это требует очень серьёзных ресурсов: много места на жёстких дисках, много оперативной памяти и так далее. Именно поэтому существующие сейчас системы машинных переводов можно пересчитать по пальцам.

При переводе система выбирает из словарей наиболее вероятные варианты, учитывая контекст.

В компании отмечают, что одно из достоинств статистического машинного перевода в том, что он живет вместе с языком. То есть, если что-то в языке меняется, например, люди начинают писать какое-нибудь слово по-другому, система видит это, как только к ней попадают новые тексты. И чем быстрее нововведение распространится в языке, тем быстрее оно появится в моделях перевода и языка.

«Статистический машинный перевод, конечно, нельзя сравнивать с литературным, сделанным профессиональным переводчиком, — говорит Алексей Байтин, руководитель сервиса Яндекс.Перевод. — Но часто бывает, что пользователю нужно просто понять основной смысл текста — например, он хочет почитать отзывы о зарубежных отелях или новости в иностранных СМИ. Онлайн-переводчик легко поможет это сделать. К тому же на перевод он потратит всего несколько секунд».

Напомним, что «Яндекс» предлагает услуги онлайн-перевода уже с 2009 года. Однако до недавнего времени  эта система работала на технологиях компании PROMT, а не на собственных технологиях «Яндекса».

По материалам компании «Яндекс»

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!
Поделиться:

Оставить свой комментарий:

Для комментирования необходимо авторизоваться!

Комментарии по материалу

Данный материал еще не комментировался.