Рубрикатор |
Все новости | Новости компаний |
Язык до «Яндекса» доведет
17 марта 2011 |
Вчера «Яндекс» запустил сервис Яндекс.Перевод, основанный на собственной системе машинного перевода. Теперь на сайте translate.yandex.ru все желающие смогут быстро перевести любой текст или веб-страницу.
На данный момент сервис проходит бета-тестирование. В настоящее время доступны три языка – английский, русский и украинский. Переводить можно с английского и украинского на русский и обратно. В дальнейшемразработчики обещают добавлять и другие языковые пары.
Система машинного перевода Яндекса основана на статистике. Она анализирует миллионы текстов — переводов друг друга на разные языки — и создаёт специальные словари. Чтобы «выучить» язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках. Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов — чаще всего такие адреса различается только пометками, например, «en» или «us» для английской версии и «ru» для русской.
Для каждого изученного текста система строит список уникальных признаков. Это могут быть редко используемые слова, числа, специальные знаки, находящиеся в тексте в определённой последовательности. Когда система набирает достаточное количество текстов с признаками, она начинает искать параллельные тексты ещё и с их помощью — сравнивая признаки новых текстов и уже изученных.
Чтобы переводчик соответствовал современным стандартам качества, система должна изучить сотни миллионов фраз на разных языках. Это требует очень серьёзных ресурсов: много места на жёстких дисках, много оперативной памяти и так далее. Именно поэтому существующие сейчас системы машинных переводов можно пересчитать по пальцам.
При переводе система выбирает из словарей наиболее вероятные варианты, учитывая контекст.
В компании отмечают, что одно из достоинств статистического машинного перевода в том, что он живет вместе с языком. То есть, если что-то в языке меняется, например, люди начинают писать какое-нибудь слово по-другому, система видит это, как только к ней попадают новые тексты. И чем быстрее нововведение распространится в языке, тем быстрее оно появится в моделях перевода и языка.
«Статистический машинный перевод, конечно, нельзя сравнивать с литературным, сделанным профессиональным переводчиком, — говорит Алексей Байтин, руководитель сервиса Яндекс.Перевод. — Но часто бывает, что пользователю нужно просто понять основной смысл текста — например, он хочет почитать отзывы о зарубежных отелях или новости в иностранных СМИ. Онлайн-переводчик легко поможет это сделать. К тому же на перевод он потратит всего несколько секунд».
Напомним, что «Яндекс» предлагает услуги онлайн-перевода уже с 2009 года. Однако до недавнего времени эта система работала на технологиях компании PROMT, а не на собственных технологиях «Яндекса».
По материалам компании «Яндекс»
Читайте также:
Выручка Yandex Cloud выросла на 58%
Четыре российских компании подписали Отраслевой стандарт защиты данных
Выручка Yandex Cloud в 2023 году составила 13,3 млрд рублей
Яндекс Маркет представил модель складского робота со встроенной нейросетью
МТУСИ и Yandex Cloud подготовят специалистов по облачным технологиям
Оставить свой комментарий:
Комментарии по материалу
Данный материал еще не комментировался.