rss Twitter Добавить виджет на Яндекс
Реклама:

Тесты цифровой техники

     
 
 
 
     
     
 
 
 
     
     
 

Яндекс.Переводчик объединил статистический перевод с нейросетью

Яндекс.Переводчик начал использовать гибридную систему перевода. К статистической модели, которая работает в Переводчике с момента запуска, добавилась технология перевода на нейронной сети. Текст переводят обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший. Преимущество гибридной системы в том, что она позволяет взять лучшее от каждого метода и повысить качество перевода.

В отличие от статистического переводчика, нейронная сеть не разбивает тексты на отдельные слова и фразы. Она получает на вход предложение целиком и выдаёт его перевод. Такой подход позволяет учесть контекст и лучше передать смысл. Кроме того, результат получается «гладким»: предложение хорошо читается, и иногда даже можно подумать, что его перевёл человек. Статистическая модель, в свою очередь, лучше справляется с редкими словами и фразами и не фантазирует, если смысл предложения непонятен, как это может делать нейросеть.

Яндекс.Переводчик объединил статистический перевод с нейросетью

Чтобы снизить количество грамматических ошибок, Яндекс.Переводчик проводит дополнительную проверку переводов, выполненных нейронной сетью. Они проходят через модель языка — так называется свод знаний о языке перевода, накопленный системой. Если в предложении есть рассогласования, например «папа пошла» или «сильный боль», модель исправит их.

Сейчас гибридная система работает только для переводов с английского на русский. Это самое популярное направление перевода — на него приходится около 80% запросов. Пользователи веб-версии Яндекс.Переводчика могут сравнить результат работы гибридной системы и статистического переводчика и выбрать вариант, который им больше понравится.

Яндекс.Переводчик заработал в 2011 году. На старте он мог работать с тремя языками: русским, украинским и английским. Сейчас он знает 94 языка, включая экзотические наподобие коса или папьяменто, и может выполнять переводы между любой парой. В 2016 году Переводчик выучил синдарин — искусственный язык, на котором говорят эльфы в книгах Дж. Р. Р. Толкина.

Редактор раздела: Александр Авдеенко (info@mskit.ru)

Рубрики: ПО, Web

наверх
 
 
     
Оставить комментарий
Имя:
E-mail:
Комментарий (не более 2000 знаков):



     
 

ITSZ.RU: последние новости Петербурга и Северо-Запада

22.11.2017 Культурное 5G

22.11.2017 Общение с приложениями как драйвер роста

21.11.2017 Нападение на криптовалюту

17.11.2017 Ставка на эффективность: в Петербурге обсудили автоматизацию бизнес-процессов

17.11.2017 Черный, красный, золотой. Oppo возвращается в Россию

14.11.2017 МТС: рост выручки на потере базы

14.11.2017 Эффективна ли «нативка»

30.10.2017 ЭОС: не будет цифровой экономики, пока документы не станут цифровыми

MSKIT.RU: последние новости Москвы и Центра

NNIT.RU: последние новости Нижнего Новгорода