Нейронный машинный перевод
Нейронный машинный перевод (англ. Neural Machine Translation, NMT) — это подход к машинному переводу, в котором используется большая искусственная нейронная сеть. Он отличается от методов машинного перевода, основанных на статистике фраз, которые используют отдельно разработанные подкомпоненты[1].
Описание
Сервисы перевода компаний Google, Яндекс, Microsoft и PROMT[2] уже используют нейронный перевод. Google использует нейронный машинный перевод Google (GNMT) вместо ранее используемых статистических методов.[3] Майкрософт использует похожую технологию для перевода речи (в том числе в Майкрософт Переводчике и Skype Переводчике).[4] Гарвардской группой по обработке естественного языка была выпущена OpenNMT, система нейронного машинного перевода с открытым исходным кодом[5]. Яндекс.Переводчик имеет гибридную модель: свой вариант перевода предлагает и статистическая модель, и нейросеть. После этого технология CatBoost, в основе которой лежит машинное обучение, будет выбирать лучший из полученных результатов[6].
Модели NMT используют глубинное обучение и обучение признакам. Для их работы требуется лишь малая часть памяти по сравнению с традиционными системами статистического машинного перевода (SMT). Кроме того, в отличие от традиционных систем перевода, все части модели нейронного перевода обучаются совместно (от начала до конца), чтобы максимизировать эффективность перевода[7][8][9].
Двунаправленная рекуррентная нейронная сеть (RNN), также известная как кодировщик, используется нейронной сетью для кодирования исходного предложения для второй рекуррентной сети, также известной как декодировщик, которая используется для предсказания слов в конечном языке[10].
Примечания
- Wołk, Krzysztof; Marasek, Krzysztof. Neural-based Machine Translation for Medical Text Domain. Based on European Medicines Agency Leaflet Texts (англ.) // Procedia Computer Science : journal. — 2015. — Vol. 64, no. 64. — P. 2—9. — doi:10.1016/j.procs.2015.08.456.
- Нейронные сети, офлайн-переводчики и конкуренция. Технологии машинного перевода
- Lewis-Kraus, Gideon. The Great A.I. Awakening, The New York Times (14 декабря 2016).
- Microsoft Translator launching Neural Network based translations for all its speech languages – Translator
- OpenNMT - Open-Source Neural Machine Translation (англ.). opennmt.net. Дата обращения: 22 марта 2017.
- В «Яндекс.Переводчик» встроили нейросеть с фантазией - CNews
- Kalchbrenner, Nal; Blunsom, Philip. Recurrent Continuous Translation Models (неопр.) // Proceedings of the Association for Computational Linguistics. — 2013.
- Sutskever, Ilya; Vinyals, Oriol; Le, Quoc Viet. Sequence to sequence learning with neural networks (неопр.) // NIPS. — 2014.
- Kyunghyun Cho; Bart van Merrienboer; Dzmitry Bahdanau & Yoshua Bengio (3 September 2014), On the Properties of Neural Machine Translation: Encoder–Decoder Approaches, arΧiv:1409.1259 [cs.CL]
- Dzmitry Bahdanau; Cho Kyunghyun & Yoshua Bengio (2014), Neural Machine Translation by Jointly Learning to Align and Translate, arΧiv:1409.0473 [cs.CL]