Разработка англо-русского машинного переводчика презентация

Содержание

Слайд 2

В настоящее время господствует один подход – статистический:

Один из великих технических вызовов

XXI ВЕКА: Полноценный машинный перевод

Слайд 3

В теории RBMT-система способна добиться абсолютного качества перевода за счет использования полной формальной

грамматической и лексической модели языка.
На практике для произвольного текста число правил огромно и выразительные возможности естественного языка основаны на их неоднозначном применении, что приводит к конфликту и ломает всю систему.

Альтернатива: RBMT-сиcтемы. Несмотря на перспективы никто пока не добился полного успеха:

Слайд 4

Новый алгоритмический подход к токенизации текста на основе больших групп лексем. Использование многоуровневого

лексикона в сочетании с несколькими параллельными уровнями сегментации приводит к ускорению работы парсера и упрощению разработки.
Сужение тематики перевода до актуальных специализированных текстов, для которых еще не создано ни одной полной формальной грамматической модели.
Полноценное сохранение форматирования исходного сложного специального текста за счет использования регулярных выражений на основе TeX-разметки.
За счет тонкой специализации алгоритмов достижение высокого качества перевода, скорости работы и одновременно снижение простоты разработки до уровня, посильного небольшой группе с небольшим финансированием.

Что делаем мы:

Слайд 5

Актуально? Да! России нужна современная наука, при этом:

Слайд 6

Библиотека cornell university – сайт препринтов arxiv.org

Слайд 7

Актуальна – огромное количество новейших статей, никогда не публиковавшихся на русском. Бесценно для

любого начинающего исследователя из России – от студентов до аспирантов. Потенциально огромная клиентская база и хорошее сочетание цены и качества делает нашу систему уникальным продуктом на рынке России.
Доступна и легальна – библиотека ArXiv.org содержит около 1.000.000 препринтов под свободной лицензией и ежедневно их число растет на несколько сотен. Мы делаем доступными новейшие научные достижения всего мира.
Технически реализуема – тексты «Архива» сверстаны в формате TeX, а строгость изложения позволяет легко применить RBTM-систему с впечатляющим результатом.

наша система

Слайд 8

Архитектура системы:

Слайд 9

Преимущество наших технологий

Слайд 10

План реализации, использование Agile-разработки

Слайд 11

Наш рынок

Слайд 12

Стоит ли игра свеч?

Слайд 13

Наши возможности

Имя файла: Разработка-англо-русского-машинного-переводчика.pptx
Количество просмотров: 72
Количество скачиваний: 0