Системы машинного перевода
.docxВыбор лексической ед. зависит: 1) от типа языка, 2)от объема словаря, 3)от типа сист маш перевода.
Для проф перевода – словоформа.
В словарной статье выделяют 4 зоны:
-
зона морфологич сведений
-
зона семантических сведений: а)принадлежность к опред семантиче подклассу,б)переводные эквиваленты
-
зона синтаксических сведений (управление предлога,глагола)
-
зона лексических сведений: а)стилистическое исп лекс ед, б)исп лекс ед как части фразеологизма
Системы 1ой технологии опираются на готовые словари. Для и разроботки нужно много времени, а также для настройки системы, для каждой тематики перевода:
-
подключение специализир словарей необ подключ
-
добавление незнакомых слов в свой пользоват словарь
-
резервирование собственных имен
-
подключение баз ТМ
-
выбор подходящего варианта перевода для многозначных слов
-
редактирование перевода
использование программ этой технологии дает выигрыш только при переводе огромных массивов однородной документации с большим кол-вом повторений, только тогда это целесообразно.
Преемцущество систем перевода:
-
точность
-
стабильность и предсказуемость результатов
-
возможность настройки на предметную область
Недостатки:
-
трудоёмкость и длительность разработки
-
неободимость пополнения словарей
-
машинный акцент
II. системы этой технологии осн на поиске наиболее вероятного перевода с исп данных из параллельных ВСЕЛЕННЫХ >DD
Преимущества:
-
легко построить при наличии 2х язычного корпуса текста
-
лексическая гладкость
Недостатки:
-
ограниченность парал корпусов и качества
-
плохо справляются с морфологией и синтаксисом
-
искажение инфы, нестабильность
обе технологии обладают своими преемуществами и недостатками и не решают задачу по достижению качественного маш перевода. Разработала сист промт гибридную теор перевода. Такой перевод сохраняет преемущ традиц технологии (формир синтаксически связного и грамматически правильного текста) и преемущ статистич метода (быстрое обучение,получение данных из парал корпусов в автоматич режиме и гладкость текстов).