Текстовый процессор

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Рязанский государственный радиотехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

main (Автосохраненный).docx

Скачиваний:

Добавлен:

22.08.2019

Размер:

1.74 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 125 6 7 8 9 10 11 12 > Следующая >>>

Текстовый процессор

Текстовый процессор, представленный на рисунке 3.2, включает два основных блока, которые поддерживаются соответствующими базами данных, словарями и правилами. Он выполняет предварительную обработку входного текста, а также морфологическую и акцентную маркировку слов текста.

Рисунок 3.2 – Структура текстового процессора

На вход системы синтеза речи могут поступать тексты, взятые из разных источников и зачастую содержащие графические объекты, ссылки, числовые значения, формулы, а также другие объекты и символы, непригодные для синтеза речи. Основной задачей первого блока является нормализация текста, т.е. приведение его к такому виду, когда текст состоит из последовательности слов языка. Следующий блок осуществляет маркировку каждого слова входного текста, необходимую для адекватного синтеза звуков и интонации речи. Для такой маркировки используется грамматический словарь, в котором каждое слово снабжено пометой позиции ударения. Структура блока предварительной обработки в свою очередь состоит из:

Блок очистки текста – осуществляется с целью удаления из входного текста графических объектов, ссылок, различных маркеров и других неинформативных для синтеза речи символов. Для реализации необходимо иметь базу данных допустимых символов и объектов, содержащую русские и латинские буквы, знаки пунктуации, цифры, математические символы.
Блок дешифровки чисел – осуществляется преобразование числа, встретившихся в тексте, в числительное. При этом необходимо учитывать, что числа, встретившиеся в тексте, могут обозначать целые, десятичные и дробные количественные числительные. Для корректного преобразования чисел необходим использовать правила преобразования число – числительное, учитывающие не только число, но и окружающие его слова, сокращения, которые позволяют определить характеристики числа.
Блок дешифровки аббревиатур, сокращений и специальных символов – используются базы данных и правила произношения аббревиатур, сокращений и специальных символов, благодаря чему идет быстрый поиск необходимого поля, даже если аббревиатура записана прописными символами.

Блок морфологической и акцентной маркировки слов состоит из:

<<< < Предыдущая 1 2 3 45 / 125 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
21.08.2019645.14 Кб24Lektsii_PO_KS.docx
#
22.05.20151.56 Mб200Lektsii_po_Perepelkinu.doc
#
12.11.201986.53 Кб2look.doc
#
15.04.2015540.86 Кб21LR_1-2.pdf
#
15.04.2015252.93 Кб19LR_AVR_2013_1-2.doc
#
22.08.20191.74 Mб4main (Автосохраненный).docx
#
15.04.201563.49 Кб54Makroekonomika_Itogovye_testy_s_otvetami.doc
#
15.04.2015791.69 Кб6mal_dial.pdf
#
15.04.201516.95 Кб16Market Economy.docx
#
21.03.20161.14 Mб18Matematika7-1.doc
#
06.09.2019333.31 Кб10Mathcad1.doc