- •Введение
- •Технико-экономическое обоснование работы
- •Описание предметной области
- •Анализ существующих аналогов
- •Руководство оператора;
- •Преобразование текста в синтезированную речь
- •Структура синтезатора речи по тексту
- •Текстовый процессор
- •Просодический процессор
- •Фонетический процессор
- •Акустический процессор
- •Компоненты Speech api
- •Необходимые компоненты и их установка
- •Оценка разборчивости синтезированной речи
- •Выбор языка программирования
- •Разработка алгоритмов
- •Общий алгоритм решения задачи
- •Алгоритм подключения голосовых модулей
- •Алгоритм настройки голосовых модулей
- •Алгоритм управления голосовым модулем
- •Описание логической структуры разработанной программы
- •Разработка интерфейса пользователя
- •Разработка форм
- •Структура программы
- •Проверка программы
- •Настройка программы
- •Сообщения системному программисту
- •Руководство оператора
- •Назначение и условия применения программы
- •Обращение к программе для запуска
- •Входные и выходные данные
- •Сообщения пользователю
- •Заключение
- •Список используемых источников
Текстовый процессор
Текстовый процессор, представленный на рисунке 3.2, включает два основных блока, которые поддерживаются соответствующими базами данных, словарями и правилами. Он выполняет предварительную обработку входного текста, а также морфологическую и акцентную маркировку слов текста.
Рисунок 3.2 – Структура текстового процессора
На вход системы синтеза речи могут поступать тексты, взятые из разных источников и зачастую содержащие графические объекты, ссылки, числовые значения, формулы, а также другие объекты и символы, непригодные для синтеза речи. Основной задачей первого блока является нормализация текста, т.е. приведение его к такому виду, когда текст состоит из последовательности слов языка. Следующий блок осуществляет маркировку каждого слова входного текста, необходимую для адекватного синтеза звуков и интонации речи. Для такой маркировки используется грамматический словарь, в котором каждое слово снабжено пометой позиции ударения. Структура блока предварительной обработки в свою очередь состоит из:
Блок очистки текста – осуществляется с целью удаления из входного текста графических объектов, ссылок, различных маркеров и других неинформативных для синтеза речи символов. Для реализации необходимо иметь базу данных допустимых символов и объектов, содержащую русские и латинские буквы, знаки пунктуации, цифры, математические символы.
Блок дешифровки чисел – осуществляется преобразование числа, встретившихся в тексте, в числительное. При этом необходимо учитывать, что числа, встретившиеся в тексте, могут обозначать целые, десятичные и дробные количественные числительные. Для корректного преобразования чисел необходим использовать правила преобразования число – числительное, учитывающие не только число, но и окружающие его слова, сокращения, которые позволяют определить характеристики числа.
Блок дешифровки аббревиатур, сокращений и специальных символов – используются базы данных и правила произношения аббревиатур, сокращений и специальных символов, благодаря чему идет быстрый поиск необходимого поля, даже если аббревиатура записана прописными символами.
Блок морфологической и акцентной маркировки слов состоит из: