- •Введение
- •Технико-экономическое обоснование работы
- •Описание предметной области
- •Анализ существующих аналогов
- •Руководство оператора;
- •Преобразование текста в синтезированную речь
- •Структура синтезатора речи по тексту
- •Текстовый процессор
- •Просодический процессор
- •Фонетический процессор
- •Акустический процессор
- •Компоненты Speech api
- •Необходимые компоненты и их установка
- •Оценка разборчивости синтезированной речи
- •Выбор языка программирования
- •Разработка алгоритмов
- •Общий алгоритм решения задачи
- •Алгоритм подключения голосовых модулей
- •Алгоритм настройки голосовых модулей
- •Алгоритм управления голосовым модулем
- •Описание логической структуры разработанной программы
- •Разработка интерфейса пользователя
- •Разработка форм
- •Структура программы
- •Проверка программы
- •Настройка программы
- •Сообщения системному программисту
- •Руководство оператора
- •Назначение и условия применения программы
- •Обращение к программе для запуска
- •Входные и выходные данные
- •Сообщения пользователю
- •Заключение
- •Список используемых источников
Пояснительная записка к выпускной квалификационной работе;
Руководство программиста;
Руководство оператора;
Раздел «Руководство программиста» должен быть оформлен в соответствии с ГОСТом 19.504-79, а «Руководство оператора» - по ГОСТ 19.505-79.
Теоретическая часть
Введение в речевые технологии
Речевые технологии – технологии XXI века. Благодаря им появилась возможность управлять компьютером с помощью голоса, диктовать текст, прослушивать книги, а в перспективе – управлять компьютером дистанционно на интеллектуальном уровне. Основными направлениями в этой области являются: распознавание речи, синтез голоса, средства речевого управления, идентификация по образцу.
Построение речевого интерфейса сводится к реализации трех задач:
Обеспечение восприятия компьютером отдельных команд;
Распознавание компьютером слитной речи человека в целях полной замены использования клавиатуры;
Способность компьютера преобразовывать информацию в речевое сообщение.
На сегодняшний момент решение существует только для последней задачи. Синтез речи – это математическая задача, которая уже решена. Решению первой задачи препятствует тот факт, что еще не выяснено, каким образом можно расчленить речь так, чтобы извлечь из неё смысл. В человеческом речевом потоке нельзя выделить отдельно буквы и слоги – это цельный объект. Однако, если отдельно рассматривать каждое слово, то можно выделить и буквы, и слоги. Вторая задача решена на половину, так как нет однозначного решения вопроса распознавания потока речи, в то время как задача перевода текста в речь уже решена.
Речевые технологии в программном обеспечении каждый раз находят новые сферы применения. Начав с простого преобразования текста в синтезированную речь, они заняли прочное место в компьютерном мире. Из существующих новейших направлений развития программного обеспечения в области речевых технологий можно выделить несколько основных групп:
Управление программой голосовыми командами;
Диктовка текста;
Идентификация по образцу речи;
Синтез речи;
Офисный голосовой интерфейс;
Мультимедийные обучающие системы.
Прикладной интерфейс программирования Microsoft Speech API (SAPI) включает в себя следующие возможности:
Командное управление - Command Control;
Диктант- Dictation;
Текст в речь - Text to Speech;
Телефония - Telephony;
Рассмотрим назначение технологий:
Технология Command & Control – предусматривает распознавание речи в виде отдельных слов или фраз из списка ожидаемых компьютеру. Подобная функция может использоваться для управления , голосом. Команды для управления могут как статическими, так и вариантными, что дает богатые возможности для реализации поставленной задачи;
Технология Dictation – реализует ввод распознавания речи произвольного содержания, т.е. предназначена для диктовки текста;
Технология Text To Speech –позволяет синтезировать связную речь из передаваемого текста;
Технология Telephony – представляет собой смесь распознавания и синтеза речи. Типовые функции VoiseTelephony – расширенный автоответчик, голосовая почта, голосовая справочная служба.