Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lekcii_dm.doc
Скачиваний:
31
Добавлен:
08.11.2018
Размер:
11.89 Mб
Скачать
    1. Определение и способы описания формальных грамматик.

Теория формальных языков (формальных грамматик) занимается описанием, распознаванием и переработкой языков. Описание любого языка должно быть конечным, хотя сам язык может содержать бесконечное множество цепочек. Полезно иметь возможность описания отдельных типов языков, имеющих те или иные свойства, т. е. иметь различные типы конечных описаний.

Предположим, что имеется некоторый класс языков L, который задается определенным типом описаний.

Теория формальных языков позволяет ответить на ряд вопросов, возникающих во многих прикладных задачах, в которых используются автоматно-лингвистические модели. Например, могут ли языки из класса L распознаваться быстро и просто; принадлежит ли данный язык классу L и т. д. Важной проблемой является построение алгоритмов, которые давали бы ответы на определенные вопросы о языках из класса L, например: «Принадлежит цепочка Х языку L или не принадлежит?»

Существуют два основных способа описания отдельных классов языков.

  1. Описание, основанное на ограничениях, которые налагаются на систему полусоотношений Туэ (продукций), на базе которых определяются грамматики как механизмы, порождающие цепочки символов.

  2. Описание языка в терминах множества цепочек с помощью некоторого распознающего устройства. Такие устройства будем называть автоматами (автоматами-распознавателями).

Определение.

Термин формальная грамматика представляет собой общее название несколь­ких типов исчислений, используемых в математической лингвистике для описания строения естественных языков, а также некоторых искусственных языков, в частно­сти, языков программирования.

Определение.

Под грамматиками в математической лингвистике понимают некоторые специ­альные системы правил, задающие (или характеризующие) множества цепочек (ко­нечных последовательностей) символов. Эти объекты могут интерпретироваться как языковые объекты различных уровней, например, как словоформы, словосочетания и предложения (цепочки словоформ) и т. п.

Следовательно, формальные грамматики имеют дело с абстракциями, возни­кающими в результате обобщения таких стандартных лингвистических понятий как словоформа, словосочетание и предложение. Из определенного набора символов (обозначающих, например, все словоформы русского языка) можно строить произ­вольные цепочки; одни из них естественно считать правильными или допустимыми, а другие - неправильными или недоступными.

Структурные методы распознавания базируются на порождающей грамматикесистеме, состоящей из четырех частей: основной, или терминальный словарь; вспомогательный словарь; начальный символ; набор правил подстановки исходных элементов, из которых строят цепочки, порождаемые грамматикой.

Определение.

Элементы основ­ного словаря (понятий языка) называют терминальными (основными) символами.

Определение.

Нетерминальный (вспомогательный) словарь. Это набор символов, которы­ми обозначаются классы исходных элементов или цепочек исходных элементов, а также в отдельных случаях некоторые специальные элементы (вспомогательные или нетерминальные).

Определение.

Начальный символ. Это выделенный нетерминальный символ, обозначающий совокупность (класс) всех тех языковых объектов, для описания которых предназна­чается данная грамматика.

Так в грамматике, порождающей предложения, начальным будет символ, означающий предложение; в грамматике, порождающей допустимые слоги, начальный символ означает слог, и т. п.

Определение.

Правила подстановки (продукции). Это выражения вида «X —> Y», «Х вместо Y», где Х и Y – цепочки, содержащие любые терминальные или нетерминальные символы.

Определение.

Непосредственная выводимость. Если имеются цепочки Х и Y, которые можно представить в виде X = Z1 a Z2 и Y = Z1 b Z2, где а a» b – одно из правил грамматики G, то говорят, что цепочка Y непосредственно выводима из цепочки Х в грамматике G. Другими словами, цепочка Х может быть переработана в цепочку Y за один шаг применением одной подстановки: Х получается из Y подстановкой b на ме­сто некоторого вхождения цепочки а. Это обозначается как Х / G = Y.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]