книги / Теоретические основы автоматизированного управления
..pdfГЛАВА 7
Информационное обеспечение автоматизированного управления
Автоматизированное управление базируется на реализации информацион ных процессов, к числу которых относятся хранение и поиск информации. Хра нение информации представляется, с одной стороны, как совокупность моделей концептуального, логического и физического уровней, с другой — как набор ме тодов и способов практической реализации. Приведена общая характеристика теории и технологии создания баз данных. Основное внимание уделено разви тию информационного обеспечения автоматизированного управления наоснове наиболее перспективных направлений: объектно-ориентированных базданных, объектно-реляционных баз данных, распределенных баз данных.
7.1. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ НА ОСНОВЕ ТЕХНОЛОГИИ БАЗ ДАННЫХ
В настоящее время определяющими направлениями информаци онного обеспечения автоматизированного управления является кон цепция базы данных, склада (хранилища) данных [47].
База данных может быть определена как совокупность взаимосвя занных данных, используемых несколькими пользователями и хра нящихся с регулируемой избыточностью. Хранимые данные не зави сят от программ пользователей, для модификации и внесения изме нений применяется общий управляющий метод.
Банк данных — система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.
Система баз данных — совокупность управляющей системы, при кладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.
Хранилище данных (ХД), также применяют термины «склад дан ных», «информационное хранилище», Data Warehouse — это база
данных, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; автоматическое формирование новых агрегатов данных, за висящих от старых; доступ к ХД осуществляется на основе многомер ного куба или гиперкуба.
Альтернативой хранилищу данных является концепция «витрин данных» (Data Mart). Витрины данных — множество тематических БД, содержащих информацию, относящуюся к отдельным информа ционным аспектам предметной области.
Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматри вать просто как базу данных, предназначенную для хранения не поль зовательских, а системных данных. Технология репозитариев проис текает от словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.
Каждый из участников действия (пользователь; группа пользова телей; «физическая память») имеет свое представление об информа ции.
По отношению к пользователям для описания предметной облас ти принято использовать трехуровневое представление: концепту альное, логическое и внутреннее (физическое) (рис. 7.1).
Группа пользователей А |
Группа пользователей В |
|
||||
— |
- |
-------------------------- 1 |
|
|||
|
г |
» |
|
1 |
Концептуальное| |
|
* |
1 |
Концептуальная |
||||
1 |
модель |
|
представление |
j |
||
|
1 |
|
||||
|
1 |
|
|
|
|
|
|
1 |
|
1 |
|
|
|
|
1 |
|
|
Логическое |
| |
|
|
1 |
Логическая |
||||
|
1 |
|
|
|
|
|
|
4 |
модель |
|
представление |
{ |
|
|
1 |
|
||||
|
1 |
|
1 |
|
|
|
|
1 |
|
|
|
|
|
|
1 |
|
|
|
Физическое |
1 |
|
11 |
Физическая модель |
||||
|
представление |
i |
||||
|
1 |
(хранимая база |
||||
|
1 |
данных) |
|
|
|
|
|
1- |
|
|
|
||
|
|
|
Т |
|
|
|
|
|
М В Д |
| |
|
|
С У Б Д Рис. 7.1. Описание предметной области
Рис. 7.2. Фрагмент предметной базы данных «Сбыт» и одно из возможных его концептуальных представлений
Концептуальныйуровень связан с частным представлением данных ' группы пользователей в виде внешней схемы, объединяемых общно стью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (мо дель «сущность — связь», ER-модель, модель Чена, бинарные и инфологические модели, семантические сети). На рис. 7.2 представлен фрагмент предметной базы данных «Сбыт» и одно из возможных его концептуальных представлений, которое отражает не только объекты и их свойства, но и взаимосвязи между ними.
Логический уровень является обобщенным представлением дан ных всех пользователей в абстрактной форме. Используются три классических вида моделей: иерархические, сетевые и реляционные.
Сетевая модель — модель объектов-связей, допускающая только бинарные связи «многие к одному» и использующая для описания модель ориентированных графов.
Иерархическая модель — разновидность сетевой, являющаяся со вокупностью деревьев (лесом).
Реляционная модель использует представление данных в виде таб лиц (реляций), в ее основе лежит математическое понятие теорети-
Рис. 7.3. Представление предметной базы данных «Сбыт» на логическом уровне для различных моделей
ко-множественного отношения, базируется на реляционной алгебре и теории отношений.
Представление предметной базы данных «Сбыт» на логическом уровне для различных моделей приведено на рис.7.3.
Дальнейшим развитием логического представления данных явля ется переход к объектно-ориентированным моделям данных, что свя зано с процессом «перекачки» в них огромных объемов информации, которая в настоящее время хранится преимущественно в реляцион ных базах данных.
Суть объектно-ориентированной базы данных (ООБД) определяет ся объектно-ориентированным подходом.
Объектно-ориентированный подход подразумевает объектно-ори ентированное проектирование и объектно-ориентированное програм мирование.
Объектно-ориентированное проектирование — методология про ектирования, соединяющая в себе процесс объектной декомпозиции и приемы представления логических и физических, а также статиче ских и динамических моделей проектируемой системы.
Объектно-ориентированное программирование — методология программирования, основанная на представлении программ в виде связанной совокупности объектов, каждый из которых является эк земпляром определенного класса, а классы образуют иерархию по на следованию.
Объектно-ориентированное проектирование предполагает не только деление (декомпозицию) базы знаний или базы данных на со ставные части, но и рассмотрение общей этапности реализации БД, выбор инструмента реализации с учетом оговоренных в техническом задании вариантов реализации.
Свойства реляционных, сетевых, иерархических, объектно-иерар хических и объектно-реляционных моделей данных (многомерные модели считаем разновидностью иерархических моделей данных) возможно систематизировать и сравнить, как это сделано в табл. 7.1.
|
|
|
|
|
Таблица 7.1 |
|
Вид модели |
Достоинства |
Недостатки |
|
|||
Иерархическая |
Простота понимания |
Отношения |
М:М могут бьггь |
|||
|
Высокое быстродействие при реализованы только искусствен |
|||||
|
совпадении структур базы дан но |
|
|
|
||
|
ных и запроса |
|
Могут быть избыточные дан |
|||
|
|
|
ные |
|
|
|
|
|
|
Усложняются операции вклю |
|||
|
|
|
чения и удаления |
|
||
|
|
|
Удаление исходных сегментов |
|||
|
|
|
приводит к удалению порожден |
|||
|
|
|
ных сегментов |
|
|
|
|
|
|
Процедурный |
характер |
по |
|
|
|
|
строения структуры БД и мани |
|||
|
|
|
пулирования данными |
|
||
|
|
|
Доступ к любому порожденно |
|||
|
|
|
му сегменту возможен только че |
|||
|
|
|
рез корневой сегмент |
|
||
|
|
|
Сильная зависимость логиче |
|||
|
|
|
ской и физической моделей |
|||
|
|
|
Ограниченный набор структур |
|||
|
|
|
запроса |
|
|
|
|
|
|
Невозможность |
реализации |
||
|
|
|
таблицс нелинейной структурой |
|||
Сетевая |
Сохранение информации при |
Отношения М:М могут быть |
||||
|
уничтожении записи-владельца реализованы только искусствен |
|||||
|
Более богатая структура за но |
|
|
|
||
|
просов |
|
Необходимость программисту |
|||
|
Меньшая зависимость логи знатьлогическую структуруБД |
|||||
|
ческой и физической моделей |
Процедурный |
характер |
по |
||
|
Возможность |
реализации строения структуры БД и мани |
||||
|
таблиц с нелинейной структу пулирования данными |
|
||||
|
рой |
|
Возможная |
потеря независи |
||
|
|
|
мости данных |
при реорганиза |
||
|
|
|
ции БД |
|
|
|
Вид модели |
Достоинства |
Недостатки |
|
||
Реляционная |
Произвольная |
структура за |
Отношения М:М |
могут быть |
|
|
проса |
|
реализованы только искусствен |
||
|
Простота работы и отражения но |
|
|
||
|
представлений пользователя |
Необходимость нормализации |
|||
|
Отделение физической моде данных |
|
|
||
|
ли от логической и логической |
Возможность логических оши |
|||
|
от концептуальной |
бок при нормализации и реали |
|||
|
Хорошая теоретическая про зации |
|
|
||
|
работка |
|
Невозможность |
реализации |
|
|
|
|
таблиц с нелинейной структурой |
||
Объектно-ори |
Неограниченный набор ти |
Сложность освоения |
модели |
||
ентированная |
пов данных |
|
из-за сложности структуры БД |
||
|
Возможность |
реализации |
Нечеткий язык программиро |
||
|
таблиц с нелинейной структу вания |
|
|
||
|
рой |
|
Недостаточная защитаданных |
||
|
Послойное |
представление |
Нечетко проработанный одно |
||
|
данных |
|
временный доступ |
|
|
|
Высокая скорость работы |
Плохая обозримость |
структу |
||
|
из-за отсутствия ключа |
ры |
|
|
|
|
Ненужность нормализации |
|
|
|
|
|
Легкая расширяемость струк |
|
|
|
|
|
туры и ее гибкость |
|
|
|
|
|
Повторное |
использование |
|
|
|
типов данных и компонентов Реализация отношений М:М
Физический (внутренний) уровень связан со способом фактическо го хранения данных в физической памяти ЭВМ. Во многом определя ется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные перепол нения; промежутки между блоками; служебная информация.
По наиболее характерным признакам БД можно классифициро вать следующим образом:
по способу хранения информации:
•интегрированные;
•распределенные;
по типу пользователя:
•монопользовательские;
•многопользовательские;
по характеру использования данных:
• прикладные;
• предметные.
В настоящее время при проектировании БД используют два под хода. Первый из них основан на стабильности данных, что обеспечи вает наибольшую гибкость и адаптируемость к используемым прило жениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функ ционирования (объем памяти и время поиска), существует большое количество разнообразных задач с изменяемыми и непредсказуемы ми запросами.
Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффек тивности функционирования, особенно это касается быстродейст вия.
Важным аспектом проектирования БД является проблема инте грации ираспределения данных. Господствовавшая до недавнего време ни концепция интеграции данных при резком увеличении их объема оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевлении, ши рокое внедрение сетей передачи данных способствовали внедрению распределенных БД. Распределение данных по месту их использова ния может осуществляться следующими способами.
1. Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи дан ных. Модификация данных контролируется централизованно.
2.Подмножество данных. Группы данных, совместимые с исход ной базой данных, хранятся отдельно для местной обработки.
3.Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень.
4.Секционированные данные. На различных объектах использу ются одинаковые структуры, но хранятся разные данные.
5.Данные с отдельной подсхемой. На различных объектах ис пользуются различные структуры данных, объединяемые в интегри рованную систему.
6.Несовместимые данные. Независимые базы данных, спроекти рованные без координации, требующие объединения.
Важное влияние на процесс создания БД оказывает внутреннее со держание информации. Существует два направления:
• прикладные БД, ориентированные на конкретные приложения, например может быть создана БД для учета и контроля поступления материалов;
• предметные БД, ориентированные на конкретный класс дан ных, например предметная БД «Материалы», которая может быть ис пользована для различных приложений.
Конкретная реализация системы баз данных, с одной стороны, оп ределяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны, типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.
Для работы с БД используется специальный обобщенный инстру ментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.
Основные стандарты СУБД:
•независимость данных на концептуальном, логическом, физи ческом уровнях;
•универсальность (по отношению к концептуальному и логиче скому уровню, типу ЭВМ);
•совместимость, неизбыточность;
•безопасность и целостность данных;
•актуальность и управляемость.
Существует два основных направления реализации СУБД: про граммное и аппаратное.
Программная реализация (в дальнейшем СУБД) представляет со бой набор программных модулей, работает под управлением кон кретной ОС и выполняет следующие функции:
•описание данных на концептуальном и логическом уровнях;
•загрузку данных;
•хранение данных;
• поиск и ответ на запрос (транзакцию);
•внесение изменений;
•обеспечение безопасности и целостности.
Она обеспечивает пользователя следующими языковыми средст вами:
•языком описания данных (ЯОД);
•языком манипулирования данными (ЯМД);
•прикладным (встроенным) языком данных (ПЯД, ВЯД). Аппаратная реализация предусматривает использование так назы
ваемых машин баз данных (МБД). Их появление вызвано возросши ми объемами информации и требованиями к скорости доступа. Сло во «машина» в термине МБД означает вспомогательный периферий ный процессор. Термин «компьютер БД» — автономный процессор
Рис. 7.4. Совокупность процедур проектирования БД
баз данных или процессор, поддерживающий СУБД. Основные на правления МБД:
•параллельная обработка;
•распределенная логика;
•ассоциативные ЗУ;
•конвейерные ЗУ;
•фильтры данных и др.
На рис. 7.4 представлена совокупность процедур проектирования БД, которые можно объединить в следующие этапы.
На этапе формулирования и анализа требований устанавливают цели организации, определяют требования к БД. Эти требования до кументируют в форме, доступной конечному пользователю и проек-
тировщику БД. Обычно при этом используют методику интервьюи рования персонала различных уровней управления.
Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначаль ный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователей на осно ве различных подходов.
В процессе логического проектирования высокоуровневое пред ставление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД может быть оценена количест венно с помощью различных характеристик (число обращений к ло гическим записям, объем данных в каждом приложении, общий объ ем данных и т.д.). На основе этих оценок логическая структура может быть усовершенствована с целью достижения большей эффективно сти.
На этапе физического проектирования решают вопросы, связанные с производительностью системы, определяют структуры хранения данных и методы доступа.
Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответствую щую модель.
Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проекти рования могут использоваться независимо в случае отсутствия сло варной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.
Этап расчленения БД связан с разбиением ее на разделы и синте зом различных приложений на основе модели. Основными фактора ми, определяющими методику расчленения, помимо указанных на рис. 7.4, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совмес тимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложе ния, идентификатором узла сети, частотой использования приложе ния и его моделью.
Модели приложений могут быть классифицированы следующим образом:
1.Приложения, использующие единственный файл.
2.Приложения, использующие несколько файлов, в том числе допускающие: