Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Bazy_dannykh_i_znanii_UP_SHirokov_L.A._2000

.pdf
Скачиваний:
41
Добавлен:
10.06.2015
Размер:
901.06 Кб
Скачать

зации информации и знаний в ЭВМ являются банки данных и банки знаний. Главная их задача - обеспечение пользователей требуемой информацией, т.е. ответы на информационные запросы пользователей к банку данных или банку знаний с целью получения искомой информации.

Банк данных (БнД) - это автоматизированная система, включающая базу данных (БД), лингвистические, программные, технические, организационно-методические средства, обеспечивающие централизованное накопление и коллективное многоцелевое использование информации в различных областях деятельности пользователей. В БнД содержатся совокупности фактов о качественных и количественных характеристиках конкретных объектов предметной области.

Банк знаний (БнЗ) - это автоматизированная система, содержащая различные виды знаний (например, концептуальные, понятийные знания) о предметной области. Эти знания обычно выражаются в терминах данной ПО. Хранящиеся в БнЗ знания используются для вывода новых знаний на основании специальных механизмов, имеющихся

вБнЗ.

СБнД и БнЗ в процессе их создания и эксплуатации взаимодействуют пользователи различных категорий, основными из которых являются конечные пользователи. Ими являются специалисты предметных областей, для удовлетворения информационных потребностей которых и создаются БнД и БнЗ. Конечные пользователи различаются сферой интересов, информационными потребностями, квалификацией и т.п. Конечными пользователями могут быть как физические лица, так и различные вычислительные процессы, задачи, а иногда и целые системы, взаимодействующие с БнД и БнЗ. Во всех случаях результатом взаимодействия является информация, данные, знания.

1.2.СТРУКТУРА БАНКА ДАННЫХ

Структурная схема БнД приведена на рис. 1.1. Здесь введены следующие обозначения:

-ВС - вычислительная система, включающая технические средства (ЭВМ или персональный компьютер, устройства ввода-вывода), операционную систему, программные средства общего назначения и программы пользователей;

-БД - база данных;

-СУБД - система управления базами данных;

-СД - словарь данных;

-ОП - обслуживающий персонал, т.е. группа сотрудников, обеспечивающих операции по сопровождению технических и программных средств БнД, по вводу и выводу текущей информации;

-АБД - администратор базы данных.

11

Рис. 1.1.

1.2.1. База данных

База данных (БД) - это объект управления в БнД. БД описывает состояние объектов предметной области на определенный момент времени совокупностью предложений на некотором формализованном языке. При этом определяются значения всех факторов на данный момент в виде совокупности взаимосвязанных хранящихся вместе данных.

Более подробное рассмотрение БД - предмет дальнейшего изуче-

ния.

1.2.2. Система управления базами данных

Система управления базами данных (СУБД) - это программная система для централизованного управления данными, хранимыми в БД, и их поддержания в состоянии, соответствующем предметной области. Материал по СУБД будет изложен ниже.

1.2.3. Словарь данных

Словарь данных (СД) - это специальная система для хранения единообразной и централизованной информации о всех ресурсах и данных. Он должен обеспечивать пользователей единой терминологией при обслуживании запросов по данной ПО. СД централизованно накапливает и описывает суммарные ресурсы данных БнД как при его проектировании, так и на стадии функционирования.

СД содержит информацию:

-об объектах, их свойствах и отношениях для данной ПО;

-о данных, хранимых в БД: наименованиях данных, их структурах; связях с другими данными; возможных значениях, форматах представления; источниках возникновения; кодах защиты и разграничениях доступа к данным со стороны пользователей.

СД должен:

-способствовать уменьшению избыточности и противоречивости данных;

-хранить централизованное описание данных, обеспечивающее централизованный ввод новых данных, изменение существующих либо удаление устаревших данных из системы.

12

ВБнД в зависимости от типа СУБД могут использоваться два вида СД:

- СД, интегрированный с СУБД; - независимый СД.

Впервом случае в СУБД имеются программные средства ведения словаря. Описания данных хранятся в СД в единственном экземпляре

ииспользуются при работе системы. СД может выполнять и контролирующие функции.

Во втором случае для СУБД должен разрабатываться специальный пакет программ для ведения СД. Недостаток этого вида СД в том, что имеет место избыточность описания данных - в библиотеке СУБД и в СД. При этом под избыточностью БД понимается дублирование экземпляров данных в БД. Избыточность вызывает:

- дополнительные ресурсы для хранения копий данных; - при модификации данного необходимо обновление всех его ко-

пий;

- увеличение вероятности противоречивости информации из-за ошибок при обновлении копий данных.

1.2.4. Администратор базы данных и его функции

Администратор базы данных (АБД) - это управляющий орган БнД, состоящий из одного или группы специалистов в области теории систем обработки данных, знающих специфику ПО данной информационной системы и реализующих управление БД посредством СУБД. На стадии проектирования БнД АБД - идеолог системы, ее главный конструктор. На стадии эксплуатации он обеспечивает ее функционирование, определяет режим работы и использования, отвечает за сохранность данных.

АБД должен:

-решать вопросы организации данных об объектах ПО и взаимосвязей данных с целью объединения информации о различных объектах, согласовывать представления пользователей;

-координировать работы по проектированию, реализации и ведению БД с учетом текущих и перспективных требований пользователей;

-обеспечивать расширение БД при изменении границ ПО;

-обеспечивать разграничение доступа к данным, их секретность

изащиту;

-вести СД, контроль избыточности и непротиворечивости дан-

ных;

-обеспечивать требуемую производительность БнД;

-при необходимости оперативно обеспечивать изменение методов хранения, связей, форматов данных. Определять степень влияния изменений данных на всю БД;

13

-координировать техническое обеспечение БнД на основе текущих и перспективных требований к системе;

-координировать работы системных программистов при разработке дополнительного программного обеспечения для улучшения эксплуатационных характеристик системы, а также работы прикладных программистов при создании новых прикладных программ (ПП), тестировании и включении ПП в состав системы;

-обеспечивать независимость ПП от данных.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1.Определите понятие "информация".

2.Определите понятие "данные".

3.Каков смысл инфологического аспекта информации?

4.Каков смысл датологического аспекта информации?

5.Определите понятие семантической информации.

6.Определите понятие "знание" для информационных систем.

7.Каково назначение БнД?

8.Каково назначение БнЗ?

9.Опишите структуру БнД.

10.Каковы функции и виды СД?

11.Определите АБД и его задачи.

12. Что такое предметная область в информационных системах?

14

ГЛАВА 2. МОДЕЛИРОВАНИЕ ДАННЫХ ДЛЯ ПРЕДСТАВЛЕНИЯ В БД

2.1. ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ ПО ДЛЯ БД

Информационные модели данных разрабатываются проектировщиком БД для ввода в БнД с целью обеспечения решения задач обработки данных, формулируемых конкретными пользователями.

При информационном моделировании рассматриваются:

-явления реального мира;

-информация об этих явлениях;

-представление этой информации посредством данных. Информационное моделирование ПО определяют два фактора:

-идеология организации данных в БД;

-особенности выбранной СУБД.

На рис. 2.1. это отображено соответствующими блоками: реальный мир, информационная сфера, датологическая сфера.

 

Информа-

 

Данные

 

ция

 

 

Датологическая

Реальный

 

Информационная

 

мир

 

сфера

 

сфера

 

 

 

 

 

 

 

 

 

Рис. 2.1

 

 

Для представления информации о конкретной ПО необходимо:

-выделить в рассматриваемой ПО реального мира объекты для информационного отображения в БД;

-для каждого объекта выявить свойства, достаточные для его описания;

-определить виды взаимосвязей (или отношений) между объек-

тами;

-установить совокупности данных о выделенных объектах, необходимые и достаточные для их представления в БД.

При информационном моделировании сложных ПО для упрощения процесса проектирования системы производится декомпозиция ПО на совокупность локальных подобластей, называемых моделями локальных представлений. На следующем этапе для каждого локального представления выполняются необходимые проектные операции. После их окончания модели локальный представлений объединяются, т.е. выполняется процесс их композиции.

15

2.2. ТРЕХУРОВНЕВОЕ ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИОННЫХ ОБЪЕКТОВ

В БнД для реализации потребностей пользователей формируется комплекс моделей данных различного назначения. Наиболее развитый подход к моделированию и проектированию БнД был изложен в 1975 году в отчете специальной исследовательской группы Национального бюро стандартов США. По результатам анализа существующих информационных систем и СУБД было предложено три уровня представления информационных объектов:

-концептуальный;

-внешний;

-внутренний.

Концептуальное представление информационного объекта (называемое также инфологическим) определяет состав типов его данных, их свойства и отношения между данными объекта.

Внешнее представление информационного объекта (или пользовательская модель ПО) - это адаптированное к планируемому комплексу задач конкретного пользователя концептуальное представление информационного объекта.

Внутреннее представление информационного объекта, называемое также датологической моделью (или схемой) БД, ориентировано на конкретную СУБД и определяет принятую технологию хранения и пути доступа к данным, соответствующие избранной СУБД.

Применение моделей различных уровней абстрагирования позволяет:

-декомпозировать сложный процесс отображения ПО в БД на несколько более простых;

-обеспечить логическую и физическую независимость данных;

-специализировать разработчиков БнД и привлечь к разработке БД пользователей, не имеющих профессиональных знаний в области БнД;

-создать пользователям на основе внешних моделей ПО привычную среду общения с БнД, адекватную обычному восприятию пользователями этой ПО.

Логической независимостью данных называется свойство БнД, обеспечивающее возможность изменения общей логической структуры данных без изменения прикладных программ пользователей.

Физической независимостью данных называется свойство БнД, обеспечивающее неизменяемость общей логической структуры данных и прикладных программ при изменениях физического расположения и организации данных в памяти компьютера.

16

2.3. ИНФОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПО

Инфологическим подходом к построению информационных систем называется концепция установления соответствия между состоянием ПО и его восприятием и отображением в БД. При инфологическом моделировании основным составным элементом ПО является "сущность".

Сущностью называется некоторая принятая в конкретной постановке задачи абстракция реального объекта, процесса или явления, о котором необходимо хранить информацию в системе. В качестве синонима термина "сущность" используется также термин "информационный объект" (ниже для краткости будет использоваться также термин "объект").

Объекты в каждый момент времени характеризуются определенным состоянием, которое описывается набором свойств и отношений (или связей) с другими объектами.

Характеристика, описывающая какое-либо свойство сущности, которое можно сформулировать и записать, называется атрибутом. Например: количество, цвет, цена, прибыль и т.п. Для задания атрибута необходимо:

-присвоить атрибуту имя;

-сформулировать смысловое описание атрибута;

-задать множество допустимых значений атрибута;

-указать роль атрибута, т.е. смысл его использования.

Атрибут, который однозначно определяет сущность, называется идентифицирующим атрибутом или идентификатором.

Все информационные объекты делятся на:

-материальные: вид товара, населенный пункт, станок и т.п.

-нематериальные: счет в банке, событие, адрес клиента и т.п. По структуре объекты разделяются на:

-атомарные;

-составные.

Составные объекты имеют структуру, определяющую композицию внутренних составляющих, которые, в свою очередь, могут быть атомарными или составными.

По взаимосвязям с другими объектами объекты могут разделяться на локальные и реляционные. Объект, свойства которого не зависят от его отношений с другими объектами, называется локальным.

Объект, свойства которого зависят от его отношений с другими объектами, называется реляционным. Каждое отношение (или связь) между информационными объектами по числу входящих в него объектов характеризуется степенью n=1,2,...,n. Соответственно связи сущностей могут быть бинарные (между двумя сущностями), тернарные (между тремя сущностями) и т.д. Чаще в информационных объектах связи бинарные.

17

На основе инфологического подхода формируется инфологическая модель (ИЛМ) ПО. Она основывается на знаниях пользователя, АБД и использует естественный язык для фиксации, а также описания выделенных сведений о ПО. ИЛМ является исходной моделью при описании ПО. ИЛМ составляется специалистами ПО и служит связующим звеном между ними и АБД в процессе проектирования БнД. При разработке ИЛМ не принимаются во внимание конкретные виды используемых далее для построения БнД программно-технических средств.

Модель, базирующаяся на ИЛМ, но включающая и описывающая информационные потребности различных пользователей, называется глобальной моделью ПО. АБД при решении своих задач в общем случае пользуется именно этой глобальной моделью ПО.

Практический опыт показывает, что в современных информационных системах быстро изменяется техническое и программное обеспечение. Следовательно, должны изменяться и модели, ориентированные на них. Однако ИЛМ ПО, отражающая объектные характеристики ПО, в этих условиях остается неизменной, что в результате существенно уменьшает затраты на адаптацию информационной системы к новым условиям, так как ИЛМ ПО остается прежней, а реконфигурируются только программно-технические средства.

2.4.СТРУКТУРНЫЕ ЭЛЕМЕНТЫ ДЛЯ МОДЕЛИРОВАНИЯ ДАННЫХ

При моделировании данных, объектов или сущностей рассматриваемой ПО для обозначения их типов и структур существует обширная терминология. В настоящее время наибольшее распространение получили термины "поле", "запись", "файл", "БД".

Полем называется наименьшее поименованное (или элементарное) данное, к которому в БД можно непосредственно адресоваться и с помощью которого выполняется построение всех остальных структур данных. Для указания поля используется также и термин "атрибут". Поле, как и атрибут, может быть идентифицирующим полем, или идентификатором.

По типам данных возможны поля:

-числового типа (целый или вещественный);

-нечислового типа (символьный или логический). В БД с позиций моделирования рассматривают:

-тип поля (или тип данного);

-экземпляр (или значение) поля, т.е. само данное. Пример.

Тип поля: ФИО; значение поля: Иванов.

Записью называется поименованная совокупность полей. Анали-

тическое выражение для записи можно представить в виде: 18

Zj = U Pji, i = 1,2,…,Nj,

(2.1)

i

 

где Zj – j – я запись;

Pji - i – е поле j – й записи;

Nj – количество полей в j –й записи.

Для записей, как и для поля, рассматривают тип записи и экземпляр записи.

Пример. Тип записи:

Служащий банка с типами полей:

ФИО, Дата Рождения, Образование, Должность. Экземпляр записи для служащего банка: Котов В.В., 17.04.75, Высшее, Инженер

Файлом называется поименованная совокупность взаимосвязанных записей одного типа, т.е. хранящихся вместе данных.

Базой данных (БД) называется поименованная совокупность экземпляров записей разного типа, содержащая связи между этими записями. Аналитическое выражение для базы данных можно представить в виде:

DB = {U Zj, j = 1,2,…,M; U Bk, k = 1,2,…,K}, (2.2)

j k

где Zj – j – я запись;

Bk – k –я связь в базе данных.

БД как совокупность хранящихся вместе данных должна удовлетворять следующим требованиям:

-поддержание логической структуры данных;

-быстрота обработки запросов;

-минимизация ресурсов памяти для размещения данных;

-минимальная избыточность данных;

-целостность данных;

-логическая независимость БД от программы;

-физическая независимость данных;

-безопасность и секретность данных;

-единство управления при вводе, модификации, поиске данных;

-эффективность пользовательского интерфейса для работы с БД.

2.5.МОДЕЛЬ "СУЩНОСТЬ-СВЯЗЬ"

Простое хранение разнородных данных в компьютерах является тривиальной задачей. Главная проблема информационных систем – это хранение данных с обеспечением связей между данными, с помощью которых можно по запросам пользователей формировать требуемые совокупности данных. С этой целью необходима разработка

19

БД предметных областей на основе моделей типа "сущность - связь". Моделью типа "сущность - связь" называется модель, представляющая информационные объекты ПО, называемые также сущностями, а вместе с тем и их взаимоотношения. Фактически понятие "сущность" является синонимом понятия "запись". Модель типа "сущность - связь" является неформальной моделью и используется на этапе инфологического проектирования. Для построения модели "сущность

-связь" применяются три конструктивных элемента:

-сущность;

-атрибут;

-связь.

Модель "сущность-связь" обеспечивает:

-семантическое описание ПО;

-исходную информацию для обоснования выбора видов моделей и структур данных в автоматизированной информационной системе.

Как и для записей, в модели "сущность-связь" используются понятия:

-тип сущности;

-экземпляр сущности.

Тип сущности определяет поименованный набор однородных объектов. Тип сущности моделируется схемой записи, а каждая запись представляет собой совокупность атрибутов, моделируемых полями записи.

Пример 1.

Тип сущности Специалисты может описываться атрибутами: Табельный номер, ФИО, Специальность.

Здесь поле типа Табельный номер будем считать идентификатором. Запись для этой сущности можно представить в виде:

Специалисты(ТабельныйНомер, Специальность, ФИО).

Примечание:

В записях имен типов полей, включающих несколько слов, имя записывается без пробелов, но каждое последующее слово начинается с большой буквы.

Идентифицирующие поля размещаются на первом месте и обычно подчеркиваются.

Пример 2.

Пусть тип сущности Отделы описывается атрибутами: НазваниеОтдела, Адрес.

Поле типа НазваниеОтдела можно принять в качестве идентификатора сущности. Моделирующий данный тип сущности соответствующий тип записи можно представить в виде:

Отделы(НазваниеОтдела, Адрес).

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]