Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник 154.docx
Скачиваний:
10
Добавлен:
30.04.2022
Размер:
245.69 Кб
Скачать

Д.И. Бокарев

БАЗЫ

ДАННЫХ

Учебное пособие

Воронеж 2013

ФГБОУ ВПО «Воронежский государственный

технический университет»

Д.И. Бокарев

БАЗЫ

ДАННЫХ

Утверждено Редакционно-издательским советом

университета в качестве учебного пособия

Воронеж 2013

УДК 002.6:004.65; 002.6:004.62/.63

Базы данных: учеб. пособие [Электронный ресурс].- Электрон. текстовые, граф. данные (239 Кб) / Д.И. Бокарев.- Воронеж: ФГБОУ ВПО «Воронежский государственный технический университет», 2013.- 1 электрон. опт. диск (CD-ROM).- Систем. требования: ПК 500 и выше; 256 Мб ОЗУ; WindowsXP; MS Word 2007 или более поздняя версия; 1024х768; CD-ROM; мышь.- Загл. с экрана.- Диск и сопровод. материалы помещены в контейнер 12х14 см.

В учебном пособии кратко изложены основы теории баз данных и систем управления базами данных. Приведены понятия БД и СУБД, архитектура баз данных, классификация моделей данных, общие вопросы реляционных баз данных, реляционной алгебры и реляционного исчисления. Рассмотрены виды языков баз данных, системы управления базами данных, в том числе в сетях.

Издание соответствует требованиям Федерального государственного образовательного стандарта высшего профессионального образования по направлению 150700.62 «Машиностроение» (профиль «Оборудование и технология сварочного производства»), дисциплине «Современные системы управления базами данных».

Предназначено для студентов 2 курса.

Табл. 2. Ил. 4. Библиогр.: 5 назв.

Научный редактор д-р техн. наук, проф. В.В. Пешков

Рецензенты: ОАО «Воронежское акционерное

самолетостроительное общество»

(главный металлург

д-р техн. наук, проф. А.Б. Коломенский);

канд. техн. наук, доц. А.Б. Булков

© Бокарев Д.И., 2013

© Оформление. ФГБОУ ВПО

«Воронежский государственный

технический университет», 2013

ВВЕДЕНИЕ

Данные - диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава или характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов. Под данными можно понимать информацию, фиксированную в определенной форме, пригодной для последующей обработки, хранения и передачи.

Самым распространенным носителем данных, хотя и не самым экономичным, является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Свойства информации тесно связаны со свойствами носителей данных. Любой носитель характеризуется параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя зависят такие свойства информации, как полнота, доступность и достоверность.

В структуре возможных операций с данными выделяются следующие:

- сбор данных - накопление информации с целью обеспечения достаточной полноты для принятия решений;

- формализация данных - приведение данных, поступающих из разных источников к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

- фильтрация данных - отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

- сортировка данных - упорядочение данных по заданному признаку с целью удобства использования и повышения доступности информации;

- архивация данных - организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;

- защита данных - комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

- транспортировка данных - прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя - клиентом;

- преобразование данных - перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя: книги можно хранить в бумажном виде либо использовать для этого электронную форму или микрофотопленку.

1. Понятие базы данных и системы управления базами данных

Автоматизированные банки данных (БНД) или системы баз данных представляют собой сово­купность баз данных (БД) и систем управления базами данных (СУБД).

База данных - это специальным образом организован­ная (структурированная) совокупность данных и их описаний. Наименьшая единица описания данных называется элементом описания. Совокупность элементов описания, объединенных отношением принадлежности к описываемому объекту, называется записью. Если элементы описания соответствуют отдельным свойствам объекта, то запись описывает объект в целом.

СУБД - это программный комплекс (совокупность языковых и программных средств), реализующий функ­ции создания базы данных, ее обновления, хранения, защиты и выборки данных, их использования прикладными программами и пользователями-непрограммистами.

Основные функции СУБД: создание схемы БД; орга­низация хранения данных; защита целостности БД; уп­равление доступом к БД и защита информации путем разграничения доступа; предоставление пользователям доступа к БД; поддержа­ние загрузки БД и технологических процессов их функ­ционирования.

Для осуществления этих функций СУБД должна иметь собственное ПО, включающее различные компо­ненты.

Тип организации СУБД определяется степенью структурирования записей в составе БД.

Сильноструктурированная запись - построена в соответствии с фиксированным, заранее определенным форматом всех элементов описания. Для хранения таких данных используют фактографические СУБД.

Для хранения слабоструктурированных данных документального типа используют СУБД типа информационно-поисковых систем (ИПС) или документальные СУБД.

Применение банков банных позволяет решить следующие проблемы организации и ведения больших массивов информации:

- сокращение избыточности;

- обеспечение целостности;

- разграничение доступа;

- обеспечение независимости представления данных.

Избыточность – вызывается наличием разных форм представления одних и тех же данных, размножением части данных для дальнейшего использования различными программами, повторными записями одинаковых данных на различных носителях информации.

Целостностью называется свойство БД в любой момент времени содержать лишь достоверные данные. Наличие избыточных, противоречивых, неверных данных нарушает целостность БД.

Для сокращения избыточности производится объединение одинаковых по смыслу, но имеющих разный тип данных в единую БД с приведением к общему, стандартизированному виду. Процесс объединения данных, используемых различными пользователями, в одну общую БД называется интеграцией базы данных.

Однако каждый конкретный пользователь должен получить доступ лишь к некоторому подмножеству данных из БД, необходимых для выполнения своих прикладных программ. Одновременно обеспечивается режим секретности и повышается степень защищенности данных от несанкционированного доступа.

Одним из важнейших преимуществ применения БД является возможность обеспечения независимости представления данных в прикладных программах от типа запоминающих устройств и способов их физической реализации. Это достигается построением двух уровней представления данных: логического и физического.

На логическом уровне данные представляются в виде удобном для использования в прикладных программах или непосредственно проектировщиками.

Физический уровень представления данных отражает способ хранения и структуру данных с учетом их расположения на носителях информации.

К компонентам системы баз данных кроме БД и СУБД часто также относят техническое (аппаратное) обеспечение и пользователей.

Если БД сконцентрирована в одном узле вычислительной сети, то она называется сосредоточенной, в противном случае – распределенной.

Распределенные БД могут работать под управлением одинаковых и неодинаковых СУБД. В первом случае говорят об однородных распределенных системах, во втором – о неоднородных.

Однородные распределенные системы баз данных обычно проектируются методом "сверху вниз", в целом аналогично проектированию централизованных баз данных (создание концептуальной, логической, физической моделей данных).

Неоднородные же, напротив, чаще всего строятся "снизу вверх" с целью создать общую среду управления над существовавшими ранее разрозненными базами данных. Основной проблемой при этом становится объединение схем баз данных, таким образом, чтобы предоставить как новым, так и прежним приложениям доступ и к новым и к прежним ресурсам данных. Процесс создания системы мультибаз данных технически сложен и нетривиален.

При создании однородных распределенных баз данных используется два метода распределения данных: фрагментация и тиражирование.

Фрагментация означает декомпозицию объектов базы данных, таких, как реляционные таблицы, на две или более частей, которые размещаются на разных компьютерных системах.

При горизонтальной фрагментации делаются горизонтальные "срезы" в соответствии со значением какого-либо столбца таблицы. При вертикальной фрагментации разбиение таблицы осуществляется не по строкам, а по столбцам.

Независимо от вида фрагментации, поддерживается глобальная схема, представляющая единое описание всех составляющих ее локальных баз данных, позволяющая воссоздать из имеющихся фрагментов логически централизованную таблицу или другую структуру базы данных.

Основным достоинством модели фрагментации является то, что пользователи всех узлов (при исправных коммуникационных средствах) получают информацию с учетом всех последних изменений. Второе достоинство состоит в экономном использовании внешней памяти компьютеров, что позволяет организовывать БД больших объемов.

К недостаткам модели распределенной БД, основанной на фрагментации данных, относится следующее: жесткие требования к производительности и надежности каналов связи, а также большие затраты коммуникационных и вычислительных ресурсов из-за их связывания на все время выполнения транзакций. При интенсивных обращениях к распределенной БД, большом числе взаимодействующих узлов, низкоскоростных и ненадежных каналах связи обработка запросов по этой схеме становится практически невозможной.

Тиражирование (или репликация) означает создание копий некоторых фрагментов базы данных с целью приближения данных к месту их использования. Основное достоинство метода заключается в сокращении сетевого трафика и увеличение производительности системы. Репликаторы представляют множество различных физических копий некоторого объекта базы данных (обычно таблицы), для которых в соответствии с определенными в базе данных правилами поддерживается синхронизация (идентичность) с некоторой "главной" копией. Теоретически значения всех данных в тиражированных объектах должны автоматически и незамедлительно синхронизироваться друг с другом. (На практике это правило обычно несколько ослабляется.) В некоторых системах копии используются исключительно в режиме чтения и обновляются в соответствии с заданным расписанием. В других средах допускается модификация отдельных значений в копиях, и эти изменения распространяются в соответствии с процедурами планирования и координации.

Основной недостаток метода тиражирования БД заключается в том, что на некотором интервале времени возможно "расхождение" копий БД.

Экспертная система – система искусственного интеллекта, включающая знания об определенной слабо структурированной и трудно формализуемой узкой предметной области и способная предлагать и объяснять пользователю разумные решения. Экспертная система состоит из базы знаний, механизма логического вывода и подсистемы объяснений.

База знаний – семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]