- •Понятие распределенной информационной системы. Распределенные базы данных. Принципы создания и функционирования распределенных баз данных.
- •Прозрачные свойства распределенных баз данных. Прозрачность фрагментации, местоположения, локального отображения.
- •Системы управления распределенными базами данных: понятие, функциональные возможности, типы. Преимущества и недостатки систем управления распределенными базами данных.
- •Архитектура клиент-сервер. Основные правила архитектуры клиент-сервер. Модели распределений.
- •Модели архитектуры клиент-сервер: rda-модель, dbs-модель, as-модель. Преимущества и недостатки.
- •Фрагментация. Основные концепции фрагментации данных. Виды фрагментации.
- •Репликация. Понятие согласованного распределенного набора данных. Варианты репликации. Протокол репликации rowa.
- •Технологии доступа к данным: odbc, jdbc, ole db, ado, dao, bde.
- •Транзакция, ее свойства. Модель транзакции в стандарте sql. Журнализация транзакций.
- •Понятие распределенной транзакции. Мониторы обработки транзакций.
- •Параллельное выполнение транзакций. Управление параллельным выполнением транзакций. Проблемы и решения по организации управления параллельным выполнением в распределенной среде.
- •Механизм блокировок. Виды блокировок. Централизованное блокирование, блокирование первичных копий и распределенное блокирование. Блокировка
- •Метки времени
- •Оптимистические методы
- •Понятие проекта информационной системы, его структура. Экономико-организационные и информационно-технологические принципы проектирования информационных систем.
- •1. Экономико-организационные
- •2. Информационно-технологические
- •Жизненный цикл разработки систем. Основные стадии жизненного цикла. Модели жизненного цикла.
- •Каноническое проектирование информационных систем. Стадии процесса проектирования информационных систем.
- •Состав работ на предпроектных стадиях проектирования системы. Обследование информационной системы. Описание постановки задачи. Техническое задание.
- •Состав работ на стадиях технического и рабочего проектирования информационной системы.
- •Состав работ на стадиях ввода в действие и сопровождения информационной системы.
- •Case-технологии, основные принципы. Этапы создания информационной системы на основе case-технологии. Факторы эффективности case-технологии.
- •Case-средства, их классификация. Примеры case-средств и их характеристика.
- •Типовое проектирование информационных систем. Классификация, примеры типовых информационных систем и их характеристика.
- •Проектирование системы управления в Business Studio.
- •29. Возможности и реализуемые стандарты современного пакета бизнес- моделирования Business Studio.
- •28. Основные задачи администратора базы данных:
-
Развитие инфраструктуры базы данных. Организация децентрализованного хранения данных.
В 70-х годах использовалась архитектура клиент-сервер на основе локальной сети с централизованной базой данных.
В этом случае данные обычно хранятся на выделенном компьютере – сервере, а доступ к ним и их представление организуется через клиентские программы.
Чтобы сделать запрос, клиент устанавливает соединение с сервером. Сервер анализирует инструкции, выполняет их, извлекает данные и возвращает результаты запроса.
В такой системе отражается, во-первых, удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации. Во-вторых, реализуется многопользовательский доступ к данным, поскольку существует возможность предоставлять одни и те же данные нескольким клиентам одновременно, решая при этом проблемы совместного доступа.
В 80-е годы произошли серьезные изменения в социальной и технологической сферах, сильно повлиявшие на разработку баз данных:
-
Рост конкуренции в глобальных масштабах;
-
Возросшие потребности рынка и запросы пользователей на быстро меняющиеся события, требующие немедленного отклика и быстрого доступа к информации. Централизованный подход был хорош для структурирования информации корпорации, но плохо годился для оперативного получения информации, когда необходим был быстрый, незапланированный заранее доступ к базе данных с помощью нерегламентируемых запросов.
-
Географическая децентрализация операций. Происходит территориальное развитие предприятий, использующих локальные сети в качестве основы компьютеризации бизнеса и связанная с этим необходимость распределенной обработки данных.
Все эти факторы приводят к возникновению ряда проблем, свойственных централизованной архитектуре:
-
большой объем обмена данных;
-
снижение надежности обмена данными; что связано с зависимостью от центрального узла;
-
ухудшение общей производительности; из-за возрастающего числа пользователей, удаленных на большие расстояния. По мере возрастания нагрузки производительность сервера снижается. Чтобы избежать этого, задействуют дополнительные ресурсы, например, наращивают память, ставят дополнительные процессоры и даже сетевые платы.
-
рост затрат на разработку базы данных. Высокая стоимость, связанная с обслуживанием и поддержкой центральной базы данных, размещенной на мэйнфрейме.
В 1990-е годы влияние этих факторов еще более усилилось.
На способы реализации новых подходов сильное влияние оказали и такие важные явления как:
-
возрастающее признание Интернет и использование WWW в качестве платформы для доступа к данным и их распределения. WWW фактически стала хранилищем распределенных данных;
-
повышенное внимание к анализу данных, что привело к появлению специфических технологий анализа информации в БД (data mining) и создание хранилищ данных.
Возможным решением перечисленных проблем является организация децентрализованного хранения данных – обеспечения хранения данных в местах их возникновения или обработки, что привело к созданию распределенных многопользовательских баз данных (РаБД), а, следовательно, информационные системы стали называться распределенными.
-
Понятие распределенной информационной системы. Распределенные базы данных. Принципы создания и функционирования распределенных баз данных.
Распределенная база данных (Distributed Database – DDB) – это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети.
В распределенных системах база данных состоит из нескольких частей, которые называются фрагментами базы данных.
Пример конфигурации распределенной базы данных представлен на рис.
Распределенная база данных предполагает физическое разделение на фрагменты и распределение их по локальным узлам сети данных.
Главный критерий распределения данных в сети состоит в следующем: данные должны находиться там, где существует наибольшая частота обращения к ним. Такой подход обеспечивает быстрый и эффективный доступ к данным.
Каждый фрагмент базы данных сохраняется на одном или нескольких узлах, соединенных между собой линиями связи, и каждый из них работает под управлением отдельной СУБД.
Будучи фрагментом общего пространства данных, часть базы данных функционирует как полноценная локальная база данных. Управление выполняется локально и независимо от других узлов системы.
Пользователи взаимодействуют с распределенной базой данных через приложения.
Принципы создания и функционирования распределенных баз данных
Принципы построения РБД.
-
Минимизация интенсивности обмена данными (сетевого трафика)
-
Оптимальное размещение серверных и клиентских приложений в сети
-
Декомпозиция данных на часто и редко используемые сегменты (для правильной настройки репликации - размещение наиболее часто используемых данных на АРМ конечных пользователей)
-
Периодическое сохранение копий данных и выполнение действий по поддержке целостности распределенной информационной системы.
К. Дейт сформулировал 12 требований к распределенной базе данных:
-
Локальная автономия. Означает, что управление данными на каждом из узлов распределенной системы выполняется локально.
-
Независимость узлов. Предполагает, что все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. База данных на каждом из узлов включает полный собственный словарь данных и полностью защищена от несанкционированного доступа.
-
Непрерывность операций. Это возможность непрерывного доступа к данным в рамках распределенной базы данных вне зависимости от их расположения и вне зависимости от операций, выполняемых на локальных узлах.
-
Прозрачность расположения. Пользователь, обращающийся к базе данных, ничего не должен знать о реальном, физическом размещении данных в узлах информационной системы.
-
Прозрачная фрагментация. Это требование определяется как возможность распределенного (то есть на различных узлах) размещения данных, логически представляющих собой единое целое.
-
Независимое тиражирование. Предполагает перенос изменений объектов исходной базы данных в базы, расположенные на других узлах распределенной системы.
-
Обработка распределенных запросов. Заключается в возможности выполнения операций выборки данных из распределенной базы данных, посредством запросов на языке SQL.
-
Обработка распределенных транзакций. Предполагает выполнение операций обновления распределенной базы данных, не нарушающих целостность и согласованность данных.
-
Независимость от оборудования. Означает, что в качестве узлов распределенной системы могут выступать компьютеры любых моделей и производителей. Система должна выполняться на любой аппаратной платформе.
-
Независимость от операционных систем. Допускает многообразие операционных систем, управляющих узлами распределенной системы.
-
Прозрачность сети. Трактуется как возможность использования в распределенной системе любых сетевых протоколов.