Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник 448.docx
Скачиваний:
35
Добавлен:
30.04.2022
Размер:
18.49 Mб
Скачать

Классификация субд

По языкам общения СУБД делятся на открытые, замкнутые и смешанные. Открытые системы – это системы, в которых для обращения к базам данных используются универсальные языки программирования. Замкнутые системы имеют собственные языки общения с пользователями БнД. Открытые системы в настоящее время используются редко.

По выполняемым функциям СУБД делятся на информационные и операционные. Информационные СУБД позволяют организовать хранение информации и доступ к ней. Для выполнения более сложной обработки необходимо писать специальные программы. Операционные СУБД выполняют достаточно сложную обработку, например, автоматически позволяют получать агрегированные показатели, не хранящиеся непосредственно в базе данных, могут изменять алгоритмы обработки и т. д.

По сфере возможного применения различают универсальные и специализированные, обычно проблемно-ориентированные СУБД.

Системы управления базами данных поддерживают разные типы данных. Набор типов данных, допустимых в разных СУБД, различен. СУБД, позволяющие разработчику добавлять новые типы данных и новые операции, называются расширяемыми системами баз данных (РСБД). Дальнейшим развитием концепции РСБД являются объектно-ориентированные системы баз данных, позволяющие моделировать сложные объекты.

Существуют и другие направления классификации СУБД.

4.2. Хранилища данных

Принятие решений должно основываться на реальных данных об объекте управления. Такая информация обычно хранится в оперативных базах данных OLTP-систем. Но эти данные не подходят для анализа и принятия стратегических решений, так как для этого в основном нужна агрегированная информация. Также, для целей анализа необходимо иметь возможность быстро манипулировать информацией, представлять ее в различных аспектах, производить различные нерегламентированные запросы к ней, что затруднительно реализовать на оперативных данных по соображениям производительности и технологической сложности.

Решением данной проблемы является создание специального хранилища данных, содержащего агрегированную информацию в удобном виде.

Хранилище данных (data warehouse, DWH) – это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений. Целью построения хранилища данных является интеграция, актуализация и согласование оперативных данных для физической реализации единого интегрированного источника данных.

По своей сути, Хранилище данных, представляет собой центр, в который собирается вся необходимая информация из различных подразделений предприятия (а также из внешних источников, например статистических отчетов). Прежде чем попасть в Хранилище, данные должны быть соответствующим образом обработаны штатными средствами Хранилища. При этом осуществляется контроль корректности поступающих данных, разноформатные данные приводятся к единой структуре.

Компоненты, входящие в типичное ХД, представлены на рис. 4.6.

Рис. 4.6. Типичная структура Хранилища данных

Как уже говорилось выше, основными источниками данных Хранилища данных служат оперативные транзакционные системы, которые обслуживают повседневную учетную деятельность компании. Детальные данные из источников могут либо напрямую поступать в хранилище, либо предварительно очищаться, интегрироваться и агрегироваться до требуемого уровня обобщения.

При этом для их промежуточного хранения используется Оперативный склад данных (ODSOperational Data Store). В отличие от хранилища данных информация в складе данных может изменяться со временем в соответствии с изменениями, происходящими в источниках данных.

Конструкция оперативного склада аналогична конструкции хранилища данных. Идентичность оперативного склада и хранилища данных состоит в их предметной ориентированности и хранении детальных данных. Отличие от хранилища данных состоит в том, что оперативный склад данных:

- имеет изменяемое содержимое;

- содержит только детальные данные (данные из оперативных и внешних систем, не подвергавшиеся операциям обработки;

- содержит текущие значения данных.

Данные оперативного склада регулярно обновляются. Каждый раз, когда данные изменяются в оперативных системах и внешних источниках, соответствующие им данные из оперативного склада также должны быть изменены. Частота обновления оперативного склада зависит как от частоты обновления источников, так и от регламента загрузки данных в склад. Данные, хранящиеся в оперативном складе данных, уже доступны для предварительного анализа.

Важнейшим элементом ХД являются метаданные, т.е. информация о структуре, размещении и трансформации данных. Благодаря им обеспечивается эффективное взаимодействие различных компонентов хранилища. Обычно выделяют три вида метаданных, которые должны присутствовать в системе:

1. С точки зрения пользователей:

- метаданные для бизнес-аналитиков;

- метаданные для администраторов;

- метаданные для разработчиков.

2. С точки зрения предметных областей:

- структуры данных хранилища;

- модели бизнес-процессов;

- описания пользователей;

- технологические и пр.

3. С точки зрения функциональности системы:

- метаданные о процессах трансформации;

- метаданные по администрированию системы;

- метаданные о приложениях;

- метаданные о представлении данных пользователям.

Наряду с большими корпоративными хранилищами данных широкое применение находят также витрины данных (Data Mart). Под витриной данных понимается небольшое специализированное хранилище для некоторой узкой предметной области, ориентированное на хранение данных, связанных одной бизнес-тематикой. Иногда эти структуры хранения данных называют также киосками данных. Витрины данных можно рассматривать как небольшие хранилища, которые создаются с целью информационного обеспечения аналитических задач конкретных управленческих подразделений. Как правило, витрина содержит значительно меньше данных, охватывает всего несколько предметных областей и имеет более короткую историю.

Источником данных для витрин служат данные из Хранилища данных, которые, как правило, агрегируются и консолидируются по различным уровням иерархии. Детальные данные могут также помещаться в витрину или присутствовать в ней в виде ссылок на данные хранилища.

Различные витрины данных содержат разные комбинации и выборки одних и тех же детализированных данных хранилища.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]