- •1.1. Архитектура бд
- •2. Тема 2. Системы управления бд (субд). Выбор систем управления бд. Функции субд.
- •3.1. Жизненный цикл бд. Этапы жц бд.
- •3.1.1. Оценка работы и поддержка б.Д. Производится оценка с точки зрения выполнения требований пользователей. В случае необходимости в систему вносятся изменения.
- •3.1.1.1. Документальные системы
- •3.1.1.2.Обобщенная функциональная структура дипс.
- •3.1.1.3. Коммерческие б.Д.
- •3.1.1.4. Коммерческие базы данных.
- •3.1.1.5. Распределенная обработка данных. Распределенные базы данных
- •3.2. Литература
- •4.1. Уровни.
- •4.2. Этапы проектирования.
- •4.3.Трехуровневая архитектура организации бд
- •4.4. Этапы проектирования: исследование проблемы, этап анализа, проектирование, реализация, внедрение, сопровождение.
- •4.5. Проектирование бд.
- •4.5.1. Этапы проектирования.
- •Тема 5. Средства и методы проектирования бд. Методика диаграмм взаимосвязей между объектами erd-диаграммы. Использование case-технологий при проектировании бд.
- •5.1. Базовые понятия.
- •5.2. Case - приложение eRwin
- •5.2.1. Объекты в eRwin
- •5.2.2. Связь в Erwin
- •6.1. Правила отношений между сущностями. Определение ключей
- •6.2. Нормализация бд. Денормализация бд.
- •Тема 7. Реляционная модель бд. Таблицы. Ограничения целостности данных. Реляционная алгебра. Реляционное исчисление.
- •Тема 8. Организация процессов обработки данных в бд. Обработка транзакций
- •Понятие транзакции.
- •9.1.1. Операторы определения данных ddl
- •9.1.2. Операторы манипулирования данными Data Manipulation Language dml
- •9.1.3. Язык запросов Data Query language (dql)
- •9.1.4. Средства администрирования данных
- •9.1.5. Программный sql
- •9.2. Оператор выборки данных select, использование условий поиска, сортировка результатов запроса. Синтаксис оператора select.
- •C.10. Тема 10. Простые запросы и правила их выполнения. Особенности многотабличных запросов. Объединение таблиц. Использование вложенных запросов
- •10.1. Простые запросы и правила их выполнения
- •10.2. Особенности многотабличных запросов
- •10.3. Объединение таблиц
- •10.4. Использование вложенных запросов
- •Тема 11. Внесение изменений в бд. Добавление информации в бд, удаление данных, изменение существующих данных.
- •C.11.1.Внесение изменений в базу данных
- •Удаление данных
- •11.2. Изменение существующих данных
- •12.1. Специальные аспекты работы с бд. Процедура индексирования.
- •12.2. Триггеры
- •12.2.1. Ключевые слова и параметры
- •12.2.2. Компоненты триггера
- •12.2.3.Типы триггеров.
- •12.2.4.Включение и выключение триггеров.
- •C.12.2.5. Удаление триггера
- •C.12.2.6. Корреляционные имена
- •12.3. Процедуры и функции
- •12.4. Функция
- •12.5.Курсоры.
- •Тема 13. Физическая организация бд на примере Oracle9i. Организация табличных пространств, журналов транзакций. Серверные процессы. Структуры памяти и взаимодействие между процессами.
- •13.1. Архитектура бд.
- •14.1. Системы обработки транзакций oltp и olap - технологий
- •14.2. Хранилища данных. Многомерные хранилища данных
- •14.3. Методы аналитической обработки (olap)
- •14.3.1. Хранилища данных
- •14.3.2. Причины внедрения информационных систем на основе хранилищ данных
- •Литература
- •14.5. Olap в России
- •Тема 15. Основы фракталов. Фрактальная математика. Фрактальные методы в архивации. Управления складами данных
- •15.1. Понятие "фрактал"
- •15.2. Классификация фракталов
- •15.2.1. Геометрические фракталы
- •15.2.2. Алгебраические фракталы
- •C.15.2.3. Стохастические фракталы
- •C.15.3. Системы итерируемых функций
- •15.4. Фрактальное сжатие
- •15.5. История фрактального сжатия
- •15.6. Идея фрактальной архивации
- •15.7. Сравнение с jpeg
- •15.8. Литература
- •Темы рефератов
12.1. Специальные аспекты работы с бд. Процедура индексирования.
Основным преимуществом использования индексов является значительное ускорение процесса выборки и извлечения данных
Термин «индекс» тесно связан с понятием «ключ», хотя есть некоторые отличия. Индекс - средство ускорения поиска записей в таблице, а следовательно и других операций, использующих поиск.: извлечение, модификацию, сортировку и т.д. Таблица, для которой используется индекс, называется индексированной.
Индекс выполняет роль оглавления таблицы. В некоторых системах, например PARADOX, индексы хранятся в индексных файлах, хранимых отдельно от обычных файлов.
Индексный файл является файлом особого типа, в котором каждая запись состоит из 2-х значений:
1. данные,
2. указатель номера записи.
Как уже было отмечено, основное преимущество использования индексов- ускорение процесса выборки данных
Если индексирование организовано на основе ключевого поля, то индекс называют первичным, иначе вторичным.
Основным недостатком индексирования является замедление процесса обновления данных, т.к. при каждом добавлении новой записи в файл, требуется добавить новый индекс в индексный файл.
Индексы можно использовать двумя способами
1. для последовательного доступа к индексированному файлу.
2. Индексы могут использоваться для прямого доступа к отдельным записям файла на основе заданного значения индексирования.
К достоинствам использования индексов относится ускорение процесса извлечения данных за счёт уменьшения числа дисковых операций ввода вывода.
К недостаткам - сам индекс занимает место на устройстве хранения информации, следовательно, при создании таблиц проектировщик должен решать - индексировать или нет.
Синтаксис создания индексов Create index <имя индекса>on <имя табл>,(<имя столбца>,<имя столбца>,)
USP |
|||
SN |
PNAME |
SNAME |
OCENKA |
3412 |
Физика |
Иванов |
4 |
3413 |
Химия |
Петров |
5 |
3414 |
Физика |
Сидоров |
5 |
3415 |
Физика |
Цветков |
4 |
3416 |
Математика |
Казанцев |
3 |
PN |
Математика |
Физика |
Физика |
Физика |
Химия |
Например
Предположим нужно выполнить запрос на поиск студентов, сдавших физику. Для этого упорядочим специальный файл по алфавиту. Для поиска возможны две стратегии:
1. из таблицы USP выбрать строки, у которых PN= ▒ФИЗИКА▓
2. использовать индексный файл PN, согласно указателям извлечь все соответствующие записи из файла USP.
Если доля студентов, сдавших физику невелика по отношению к общему количеству студентов, то не надо делать всего перебора таблицы. Поиск будет прекращен после извлечения следующего предмета - химия. Даже если потребуется просмотреть файл предметов полностью на это потребуется минимум операций ввода √ вывода, поскольку размер файла PN меньше чем размер файла USP.
Здесь файл предметов называют индексным файлом. Файл USP индексирован по отношению к файлу предмета. Индексный файл является хранимым файлом особого типа, в котором каждая запись состоит как минимум из двух значений 1- данные; 2 - указатель номер записи.
При этом данные необходимы для индексированного поля из файла USP, а указатели - для связи с соответственной записью индексированного файла USP. Если индексирование организованно на основе ключевого поля, например, поля SN - то индекс называют первичным, если на основе PNAME - вторичным. Основным недостатком индексирования является замедление процесса обновления данных, т.к. при каждом добавлении новой записи в файл USP потребуется добавить новый индекс в индексный файл PN.
Индексы можно использовать двумя способами:
1. для последовательного доступа к индексированному файлу. Например, индекс PN определяет доступ к записям файла USP согласно алфавитному перечню предметов
2. индексы могут использоваться для прямого доступа к отдельным записям USP, на основе заданного значения индексного поля.
Хранимый файл может иметь несколько индексов, например, индекс PN и индекс ▒оценка▓. Индексы PN и ▒оценка▓ могут как совместно так и раздельно использоваться для наиболее эффективного доступа к данным USP.
Например
При запросе студентов, сдавших физику на 5, согласно индексу PN будут найдены записи - 3412, 3414, 3415, согласно индексу ▒оценка▓ будут найдены - 3413, 3414. затем производится сравнение на совпадение индексов PN и ▒оценка▓ и запись 3413 рассматриваться не будет.
оценка |
PN |
4 5 4 3 5 |
математика физика физика физика химия |
Такой способ также ускоряет поиск, комбинированный индекс можно использовать и по раздельности.
Итак, при использовании индексов ускоряется процесс извлечения данных за счет уменьшения операций ввода - вывода, однако сам индекс занимает место на диске, следовательно при создании таблиц надо принять решение - индексировать ее или нет
Для создания индекса
Create index UNIQUE <имя индекса > on < имя таблицы>
Create index PNIND on USP (PN);
Однако индекс PNIND не будет уникальным. Для создания уникальных (не содержащих повторное значение индексов) используют ключевое слово UNIQUE в команде Create index.