Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
modul1.docx
Скачиваний:
106
Добавлен:
07.03.2016
Размер:
297.07 Кб
Скачать

4) Збір та аналіз інформації за допомоги реляційних баз даних. Створення таблиць та зв язків між ними.

База даних-систематичне сховище структурованої інформації з певної предметної області, до якого можуть мати доступ багато прикладних програм.

Моделі баз даних призначені для однакового подання будь-яких даних, що містить способи опису даних і маніпулювання ними.

  • Реляційна;

  • Ієрархічна;

  • Мережева.

Реляційна модель БД - побудована на взаємовідношеннях між складовими структури:складається з сукупності взаємо-пов язаних двовимірних таблиць; набір простих таблиць, між якими встановлені зв язки(відношення) за допомогою числових кодів.

Модель-картотека.

Плюси:

  1. Найпростіша структура;

  2. Всі інші типи БД використовують таблиці.

Мінуси:

  1. В багатьох випадках-дублювання даних.

Фаза використання даних включає три етапи:

- пошук; - обробку; - аналіз.

Результатом використання даних є інформація.

Існує декілька методів збору, необхідних для аналізу даних:

1. Облікові системи. Як правило, в облікових системах є механізми побудови звітів і експорту даних, тому отримання потрібної інформації є відносно нескладною операцією.

2. Непрямі дані. Про чинники можна скласти оцінку і за непрямими ознаками. Наприклад, реальне фінансове положення мешканців певного регіону можна оцінити наступним чином. В більшості випадків товари з однаковим призначенням (але різною ціною) поділяються на групи: товари для покупців з низьким рівнем достатку, середнім та високим. Якщо проаналізувати звіт про продажі товару в потрібному регіоні з точки зору пропорційного розподілу суми продажів для кожної категорії достатку покупців, то можна припустити, що чим більше частка від продажу дорогих виробів з однієї товарної групи, тим більше середня платіжна спроможність мешканців даного регіону.

3. Відкриті джерела. Велика кількість даних наявна у відкритих джерелах, таких як статистичні вибірки, звіти корпорацій, опубліковані результати маркетингових досліджень тощо.

4. Проведення незалежних маркетингових досліджень і аналогічних заходів щодо збору даних. Це може бути достатньо дорогим способом, проте, такий варіант збору даних не виключений.

5. Внутрішні дані. Інформація заноситься в базу за різного роду експертними оцінками працівниками організації. Трудомісткий метод.

Зібрані дані перетворюються до єдиного формату, наприклад, таблиць Excel, текстових файлів, або компонентів довільної бази даних. Однією із важливих дій при цьому є визначення способу представлення даних. Як правило, вибирають один з наступних видів - число, рядок, дата, логічна змінна (так/ні). Визначити спосіб представлення (формалізувати) деякі дані буває легко - наприклад, об'єм продажів в гривнях - це певне число. Але, як правило, виникає ситуація, коли представлення чинника є невідомим. Найчастіше такі проблеми виникають з якісними характеристиками.

Також дані повинні бути уніфікованими - одні й ті ж самі дані скрізь повинні описуватись однаково. Часто при видобуванні знань основну увагу приділяють механізмам аналізу даних, не враховуючи важливість попередньої обробки та очищення даних. Очевидно, що некоректні початкові дані призводять до некоректних висновків. Зазначимо, що в більшості випадків джерелом інформації для аналітичних систем є сховище даних, в якому акумулюються відомості з різнорідних джерел, тому гострота проблеми суттєво зростає.

Для дослідження процесів різної природи дані повинні бути підготовлені спеціальним чином. Зупинимося докладніше на двох типах даних: впорядкованих і невпорядкованих. Впорядковані дані потрібні для вирішення задач прогнозування - коли визначають хід того чи іншого процесу в майбутньому на основі наявних хронологічних даних. Як правило, одним з параметрів виступає дата або час, проте можуть використовуватись довільні відліки, наприклад, покази лічильників, зняті з певною періодичністю.

Для впорядкованих даних (часові ряди), кожному стовпцю відповідає один чинник, а в кожний рядок заносяться впорядковані за часом події з єдиним інтервалом між рядками.

Створення таблиць:

Таблиці – об єкти, у яких безпосередньо зберігаються дані. Створити таблицю можна, вибравши у вікні БД вкладку «Таблиця» і використавши «Конструктор» або «Майстер».

  • Введення даних і назв полів(режим таблиця);

  • Конструктор-ручне налаштування;

  • Майстер таблиць-створення таблиць стандартних типів(Товари, Клієнти, Співробітники…);

  • Імпорт таблиць-завантаження даних із інших джерел(з інших БД Access, з БД інших форматів, з таблиць Excel, з документів XML).

Зв язок між таблицями:

  • Багато до багатьох – одному запису в першій таблиці відповідає декілька записів в другій, і навпаки.

Реалізація - через третю таблицю і два зв язки «один до багатьох».

- Один до одного – одному запису в першій таблиці відповідає тільки один запис в другій таблиці. Застосовується в основному для часто використовуваних даних.

- Один до багатьох – одному запису в першій таблиці відповідає декілька записів в другій(товари – прайс листи).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]