Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекція1.doc
Скачиваний:
9
Добавлен:
09.08.2019
Размер:
98.82 Кб
Скачать

Поняття Data Mining

Data Mining – це процес підтримки прийняття рішень, заснований на пошуку в даних схованих закономірностей (шаблонів інформації).

Технологію Data Mining досить точно визначає Григорій Піатецький-Шапіро (Gregory Piatetsky-Shapiro) – один із засновників цього напрямку:

Data Mining – це процес виявлення в сирих даних раніше невідомих, нетривіальних, практично корисних та доступних інтерпретації знань, необхідних для прийняття рішень у різних сферах людської діяльності.

Суть і ціль технології Data Mining можна охарактеризувати так: це технологія, що призначена для пошуку у великих обсягах даних неочевидних, об'єктивних та корисних на практиці закономірностей.

Неочевидних – це значить, що винайдені закономірності не знаходяться стандартними методами обробки інформації або експертним шляхом.

Об'єктивних – це значить, що виявлені закономірності будуть повністю відповідати дійсності, на відміну від експертної думки, яка завжди є суб'єктивною.

Практично корисних – це значить, що висновки мають конкретне значення, якому можна знайти практичне застосування.

Знання – сукупність відомостей, що утворить цілісний опис, що відповідає деякому рівню поінформованості про описуване питання, предмет, проблемі і т.д.

Використання знань (knowledge deployment) означає дійсне застосування знайдених знань для досягнення конкретних переваг (наприклад, у конкурентній боротьбі за ринок).

Приведемо ще кілька визначень поняття Data Mining.

Data Mining – це процес виділення з даних неявної й неструктурованої інформації й подання її у вигляді, придатному для використання.

Data Mining – це процес виділення, дослідження й моделювання великих обсягів даних для виявлення невідомих до цього структур (patterns) з метою досягнення переваг у бізнесі (визначення SAS Institute).

Data Mining – це процес, ціль якого – виявити нові значимі кореляції, зразки й тенденції в результаті просівання великого обсягу збережених даних з використанням методик розпізнавання зразків плюс застосування статистичних і математичних методів (визначення Gartner Group).

В основу технології Data Mining покладена концепція шаблонів (patterns), які являють собою закономірності, властиві подвыборкам даних, які можуть бути виражені у формі, зрозумілої людині.

"Mining" по-англійському означає "видобуток корисних копалин", а пошук закономірностей у величезній кількості даних дійсно те саме що цей процес.

Ціль пошуку закономірностей – подання даних у вигляді, що відбиває шукані процеси. Побудова моделей прогнозування також є метою пошуку закономірностей.

Data Mining як частина ринку інформаційних технологій

Класифікація аналітичних систем

Агентство Gartner Group, що займається аналізом ринків інформаційних технологій, в 1980-х роках ввело термін "Business Intelligence" (BI), діловий інтелект або бізнес-інтелект. Цей термін, запропонований для опису різних концепцій і методів, які поліпшують бізнес рішення шляхом використання систем підтримки прийняття рішень.

В 1996 році агентство уточнило визначення даного терміна.

Business Intelligence – програмні засоби, що функціонують у рамках підприємства і які забезпечують функції доступу й аналізу інформації, що перебуває в сховищі даних, а також забезпечують прийняття правильних й обґрунтованих управлінських рішень.

Поняття BI поєднує в собі різні засоби й технології аналізу та обробки даних масштабу підприємства.

На основі цих засобів створюються BI-системи, ціль яких – підвищити якість інформації для прийняття управлінських рішень.

BI-системи також відомі за назвою Систем Підтримки Прийняття Рішень (СППР, DSS, Decision Support System). Ці системи перетворюють дані в інформацію, на основі якої можна приймати рішення, тобто підтримуюче прийняття рішень.

Gartner Group визначає склад ринку систем Business Intelligence як набір програмних продуктів наступних класів:

  • засоби побудови сховищ даних (data warehousing, ХД);

  • системи оперативної аналітичної обробки (OLAP);

  • інформаційно-аналітичні системи (Enterprise Information Systems, EIS);

  • засоби інтелектуального аналізу даних (data mining);

  • інструменти для виконання запитів і побудови звітів (query and reporting tools).

Класифікація Gartner базується на методі функціональних завдань, де програмні продукти кожного класу виконують певний набір функцій або операцій з використанням спеціальних технологій.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]