Интеллектуальный анализ данных

Собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пиатецким-Шапиро в 1989 году (Data Mining).

Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики.

Одно из важнейших назначений методов Data Mining состоит в наглядном представлении результатов вычислений, что позволяет использовать инструментарий Data Mining людьми, не имеющих специальной математической подготовки.

Постановка задачи.

Первоначально, задача ставится следующим образом:

имеется достаточно крупная база данных;
предполагается, что в базе данных находятся некие «скрытые знания».

Необходимо разработать методы обнаружения знаний, скрытых в больших объёмах исходных «сырых» данных. «Cкрытыми знаниями» называют знания, обладающие следующими свойствами:

ранее не известные — то есть такие знания, которые должны быть новыми (а не подтверждающими какие-то ранее полученные сведения);
нетривиальные — то есть такие, которые нельзя просто так увидеть (при непосредственном визуальном анализе данных или при вычислении простых статистических характеристик);
практически полезные — то есть такие знания, которые представляют ценность для исследователя или потребителя;
доступные для интерпретации — то есть такие знания, которые легко представить в наглядной для пользователя форме и легко объяснить в терминах предметной области.

Эти требования во многом определяют суть методов Data mining и то, в каком виде и в каком соотношении в технологии Data mining используются системы управления базами данных, статистические методы анализа и методы искусственного интеллекта.

Имитационное моделирование

Имитационное моделирование (ситуационное моделирование) — метод, позволяющий строить модели, описывающие процессы так, как они проходили бы в действительности. Такую модель можно «проиграть» во времени как для одного испытания, так и заданного их множества. При этом результаты будут определяться случайным характером процессов. По этим данным можно получить достаточно устойчивую статистику.

Экспериментирование с моделью называют имитацией (имитация — это постижение сути явления, не прибегая к экспериментам на реальном объекте).

Имитационная модель — логико-математическое описание объекта, которое может быть использовано для экспериментирования на компьютере в целях проектирования, анализа и оценки функционирования объекта.

К имитационному моделированию прибегают, когда :

дорого или невозможно экспериментировать на реальном объекте;
невозможно построить аналитическую модель: в системе есть время, причинные связи, последствие, нелинейности, стохастические (случайные) переменные;
необходимо сымитировать поведение системы во времени.

Цель имитационного моделирования состоит в воспроизведении поведения исследуемой системы на основе результатов анализа наиболее существенных взаимосвязей между ее элементами или другими словами — разработке симулятора (англ. simulation modeling) исследуемой предметной области для проведения различных экспериментов.

Имитационное моделирование позволяет имитировать поведение системы во времени. Причём плюсом является то, что временем в модели можно управлять: замедлять в случае с быстропротекающими процессами и ускорять для моделирования систем с медленной изменчивостью. Можно имитировать поведение тех объектов, реальные эксперименты с которыми дороги, невозможны или опасны. С наступлением эпохи персональных компьютеров производство сложных и уникальных изделий, как правило, сопровождается компьютерным трёхмерным имитационным моделированием. Эта точная и относительно быстрая технология позволяет накопить все необходимые знания, оборудование и полуфабрикаты для будущего изделия до начала производства. Компьютерное 3D моделирование теперь не редкость даже для небольших компаний.

Имитация, как метод решения нетривиальных задач, получила начальное развитие в связи с созданием ЭВМ в 1950-х — 1960-х годах.

Можно выделить две разновидности имитации:

Метод Монте-Карло (метод статистических испытаний);
Метод имитационного моделирования (статистическое моделирование).

Области применения: бизнес-процессы, боевые действия, динамика населения, дорожное движение, IT-инфраструктура, математическое моделирование исторических процессов, логистика, производство, рынок и конкуренция, сервисные центры, уличное движение, управление проектами, экосистема, информационная безопасность.

Примером свободно распространяемых ПО для имитационного моделирования могут служить: Scilab ((читается Сайлэб) пакет прикладных математических программ, предоставляющий мощное открытое окружение для инженерных (технических) и научных расчётов.), Maxima (свободная система компьютерной алгебры, написанная на языке Common Lisp). Примером коммерческих продуктов являются системы имитационного моделирования, такие как MATLAB ((сокращение от англ. «Matrix Laboratory», в русском языке произносится как Матла́б) — пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете.), AnyLogic (ПО для имитационного моделирования бизнес-процессов, разработанное российской компанией «Экс Джей Текнолоджис» (англ. XJ Technologies). Инструмент обладает современным графическим интерфейсом и позволяет использовать язык Java для разработки моделей) и др.

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.03.201531.69 Кб34Сильные стороны.docx
#
13.11.2019133.63 Кб10Слайд к занятию № 2 ВУК.doc
#
09.11.2019182.27 Кб12Слайды к занятию №1-ВУК.doc
#
24.03.20151.51 Mб61сопромат.doc
#
24.11.20194.49 Mб11Список вопросов к семинару 1.rtf
#
19.09.201937.58 Кб2СППР.docx
#
10.11.2019176.64 Кб3Средства и методы УК -лекция №1.doc
#
24.03.2015350.49 Кб8Т-03-Л-совокупный спрос и предложение.pdf
#
24.03.20154.01 Mб8ТАЛАНТ БЕК.doc
#
06.12.2018555.52 Кб2Текст лекции_8(14).doc
#
24.03.2015461.82 Кб127Тема 16. Планирование эксперимента.doc