- •Министерство образования и науки российской федерации
- •Теоретическая часть
- •Задача кластерного анализа
- •1.2 Методы кластерного анализа.
- •1.3 Алгоритмы кластеризации
- •1.4 Число кластеров
- •1.5 Дендограммы
- •Практическая часть
- •1 3 6 2 8 4 9 10 7 5
- •Пример решения в программе spss 11.0
- •Пример решения в программе statistica
- •Задание к лабораторной работе
- •Заключение
- •Список литературы
- •Приложение
1 3 6 2 8 4 9 10 7 5
Рис. 3
На основании полученной дендрограммы можно разбить исходную выборку примерно на два основных кластера (по значению минимального расстояния min(dij)2.6): (1, 3, 6) и (2, 8, 4, 9, 10). Это говорит о том, что в данной выборке (из10 больных) присутствуют два различных заболевания (например, желудочковая экстрасистолия и ишемическая дисфункция левого желудочка).
Пример решения в программе spss 11.0
Запустите программу SPSS 11.
Выберите в меню Fail… (файл) New… (новый) Data… (данные)
Заполните матрицу данных предварительно нормированными значениями в соответствии с вариантом. В панели данных введите заданные данные, а в панели вид переменной задайте имя и тип переменной.
4) Выберите в меню Analyze (Анализ) Classify (Классифицировать) Hierarchical Cluster... (Иерархический кластерный анализ). Перенесите значения (p1, p2, ph, pq, hr, st) в поле переменных.
5) В меню статистика поставьте галочку в поле proximity matrix и нажмите кнопку продолжить.
6) В меню графики поставьте галочку в поле dendrogram и выберите положение дендрограммы (вертикальное или горизонтальное) и нажмите кнопку продолжить.
7) В меня метод выберите способ расчета расстояния(в нашем случае евклидово растояние), и метод кластерного анализа (в нашем случае ближайший сосед) и нажмите кнопку продолжить.
8) Ничего больше не меняя, начните расчет нажатием кнопки ОК.
Вывод основных результатов выглядит следующим образом:
_
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Single Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1
3
6
9
10
4
2
8
7
5
Результат соответствует результатам, полученным в программе MathCAD.
Пример решения в программе statistica
1) Запустите программу STATICTICA 6.0
Выберите в меню Файл…Новый…создайте таблицу данных.
Заполните матрицу данных нормированными значениями, заданными в соответствии с вариантом.
Выберите в меню Статистика…Многомерные исследовательские методы…Анализ кластера…Joining(Tree clustering). Далее в меню Variables выделите значения и нажмите кнопку ОК.
В меню Advanced выберите способ расчета расстояния метод кластерного анализа и нажмите кнопку ОК.
В полученном окне выбираем Distance matrix.
И получаем матрицу расстояний:
При нажатии кнопки Horizontal hierarchical tree plots получаем дендрограмму
Результат соответствует результатам, полученным в программе MathCAD и SPSS.