- •Министерство образования и науки российской федерации
- •Теоретическая часть
- •Задача кластерного анализа
- •1.2 Методы кластерного анализа.
- •1.3 Алгоритмы кластеризации
- •1.4 Число кластеров
- •1.5 Дендограммы
- •Практическая часть
- •1 3 6 2 8 4 9 10 7 5
- •Пример решения в программе spss 11.0
- •Пример решения в программе statistica
- •Задание к лабораторной работе
- •Заключение
- •Список литературы
- •Приложение
Практическая часть
Пример
Агломеративный иерархический алгоритм
Изучались результаты мониторирования ЭКГ во время физических тренировок и нагрузочных тестов (велоэргометрии) у 10 больных, верифицированной методом коронаровентрикулографии. Всем больным проводились велоэргометрия и холтеровское мониторирование ЭКГ. Анализировались частота сердечных сокращений, величины площади волны Р, сегмента PQ, депрессии сегмента ST в динамике. Перечень и методика измерений комплекса регистрируемых на ЭКГ параметров приведены на рис. 2.
Рис 2. Общая схема фиксации показаний ЭКГ с традиционными обозначениями зубцов (А) и методика измерения с целью углубленного изучения и нацеленного применения (Б).
Обозначения: P1 – ширина основания зубца Р (мм); Р2 - ширина вершины зубца Р (мм); РН - высота зубца Р (мм); PQ – продолжительность сегмента PQ (мм); ∆ST – степень депрессии сегмента ST (мм), измеряемая в точке, отстоящей на 0.07 сек от окончания комплекса QRS, HR – частота сердечных сокращений.
Пусть заданы следующие показатели, снятые у 10 пациентов:
Произведем нормирование данных:
В качестве меры расстояния возьмем квадрат евклидовой метрики di j2. и вычислим матрицу D = {di j2}, где di j2 - квадрат расстояния между Ι i и Ι j:
Найдем минимальное расстояние в матрице: min{di j2, i j} = 1.47 при i = 1, j = 3. Образуем с помощью Ι i и Ι j новый кластер {Ι i , Ι j}. Построим новую матрицу расстояния:
dij |
{1+3} |
2 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
{1+3} |
0 |
2.8 |
3.88 |
5.36 |
2.44 |
3.34 |
2.72 |
3.61 |
3.59 |
2 |
|
0 |
2.26 |
4.3 |
3.37 |
3.77 |
2.14 |
2.8 |
4.29 |
4 |
|
|
0 |
3.65 |
3.83 |
4.66 |
3.28 |
1.64 |
1.8 |
5 |
|
|
|
0 |
3.61 |
4.53 |
5.29 |
4.14 |
4.26 |
6 |
|
|
|
|
0 |
3.28 |
4.27 |
3.99 |
4.03 |
7 |
|
|
|
|
|
0 |
3.52 |
4.36 |
4.63 |
8 |
|
|
|
|
|
|
0 |
2.65 |
2.96 |
9 |
|
|
|
|
|
|
|
0 |
1.52 |
10 |
|
|
|
|
|
|
|
|
0 |
Расстояние между кластером i + j и некоторым другим кластером k равно минимальному из этих двух расстояний:
di+j,k = min (di k + dj k).
Последующие шаги аналогичны.
Получим следующую последовательность разбиений:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10 min(dij) =1.47
2, 4, 5, 6, 7, 8, 9, 10 min(dij) =1.52
2, 4, 5, 6, 7, 8, min(dij) =1.64
2, , 5, 6, 7, 8 min(dij) =2.14
, , 5, 6, 7 min(dij) =2.26
()(), 5, 6, 7 min(dij) =2.44
()6,()(), 5, 7 min(dij) =2.72
(()6)(()()),5,7 min(dij) =3.28
((()6)(()()))7, 5min(dij) =3.61
(((()6)(()()))7)5
Дендрограмма представлена на рис. 3.