Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по диагностике ИР.doc
Скачиваний:
19
Добавлен:
26.11.2018
Размер:
899.58 Кб
Скачать

Занятие 7. Группировка испытуемых. Кластерный анализ

Вводные замечания. Кластерный анализ решает задачу построения классификации, т.е. разделения исходного множества объектов на группы (классы, кластеры). В психологических исследованиях часто возникают задачи:

  • разбиения однородной совокупности испытуемых на группы по измеренным признакам;

  • - построения типологических различий между испытуемыми по измеренным признакам;

  • -исследование группировки признаков, измеренных на выборке испытуемых.

При этом исследователь располагает лишь информацией о характеристиках объектов, которая позволяет судить о сходстве

( различии) объектов.

Кластерный анализ – это процедура упорядочивания объектов в сравнительно однородные классы на основе попарного сравнения этих объектов по предварительно определенным и измеренным критериям ( А.Д.Наследов.,1998, с.23).

В зависимости от цели исследования объектами могут быть испытуемые или признаки, измеренные на группе испытуемых. В зависимости от этого выбирают классификацию по испытуемым или классификацию по переменным.

В отличие от факторного анализа, который сжимает данные в меньшее число количественных переменных (факторы), кластерный анализ сжимает данные в классификацию объектов. Кластерный анализ является описательной процедурой, не позволяет сделать никаких статистических выводов, но дает возможность изучить структуру совокупности (испытуемых, признаков).

В психологии используют иерархический кластерный анализ и быстрый кластерный анализ. Процедура иерархического кластерного анализа в SPSS предусматривает группировку как объектов (строк матрицы данных), так и переменных

(столбцов). Перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Вначале выбирается пара ближайших кластеров, которые объединяются в один кластер и так далее, пока все кластеры не объединятся. На любом этапе объединение можно прервать, получив нужное число кластеров.

Для определения расстояний между парой кластеров могут применяться различные методы:

cреднее расстояние между кластерами ( Between groups linkage);

-среднее расстояние между всеми объектами пары кластеров с учетом расстояний внутри кластеров ( Within groups linkage );

-расстояние между ближайшими соседями (Nearest neighbor );

-расстояние между самыми далекими соседями( Furthest neighbor);

-расстояние между центрами кластеров (Centroid clustering ).

Цель. Провести группировку испытуемых по измеренным признакам.

Порядок работы.

1. Таблица данных.

2. Процедура кластерного анализа. Меню - Statistics, подменю- Classify, а в нем –K - Means Cluster ( или Hierarchical Cluster). После вызова процедуры KА в правом окне выделите мышкой нужные переменные и перенесите их в окно Variables , нажав на кнопку со стрелкой.

Следующий этап работы- выбор параметров работы процедуры KА. В разделе Number of clusters отметьте необходимое

( предполагаемое) число кластеров.

Далее выбирают конкретный метод кластеризации – укажите Iterate and classify.

В разделе Iterate все параметры установлены оптимальным образом. В разделе Save отметьте Cluster Membership. В разделе Option выберите Cluster information for each case. После установки всех параметров (в каждом разделе не забудьте нажимать кнопку Continue) для начала выполнения процедуры КА следует нажать кнопку OK .

Все текстовые результаты заносятся в окно Qutput . Графические результаты находятся в окне Chart Carusel.

Пример. Рассмотрим применение КА на выборке учащихся 6-х классов ( n=85) с измеренными характеристиками тревожности.

Необходимо выделить группы «тревожных» учащихся для последующих тренинговых занятий с целью уменьшения основных структурных компонентов тревожности.

Если кластеризации подвергается большая группа испытуемых с достаточным количеством измеренных признаков, тогда более приемлем быстрый алгоритм, который называется методом « k – средних». Часто переменные имеют разный диапазон изменений, т.к. они измерены в разных шкалах. В таких случаях основное влияние на кластеризацию окажут переменные, имеющие большую дисперсию. Поэтому перед кластеризацией полезно стандартизовать переменные (в отличие от иерархического КА, в «быстром» КА средства стандартизации не предусмотрены.

1.Кластеризации подверглись 85 испытуемых с измеренными признаками школьной тревожности по методике Филлипса

( см. табл.3. Прилож.3 ):

VAR00001 - общая тревожность в школе;

VAR00002 – переживание социального стресса;

VAR00003 – фрустрация потребности в достижении успеха;

VAR00004 – страх самовыражения;

VAR00005 – страх ситуации проверки знаний;

VAR00006 – страх несоответствовать ожиданиям окружающих;

VAR00007 – низкая физиологическая сопротивляемость стрессу;

VAR00008 – проблемы и страхи в отношениях с учителями.

2.Для стандартизации мы использовали команду Descriptive, с помощью которой одновременно получаем параметры распределения измеренных признаков (средние арифметические и стандартные отклонения) –см. табл.9.

Табл.9.

Описательная статистика

Descriptive Statistics

N

Minimum

Maximum

Mean

Std. Deviation

VAR00001

85

,00

19,00

9,1882

5,4215

VAR00002

85

,00

10,00

3,9176

1,9470

VAR00003

85

1,00

11,00

4,6706

2,1624

VAR00004

85

,00

6,00

2,6000

1,6562

VAR00005

85

,00

6,00

3,3529

1,5939

VAR00006

85

,00

5,00

2,2588

1,3986

VAR00007

85

,00

4,00

1,3059

1,0804

VAR00008

85

1,00

7,00

3,5529

1,5158

Valid N (listwise)

85

Описательная статистика дает нам рабочие ориентиры для выделения уровней школьной тревожности исследованной выборки школьников.

3. Информация о том, в какие кластеры попадают испытуемые с соответствующими номерами и дистацией от центра кластера отражена в табл. 10.

Табл. 10

Список испытуемых, относящихся к определенному кластеру

Cluster Membership

Case Number

Cluster

Distance

1

2

4,583

2

1

3,730

3

5

2,400

4

3

4,881

5

5

2,914

6

3

2,364

7

5

2,651

8

3

4,889

9

2

4,866

10

5

4,505

11

3

4,185

12

5

3,301

13

3

4,329

14

3

4,294

15

3

3,909

16

5

3,591

17

3

3,393

18

3

5,223

19

4

3,706

20

5

3,842

21

4

4,465

22

1

4,329

23

3

6,473

24

4

5,927

25

4

4,351

26

1

4,368

27

1

2,722

28

1

3,616

29

4

4,820

30

2

4,124

31

4

3,396

32

4

4,619

33

2

4,263

34

4

3,890

35

3

2,476

36

5

4,037

37

5

1,740

38

2

3,343

39

4

4,726

40

3

3,909

41

3

3,336

42

3

2,865

43

5

2,688

44

2

3,343

45

5

1,681

46

2

3,137

47

1

2,564

48

3

4,729

49

3

2,810

50

4

1,770

51

1

6,763

52

3

4,928

53

3

3,207

54

2

3,583

55

4

4,235

56

5

3,341

57

4

3,651

58

4

3,838

59

3

3,987

60

3

3,890

61

1

2,691

62

2

4,204

63

4

4,199

64

4

2,221

65

4

3,366

66

1

2,842

67

4

1,622

68

1

3,499

69

4

2,266

70

2

3,765

71

4

4,520

72

3

3,666

73

4

3,719

74

2

3,343

75

5

1,600

76

5

2,821

77

3

2,124

78

2

2,238

79

1

5,852

80

1

3,707

81

3

3,830

82

3

3,370

83

3

3,676

84

3

3,686

85

5

2,903

Эта информация необходима для определения учащихся

« группы риска» (высокая тревожность), которые входят в кластеры с соответствующими характеристиками.

4. Распределение испытуемых по кластерам (наполняемость кластеров) представлены в табл.11.

Табл.11.

Количество испытуемых в кластерах

Number of Cases in each Cluster

Cluster

1

12,000

2

12,000

3

26,000

4

20,000

5

15,000

Valid

85,000

Missing

,000

Распределение по кластерам относительно равномерное, выделяются по объему 3 и 4 кластеры.

5. Интерпретация кластеров осуществляется на основе сравнения средних значений (центров кластеров), представленных в табл.12.

Табл.12

Центры кластеров

Final Cluster Centers

Cluster

1

2

3

4

5

VAR00001

11,17

4,25

8,92

16,60

2,13

VAR00002

5,33

5,50

3,04

4,45

2,33

VAR00003

7,08

5,00

3,65

5,80

2,73

VAR00004

3,25

1,67

2,54

3,80

1,33

VAR00005

3,58

2,08

3,62

4,95

1,60

VAR00006

3,50

1,42

2,04

3,25

1,00

VAR00007

1,67

,75

1,08

2,15

,73

VAR00008

5,00

3,58

2,69

4,55

2,53

Кластер 1. – учащиеся (12) с повышенной общей школьной тревожностью, с повышенным уровнем переживания социального стресса, с повышенной фрустрацией потребности в достижении успеха, с повышенным страхом несоответствовать ожиданиям окружающих, с повышенным уровнем проблем и страхов в отношениях с учителями.

Кластер 2. - учащиеся (12) с уровнем общей школьной тревожности ниже среднего по данной выборке, средневыраженными переживаниями социального стресса, средними показателями страха самовыражения, редко испытывающие страх ситуации проверки знаний и страх несоответствовать ожиданиям окружающих, не имеют особенных проблем в отношениях с учителями.

Кластер 3. – учащиеся ( 26) со средними показателями по всем переменным.

Кластер 4. - учащиеся (20) « группы риска», с высокими показателями общей школьной тревожности.

Кластер 5.- учащиеся (15) « спокойные», с низкими показателями по всем переменным.

Т.о., с помощью кластерного анализа удалось выделить группы учащихся по уровням школьной тревожности: высокотревожные, с повышенной тревожностью, среднетревожные, слаботревожные, спокойные. По табл.10 мы можем определить кодовые номера тех учащихся, с которыми необходимо проводить специальные коррекционные или тренинговые занятия по снижению уровня тревожности ( напр. 19, 21, 24, 25, 29, 31, 32, 34, 39, 50, 55, 52,58, 63, 64, 65, 67, 69,71, 73 ).

Контрольные задания.

1. Провести группировку испытуемых по измеренным признакам.

2. Выявить наиболее и наименее информативные переменные для классификации.

3. Определить на основе доминирующих переменных уровни изучаемого обобщенного признака.

Рекомендуемая литература

1. Артемьева Е.Ю., Мартынов Е.М. Вероятностные методы в психологии. М.: Изд-во МГУ,1975.

2. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982.

  1. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии.М.: Прогресс,1976.

  2. Гусев А.Н., Измайлов Ч.А.,Михалевская М.Б. Измерение в психологии. М.: Смысл, 1997.

  3. Наследов А.Д. Многомерные методы математической обработки в психологии. СПб.: Изд-во СПб. Ун-та,1998.

6. Руководство пользователя. SPSS Base 8.0.М.: СПСС Русь,1998.

7. Сидоренко Е.В. Методы математической обработки в психологии. СПб.: Социально-психологический центр,1996.

  1. Суходольский Г.В. Основы математической статистики для психологов. Л.: Изд-во ЛГУ, 1972.