Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

566_Lazareva_a._JU._Kolichestvennye_metody_sotsiologicheskogo_issledovanija_

.pdf
Скачиваний:
2
Добавлен:
12.11.2022
Размер:
679.14 Кб
Скачать

Таблица 3. Финальные кластерные центры (Final Cluster Centers)

Основания классификации (группирующие при-

Cluster (Кластер)

знаки)

 

 

1

2

 

 

 

 

 

 

 

 

REGR factor score

1 for analysis

2

 

 

(неудовлетворенность состоянием социальной

0,49568

-0,32674

сферы)

 

 

 

 

 

 

 

 

 

REGR factor score

2 for analysis

2

 

 

(неудовлетворенность развитием инфраструк-

0,87020

-0,57362

туры)

 

 

 

 

 

 

 

 

 

Таблица 4. Однофакторный дисперсионный анализ (ANOVA)

 

 

Cluster (мо-

Error (ошибки)

 

 

 

 

дель)

 

 

 

 

 

 

 

 

 

 

Основания классификации

 

Mean

 

 

Mean

 

F

Sig.

 

Square

 

 

Square

 

(группирующие признаки)

 

 

 

 

 

 

 

(сред-

 

df

(сред-

df

 

 

 

 

 

 

 

 

 

ний

 

 

ний

 

 

 

 

 

квадрат)

 

 

квадрат)

 

 

 

REGR factor score 1 for analysis

2

71,748

 

1

0,840

441

85,47

0,00

(неудовлетворенность состоянием

 

социальной сферы)

 

 

 

 

 

 

 

 

REGR factor score 2 for analysis

2

221,129

 

1

0,501

441

441,5

0,00

(неудовлетворенность развитием

 

инфраструктуры)

 

 

 

 

 

 

 

 

Таблица 5. Количество объектов в группе (Number of Cases in each Cluster)

Cluster

1

176,000

Кластер

2

267,000

Valid

 

443,000

(Действительные случаи)

 

 

 

 

Missing

 

732,000

(Пропущенные значения)

 

 

 

 

Трехкластерное решение

Таблица 6. Финальные кластерные центры (Final Cluster Centers)

Основания классификации (группирующие при-

Cluster (кластер)

 

 

знаки)

 

1

2

 

3

REGR factor score

1 for analysis

2

 

 

 

 

(неудовлетворенность состоянием социаль-

0,87989

0,01365

 

-0,82789

ной сферы)

 

 

 

 

 

 

 

 

 

 

 

 

 

REGR factor score

2 for analysis

2

 

 

 

 

(неудовлетворенность развитием инфра-

-0,43703

1,49221

 

-0,46605

структуры)

 

 

 

 

 

 

 

 

 

 

 

 

 

51

Таблица 7. Однофакторный дисперсионный анализ (ANOVA)

 

 

Cluster

 

Error

 

 

Основания классификации (группирующие

 

 

 

Mean

 

 

 

признаки)

 

Mean

 

 

Squar

 

F

Sig.

 

 

Square

 

df

e

df

 

 

 

 

 

 

 

 

 

 

 

REGR factor score 1 for analysis

2

 

 

 

 

 

 

 

(неудовлетворенность состоянием

123,809

 

2

0,442

440

280,252

0,000

социальной сферы)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

REGR factor score 2 for analysis

2

 

 

 

 

 

 

 

(неудовлетворенность развитием

149,450

 

2

0,325

440

459,524

0,000

инфраструктуры)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 8. Количество объектов в группе (Number of Cases in each Cluster)

Cluster

1

(первый кластер)

164,000

Кла-

2

(второй кластер)

103,000

стер

 

 

 

3

(третий кластер)

176,000

 

 

 

 

 

 

 

Valid

 

 

443,000

(Действительные случаи)

 

 

 

 

 

Missing

 

 

732,000

(Пропущенные значения)

 

 

 

 

 

Таблица 9. Перераспределение объектов для 2-х и 3-х кластерной моделей

 

 

Cluster Number of Case

 

 

 

Номер кластера (модель 1)

Всего

 

 

1

2

3

 

Cluster Number of Case

1

74

102

0

176

Номер кластера (модель 2)

2

90

1

176

267

Всего

 

164

103

176

443

52

3

2

1

0

-1

-2

-3

-2

-

0

1

2

3

Рис. 1. Пространственная классификация объектов для двухкластерного решения

3

2

1

0

-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

-2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

-3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

-2

-1

 

 

0

 

 

1

2

3

Рис. 2. Пространственная классификация объектов для трехкластерного решения

53

2.14.Справочные и вспомогательные таблицы

Втаблице перечислены параметрические тесты и их непараметрические аналоги. Данная информация полезна при выборе адекватного математико-статистического метода с учетом шкалы измерения признака и типа его распределения.

Впрограмме SPSS могут быть реализованы все указанные в таблице тесты.

Соотношение параметрических и непараметрических методов

Параметрические методы сравнения средних

 

Непараметрические методы сравнения распределений

 

Одновыборочные тесты

 

 

Критерий Хи-квадрат (номинальные, ранговые)

Одновыборочный t-тест

 

Биномиальный одновыборочный тест (дихотомические переменные)

 

 

Критерий Колмогорова-Смирнова (интервальные)

Тесты для 2-х независимых групп (выборок)

t-критерий для 2-х независимых выборок

 

Критерий Манна-Уитни (интервальные, ранговые)

 

Двухвыборочный тест Колмогорова-Смирнова (интервальные)

 

 

Тесты для нескольких независимых групп (более 2-х выборок)

 

 

Ранговый дисперсионный анализ Краскела-Уоллиса (ранговые,

Дисперсионный анализ для нескольких групп

 

 

интервальные)

 

 

Медианный тест (ранговые, интервальные)

Тесты для 2-х зависимых групп (выборок)

 

 

Критерий знаков (ранговые, интервальные)

t-критерий для 2-х зависимых выборок

 

Критерий Вилкоксона парных сравнений (ранговые, интервальные)

 

 

Хи-квадрат МакНемара (номинальные, ранговые)

Тесты для нескольких зависимых групп (более 2-х выборок)

Дисперсионный анализ с повторными измерениями

 

Ранговый дисперсионный анализ Фридмана (ранговые, интервальные)

 

 

Критерий Кохрена (номинальные, ранговые)

 

Зависимость между переменными

 

 

Коэффициент ранговой корреляции Спирмена

Коэффициент корреляции Пирсона

 

Коэффициент Кендалла, Стюарта (тау) – ранговые переменные

 

Хи-квадрат (номинальные переменные) + производные от него

 

 

 

 

Коэффициент лямбда (номинальные переменные)

 

 

 

54

2.15. Полезные опции в процедуре регрессионного анализа

Тип зависимой и независимой (независимых) переменных накладывает ограничения на возможности построения той или иной модели регрессии. В табл. 1 представлены различные регрессионные модели и соответствующие им процедуры пакета SPSS. Информация табл. 2 полезна для проведения детального анализа построенной регрессионной модели, а также она содержит описание стандартных опций и статистик модели линейной регрессии.

Таблица 1. Модели регрессионного анализа

Название

Тип переменной

Процедура

регрессионной модели

зависимая

независимые

 

Множественная

количественная

- количественная

Linear

линейная регрессия

- ранговая

 

 

Логистическая

-дихотомическая

любые

Binary Logistic

регрессия

- интервальная

 

 

Мультиноминальная

-номинальная

 

 

логистическая

любые

Multinominal logistic

-ранговая

регрессии

 

 

 

 

 

Порядковая регрессия

-ранговая

-ранговая

Ordinal

-номинальная

Nonlinear

 

 

Таблица 2. Полезные опции в процедуре линейной регрессии (Linear)

Название опции

Обозначение

Реализуемая возможность

STATISTICS

 

 

 

 

Среднее, стандартное отклонение

Описательные

Descriptive statistics

для зависимой переменной и

статистики

независимых признаков. Можно

 

 

 

использовать для общего описания

 

 

Проверка (на основе значений

Матрица ковариации и

Covariance matrix

коэффициента корреляции Пирсона)

корреляции

степени связанности независимых

 

 

 

признаков между собой

 

 

Получение коэффициента

Диагностика

 

толерантности для каждой

Collinearity diagnostics

независимой переменной (Т=0,

мультиколлинеарности

 

 

признак линейно связан с другими

 

 

независимыми признаками)

Коэффициент

Durbin-Watson

Проверка связанности остатков

Дурбина-Уотсона

модели (Н0: остатки не связаны)

 

PLOTS

 

 

Гистограмма

 

 

стандартизованных

 

Проверка нормальности

остатков с наложением

Standardized residual plots

распределения остатков модели

кривой нормального

 

(глазомерный способ)

распределения

 

 

Диаграммы частных

 

Графическое изображение Т-

Produce all partial plots

статистик для каждого

остатков

 

независимого признака или его

 

 

55

Название опции

Обозначение

Реализуемая возможность

 

 

частные корреляции с зависимой

 

 

переменной после удаления

 

 

линейного влияния других

 

 

переменных модели

SAVE

 

 

Стандартизованные

 

Сохранение в качестве новой

(нормированные)

Standardized residual

переменной стандартизованного

остатки

 

остатка для каждого объекта

OPTIONS

 

 

Пропущенные

Missing Values

 

значения

 

 

 

Исключение «полным

Exclude cases listwise

Решение проблемы пропущенных

листом»

 

значений

Исключение попарно

Exclude cases pairwise

 

Замена средним

Replace with mean

 

значением

 

 

 

2.16.Полезные опции в процедуре факторного анализа

Втаблицы представлены различные опции, реализованные в процедуре факторного анализа в пакете SPSS: названия частных процедур и задачи, решаемые с их помощью.

Название опции

Обозначение

Реализуемая возможность

 

 

 

DESCRIPTIVES

 

 

 

 

Среднее, стандартное отклонение

Описательные статистики

Univariate descriptives

Можно использовать для общего

 

 

описания

 

 

Критерий сферичности Барлетта Н0:

 

 

корреляция между признаками в ГС

 

 

отсутствует. Если принимается

 

 

нулевая гипотеза, то проведение

 

 

процедуры ФА на заданных

Критерии проверки

KMO and Barlett’s test

признаках вызывает сомнения.

Критерий адекватности выборки

адекватности

of sphericity

Кайзера-Мейера-Олкина Н0:

использования ФА

 

корреляции между парами

 

 

 

 

переменных (частные корреляции)

 

 

нельзя объяснить другими

 

 

переменными. Если принимаем

 

 

нулевую гипотезу, то использования

 

 

ФА нецелесообразно

EXTRACTION

 

 

Метод построения

 

По умолчанию «метод главных

Method

компонент», но можно выбрать и

факторов

 

другие из списка

 

 

-построение матрицы

 

 

корреляции (correlation

Analyse

-

matrix)

 

 

56

-построение матрицы

 

 

ковариации (covariance

 

 

matrix)

 

 

Собственное значение

 

-

исходного признака

Eigenvalues over «1»

 

больше «1»

 

 

Число факторов

Number of factors

Задается модель с определенным

числом факторов

 

 

График «осыпь»

Display/Scree plots

Дополнительный метод определения

оптимального числа факторов

 

 

ROTATION

 

 

 

 

Позволяет выделить контрастные

Методы вращения

 

значения факторных нагрузок, тем

Method/Varimax

самым, облегчая интерпретацию

факторов

 

факторов. Сохраняет углы между

 

 

 

 

факторами (т.е. ортогональность)

Отображение исходных

 

 

признаков в пространстве

Display/ Loading plot(s)

Иллюстративная функция

факторов

 

 

SCORE

 

 

 

 

Сохранение в качестве новой

 

 

переменной значений каждого

Сохранить как переменные

Save as variables

фактора. Предложено несколько

 

 

методов расчета значений фактора,

 

 

по умолчанию – регрессия

Коэффициенты значений

Factor Score Coefficient

Коэффициенты уравнения для

расчета значений фактора

фактора

Matrix

(факторных весов)

 

 

OPTIONS

 

 

Пропущенные значения

Missing Values

 

Исключение «полным

Exclude cases listwise

Решение проблемы пропущенных

листом»

 

значений

Исключение попарно

Exclude cases pairwise

 

Замена средним значением

Replace with mean

 

 

 

Упорядочивание факторных

 

 

нагрузок от наибольшей к

Сортировка по размеру

Sorted by size

наименьшей по каждому фактору

 

 

(удобно для представления данных в

 

 

таблице)

Не отражать абсолютные

Suppress absolute values

 

значения факторных

 

less than __(по

 

нагрузок, которые меньше

Для удобства представления данных

__

умолчанию 0.1)

 

 

 

 

 

 

SELECTION VARIABLE

 

 

Переменная, по значению

 

Задается одно значение некой

которой производится

Selection variable

переменной – оно рассматривается

отбор случаев для

как критерий отбора случаев для

 

проведения ФА

 

построения модели

57

2.17. Сводная таблица различий методов кластерного анализа

Иерархический кластерный анализ и анализ методом К-средних позволяют осуществлять таксономию объектов в заданном признаковом пространстве. Однако у каждого метода есть свои ограничения и преимущества, основные представлены в таблице.

Иерархический КА

Метод К-средних

Тип переменной-признака

Количественные

Количественные

Дихотомические

Дихотомические

Ранговые

Ранговые

Номинальные

 

Объем выборки

Менее 100 объектов (агрегировать массив,

Более 100 объектов

выборка случайным образом)

 

Определение числа кластеров

можно (но необязательно) задать вывод

необходимо задать число кластеров. Для

диапазона решений, сохранив как новую

разных кластерных решений необходимо

переменную принадлежность к кластеру

запускать процедуру несколько раз;

(save/range of solution) label: average linage

можно сохранить принадлежность к

between groups;

кластеру в качестве новой переменной

на основе анализа шагов объединения и

(save/ cluster membership) – label: average

дендрограммы выбрать оптимальное

linage between groups;

решение;

посмотреть наполненность групп

посмотреть наполненность групп.

 

Возможность нормирования

Есть (Method/ standardize/ Z-scores или Range

Необходимо провести стандартизацию до

-1 to 1 (0 to 1). 0 – минимальное значение, 1 –

включения признака в модель (например,

максимальное значение.

преобразовать в Z-статистики).

Меры сходства (расстояний)

Более 40 видов для разных типов

Евклидово расстояние

переменных

 

Приписывание объекта к кластеру

Объекты не могут переходить из кластера в

Объекты могут переходить из кластера в

кластер.

кластер

58

ЛИТЕРАТУРА Список основной литературы

1.Бююль А., Цефель П. SPSS: искусство обработки информации. – СПб: ООО «ДиасофтЮП», 2005. – 608с.

2.Девятко И. Ф. Методы социологического исследования. – М.: Книжный дом «Университет», 2002. – 295с.

3.Крыштановский А.О. Анализ социологических данных. – М., 2007

281с.

4.Малхотра Н. Маркетинговые исследования. – М.: Вильямс, 2003. –

563с.

5.Наследов А. SPSS: компьютерный анализ данных в психологии и социальных науках. – СПб., 2005. – 416с.

6.Ростовцев П.С., Ковалева Г.Д. Анализ социологических данных с применением статистического пакета SPSS: Учебно-методическое пособие.

Новосибирск: НГУ, 2002. – 160с.

7.Толстова Ю. Н. Анализ социологических данных. – М.: Научный мир, 2000. – 352с.

8.Сигель Э. Практическая бизнес-статистика. – М.: Вильямс, 2008. –

1056с.

9.Хили Дж. Статистика: социологические и маркетинговые исследования. – СПб.: Питер, 2005. – 638с.

10.SPSS BASE 8.0. Руководство пользователя. – М.:СПСС Русь, 1998. – 754с.

Рекомендуемые Интернет-ресурсы

1.Алексеева А.Ю., Ечевская О.Г., Ростовцев П.С., Ковалева Г.Д. Анализ социологических данных с применением статистического пакета SPSS. Сборник задач. – Новосибирск: НГУ, 2003. – URL: http://socionet.ru/publication.xml?h=repec:rus:nsusme:etchevskaya

2.Англо-русский статистический глоссарий. – URL: http://www.uran.donetsk.ua/~masters/2002/fvti/spivak/library/book2/book2.htm

3.Мангейм Дж. Б., Рич Р. К. Политология. Методы исследования: Пер. с англ. / Предисл. А.К. Соколова. – М.: Издательство “Весь Мир”, 1997. – 544 с. – URL: http://grachev62.narod.ru/Mr/

4.Сообщество пользователей SPSS в Живом Журнале («SPSS в психологии и социальных науках») – URL:

http://community.livejournal.com/ru_spss/

5.Тексты по статистике / – URL: http://forum.gfk.ru/texts/

6.Электронный учебник StatSoft. – URL: http://www.statsoft.ru/statportal/tabID__44/DesktopDefault.aspx

59

Учебное издание

Лазарева А.Ю.

Количественные методы социологического исследования

Учебно-методическое пособие по дисциплине «Количественные методы социологического исследования»

Редактор В.К. Трофимов Корректор И.Л. Гончарова

Подписано в печать 17.02.2015,

формат бумаги 60x84/16, отпечатано на ризографе, шрифт 10, изд. л. 4,0, заказ № 17, тираж 50 экз.

630102, г. Новосибирск, ул. Кирова, 86, офис 107 тел. (383) 269-83-56

Издательский центр СибГУТИ