566_Lazareva_a._JU._Kolichestvennye_metody_sotsiologicheskogo_issledovanija_
.pdfТаблица 3. Финальные кластерные центры (Final Cluster Centers)
Основания классификации (группирующие при- |
Cluster (Кластер) |
|||
знаки) |
|
|
1 |
2 |
|
|
|
||
|
|
|
|
|
REGR factor score |
1 for analysis |
2 |
|
|
(неудовлетворенность состоянием социальной |
0,49568 |
-0,32674 |
||
сферы) |
|
|
|
|
|
|
|
|
|
REGR factor score |
2 for analysis |
2 |
|
|
(неудовлетворенность развитием инфраструк- |
0,87020 |
-0,57362 |
||
туры) |
|
|
|
|
|
|
|
|
|
Таблица 4. Однофакторный дисперсионный анализ (ANOVA)
|
|
Cluster (мо- |
Error (ошибки) |
|
|
|||
|
|
дель) |
|
|
|
|||
|
|
|
|
|
|
|
||
Основания классификации |
|
Mean |
|
|
Mean |
|
F |
Sig. |
|
Square |
|
|
Square |
|
|||
(группирующие признаки) |
|
|
|
|
|
|
||
|
(сред- |
|
df |
(сред- |
df |
|
|
|
|
|
|
|
|
||||
|
|
ний |
|
|
ний |
|
|
|
|
|
квадрат) |
|
|
квадрат) |
|
|
|
REGR factor score 1 for analysis |
2 |
71,748 |
|
1 |
0,840 |
441 |
85,47 |
0,00 |
(неудовлетворенность состоянием |
|
|||||||
социальной сферы) |
|
|
|
|
|
|
|
|
REGR factor score 2 for analysis |
2 |
221,129 |
|
1 |
0,501 |
441 |
441,5 |
0,00 |
(неудовлетворенность развитием |
|
|||||||
инфраструктуры) |
|
|
|
|
|
|
|
|
Таблица 5. Количество объектов в группе (Number of Cases in each Cluster)
Cluster |
1 |
176,000 |
|
Кластер |
2 |
267,000 |
|
Valid |
|
443,000 |
|
(Действительные случаи) |
|||
|
|||
|
|
|
|
Missing |
|
732,000 |
|
(Пропущенные значения) |
|||
|
|||
|
|
|
Трехкластерное решение
Таблица 6. Финальные кластерные центры (Final Cluster Centers)
Основания классификации (группирующие при- |
Cluster (кластер) |
|
||||
|
знаки) |
|
1 |
2 |
|
3 |
REGR factor score |
1 for analysis |
2 |
|
|
|
|
(неудовлетворенность состоянием социаль- |
0,87989 |
0,01365 |
|
-0,82789 |
||
ной сферы) |
|
|
|
|
|
|
|
|
|
|
|
|
|
REGR factor score |
2 for analysis |
2 |
|
|
|
|
(неудовлетворенность развитием инфра- |
-0,43703 |
1,49221 |
|
-0,46605 |
||
структуры) |
|
|
|
|
|
|
|
|
|
|
|
|
|
51
Таблица 7. Однофакторный дисперсионный анализ (ANOVA)
|
|
Cluster |
|
Error |
|
|
||
Основания классификации (группирующие |
|
|
|
Mean |
|
|
|
|
признаки) |
|
Mean |
|
|
Squar |
|
F |
Sig. |
|
|
Square |
|
df |
e |
df |
|
|
|
|
|
|
|
|
|
|
|
REGR factor score 1 for analysis |
2 |
|
|
|
|
|
|
|
(неудовлетворенность состоянием |
123,809 |
|
2 |
0,442 |
440 |
280,252 |
0,000 |
|
социальной сферы) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
REGR factor score 2 for analysis |
2 |
|
|
|
|
|
|
|
(неудовлетворенность развитием |
149,450 |
|
2 |
0,325 |
440 |
459,524 |
0,000 |
|
инфраструктуры) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 8. Количество объектов в группе (Number of Cases in each Cluster)
Cluster |
1 |
(первый кластер) |
164,000 |
|
Кла- |
2 |
(второй кластер) |
103,000 |
|
стер |
|
|
|
|
3 |
(третий кластер) |
176,000 |
||
|
|
|
||
|
|
|
|
|
Valid |
|
|
443,000 |
|
(Действительные случаи) |
||||
|
||||
|
|
|
|
|
Missing |
|
|
732,000 |
|
(Пропущенные значения) |
||||
|
||||
|
|
|
|
Таблица 9. Перераспределение объектов для 2-х и 3-х кластерной моделей
|
|
Cluster Number of Case |
|
||
|
|
Номер кластера (модель 1) |
Всего |
||
|
|
1 |
2 |
3 |
|
Cluster Number of Case |
1 |
74 |
102 |
0 |
176 |
Номер кластера (модель 2) |
2 |
90 |
1 |
176 |
267 |
Всего |
|
164 |
103 |
176 |
443 |
52
3
2
1
0
-1
-2
-3
-2 |
- |
0 |
1 |
2 |
3 |
Рис. 1. Пространственная классификация объектов для двухкластерного решения
3
2
1
0
-1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
-2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
-3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
-2 |
-1 |
|
|
0 |
|
|
1 |
2 |
3 |
Рис. 2. Пространственная классификация объектов для трехкластерного решения
53
2.14.Справочные и вспомогательные таблицы
Втаблице перечислены параметрические тесты и их непараметрические аналоги. Данная информация полезна при выборе адекватного математико-статистического метода с учетом шкалы измерения признака и типа его распределения.
Впрограмме SPSS могут быть реализованы все указанные в таблице тесты.
Соотношение параметрических и непараметрических методов
Параметрические методы сравнения средних |
|
Непараметрические методы сравнения распределений |
|
|
Одновыборочные тесты |
||
|
|
|
Критерий Хи-квадрат (номинальные, ранговые) |
Одновыборочный t-тест |
|
|
Биномиальный одновыборочный тест (дихотомические переменные) |
|
|
|
Критерий Колмогорова-Смирнова (интервальные) |
Тесты для 2-х независимых групп (выборок) |
|||
t-критерий для 2-х независимых выборок |
|
|
Критерий Манна-Уитни (интервальные, ранговые) |
|
|
Двухвыборочный тест Колмогорова-Смирнова (интервальные) |
|
|
|
||
Тесты для нескольких независимых групп (более 2-х выборок) |
|||
|
|
Ранговый дисперсионный анализ Краскела-Уоллиса (ранговые, |
|
Дисперсионный анализ для нескольких групп |
|
|
интервальные) |
|
|
|
Медианный тест (ранговые, интервальные) |
Тесты для 2-х зависимых групп (выборок) |
|||
|
|
|
Критерий знаков (ранговые, интервальные) |
t-критерий для 2-х зависимых выборок |
|
|
Критерий Вилкоксона парных сравнений (ранговые, интервальные) |
|
|
|
Хи-квадрат МакНемара (номинальные, ранговые) |
Тесты для нескольких зависимых групп (более 2-х выборок) |
|||
Дисперсионный анализ с повторными измерениями |
|
|
Ранговый дисперсионный анализ Фридмана (ранговые, интервальные) |
|
|
|
Критерий Кохрена (номинальные, ранговые) |
|
Зависимость между переменными |
||
|
|
Коэффициент ранговой корреляции Спирмена |
|
Коэффициент корреляции Пирсона |
|
Коэффициент Кендалла, Стюарта (тау) – ранговые переменные |
|
|
Хи-квадрат (номинальные переменные) + производные от него |
||
|
|
||
|
|
|
Коэффициент лямбда (номинальные переменные) |
|
|
|
54 |
2.15. Полезные опции в процедуре регрессионного анализа
Тип зависимой и независимой (независимых) переменных накладывает ограничения на возможности построения той или иной модели регрессии. В табл. 1 представлены различные регрессионные модели и соответствующие им процедуры пакета SPSS. Информация табл. 2 полезна для проведения детального анализа построенной регрессионной модели, а также она содержит описание стандартных опций и статистик модели линейной регрессии.
Таблица 1. Модели регрессионного анализа
Название |
Тип переменной |
Процедура |
||
регрессионной модели |
зависимая |
независимые |
||
|
||||
Множественная |
количественная |
- количественная |
Linear |
|
линейная регрессия |
- ранговая |
|||
|
|
|||
Логистическая |
-дихотомическая |
любые |
Binary Logistic |
|
регрессия |
- интервальная |
|||
|
|
|||
Мультиноминальная |
-номинальная |
|
|
|
логистическая |
любые |
Multinominal logistic |
||
-ранговая |
||||
регрессии |
|
|
||
|
|
|
||
Порядковая регрессия |
-ранговая |
-ранговая |
Ordinal |
|
-номинальная |
Nonlinear |
|||
|
|
Таблица 2. Полезные опции в процедуре линейной регрессии (Linear)
Название опции |
Обозначение |
Реализуемая возможность |
|
STATISTICS |
|
|
|
|
|
Среднее, стандартное отклонение |
|
Описательные |
Descriptive statistics |
для зависимой переменной и |
|
статистики |
независимых признаков. Можно |
||
|
|||
|
|
использовать для общего описания |
|
|
|
Проверка (на основе значений |
|
Матрица ковариации и |
Covariance matrix |
коэффициента корреляции Пирсона) |
|
корреляции |
степени связанности независимых |
||
|
|||
|
|
признаков между собой |
|
|
|
Получение коэффициента |
|
Диагностика |
|
толерантности для каждой |
|
Collinearity diagnostics |
независимой переменной (Т=0, |
||
мультиколлинеарности |
|||
|
|
признак линейно связан с другими |
|
|
|
независимыми признаками) |
|
Коэффициент |
Durbin-Watson |
Проверка связанности остатков |
|
Дурбина-Уотсона |
модели (Н0: остатки не связаны) |
||
|
|||
PLOTS |
|
|
|
Гистограмма |
|
|
|
стандартизованных |
|
Проверка нормальности |
|
остатков с наложением |
Standardized residual plots |
распределения остатков модели |
|
кривой нормального |
|
(глазомерный способ) |
|
распределения |
|
|
|
Диаграммы частных |
|
Графическое изображение Т- |
|
Produce all partial plots |
статистик для каждого |
||
остатков |
|||
|
независимого признака или его |
||
|
|
55
Название опции |
Обозначение |
Реализуемая возможность |
|
|
|
частные корреляции с зависимой |
|
|
|
переменной после удаления |
|
|
|
линейного влияния других |
|
|
|
переменных модели |
|
SAVE |
|
|
|
Стандартизованные |
|
Сохранение в качестве новой |
|
(нормированные) |
Standardized residual |
переменной стандартизованного |
|
остатки |
|
остатка для каждого объекта |
|
OPTIONS |
|
|
|
Пропущенные |
Missing Values |
|
|
значения |
|
||
|
|
||
Исключение «полным |
Exclude cases listwise |
Решение проблемы пропущенных |
|
листом» |
|||
|
значений |
||
Исключение попарно |
Exclude cases pairwise |
||
|
|||
Замена средним |
Replace with mean |
|
|
значением |
|
||
|
|
2.16.Полезные опции в процедуре факторного анализа
Втаблицы представлены различные опции, реализованные в процедуре факторного анализа в пакете SPSS: названия частных процедур и задачи, решаемые с их помощью.
Название опции |
Обозначение |
Реализуемая возможность |
|
|
|
|
|
DESCRIPTIVES |
|
|
|
|
|
Среднее, стандартное отклонение |
|
Описательные статистики |
Univariate descriptives |
Можно использовать для общего |
|
|
|
описания |
|
|
|
Критерий сферичности Барлетта Н0: |
|
|
|
корреляция между признаками в ГС |
|
|
|
отсутствует. Если принимается |
|
|
|
нулевая гипотеза, то проведение |
|
|
|
процедуры ФА на заданных |
|
Критерии проверки |
KMO and Barlett’s test |
признаках вызывает сомнения. |
|
Критерий адекватности выборки |
|||
адекватности |
|||
of sphericity |
Кайзера-Мейера-Олкина Н0: |
||
использования ФА |
|||
|
корреляции между парами |
||
|
|
||
|
|
переменных (частные корреляции) |
|
|
|
нельзя объяснить другими |
|
|
|
переменными. Если принимаем |
|
|
|
нулевую гипотезу, то использования |
|
|
|
ФА нецелесообразно |
|
EXTRACTION |
|
|
|
Метод построения |
|
По умолчанию «метод главных |
|
Method |
компонент», но можно выбрать и |
||
факторов |
|||
|
другие из списка |
||
|
|
||
-построение матрицы |
|
|
|
корреляции (correlation |
Analyse |
- |
|
matrix) |
|
|
56
-построение матрицы |
|
|
|
ковариации (covariance |
|
|
|
matrix) |
|
|
|
Собственное значение |
|
- |
|
исходного признака |
Eigenvalues over «1» |
||
|
|||
больше «1» |
|
|
|
Число факторов |
Number of factors |
Задается модель с определенным |
|
числом факторов |
|||
|
|
||
График «осыпь» |
Display/Scree plots |
Дополнительный метод определения |
|
оптимального числа факторов |
|||
|
|
||
ROTATION |
|
|
|
|
|
Позволяет выделить контрастные |
|
Методы вращения |
|
значения факторных нагрузок, тем |
|
Method/Varimax |
самым, облегчая интерпретацию |
||
факторов |
|||
|
факторов. Сохраняет углы между |
||
|
|
||
|
|
факторами (т.е. ортогональность) |
|
Отображение исходных |
|
|
|
признаков в пространстве |
Display/ Loading plot(s) |
Иллюстративная функция |
|
факторов |
|
|
|
SCORE |
|
|
|
|
|
Сохранение в качестве новой |
|
|
|
переменной значений каждого |
|
Сохранить как переменные |
Save as variables |
фактора. Предложено несколько |
|
|
|
методов расчета значений фактора, |
|
|
|
по умолчанию – регрессия |
|
Коэффициенты значений |
Factor Score Coefficient |
Коэффициенты уравнения для |
|
расчета значений фактора |
|||
фактора |
Matrix |
(факторных весов) |
|
|
|
||
OPTIONS |
|
|
|
Пропущенные значения |
Missing Values |
|
|
Исключение «полным |
Exclude cases listwise |
Решение проблемы пропущенных |
|
листом» |
|||
|
значений |
||
Исключение попарно |
Exclude cases pairwise |
||
|
|||
Замена средним значением |
Replace with mean |
|
|
|
|
Упорядочивание факторных |
|
|
|
нагрузок от наибольшей к |
|
Сортировка по размеру |
Sorted by size |
наименьшей по каждому фактору |
|
|
|
(удобно для представления данных в |
|
|
|
таблице) |
|
Не отражать абсолютные |
Suppress absolute values |
|
|
значения факторных |
|
||
less than __(по |
|
||
нагрузок, которые меньше |
Для удобства представления данных |
||
__ |
умолчанию 0.1) |
|
|
|
|
||
|
|
|
|
SELECTION VARIABLE |
|
|
|
Переменная, по значению |
|
Задается одно значение некой |
|
которой производится |
Selection variable |
переменной – оно рассматривается |
|
отбор случаев для |
как критерий отбора случаев для |
||
|
|||
проведения ФА |
|
построения модели |
57
2.17. Сводная таблица различий методов кластерного анализа
Иерархический кластерный анализ и анализ методом К-средних позволяют осуществлять таксономию объектов в заданном признаковом пространстве. Однако у каждого метода есть свои ограничения и преимущества, основные представлены в таблице.
Иерархический КА |
Метод К-средних |
Тип переменной-признака |
|
Количественные |
Количественные |
Дихотомические |
Дихотомические |
Ранговые |
Ранговые |
Номинальные |
|
Объем выборки |
|
Менее 100 объектов (агрегировать массив, |
Более 100 объектов |
выборка случайным образом) |
|
Определение числа кластеров |
|
можно (но необязательно) задать вывод |
необходимо задать число кластеров. Для |
диапазона решений, сохранив как новую |
разных кластерных решений необходимо |
переменную принадлежность к кластеру |
запускать процедуру несколько раз; |
(save/range of solution) label: average linage |
можно сохранить принадлежность к |
between groups; |
кластеру в качестве новой переменной |
на основе анализа шагов объединения и |
(save/ cluster membership) – label: average |
дендрограммы выбрать оптимальное |
linage between groups; |
решение; |
посмотреть наполненность групп |
посмотреть наполненность групп. |
|
Возможность нормирования |
|
Есть (Method/ standardize/ Z-scores или Range |
Необходимо провести стандартизацию до |
-1 to 1 (0 to 1). 0 – минимальное значение, 1 – |
включения признака в модель (например, |
максимальное значение. |
преобразовать в Z-статистики). |
Меры сходства (расстояний) |
|
Более 40 видов для разных типов |
Евклидово расстояние |
переменных |
|
Приписывание объекта к кластеру |
|
Объекты не могут переходить из кластера в |
Объекты могут переходить из кластера в |
кластер. |
кластер |
58
ЛИТЕРАТУРА Список основной литературы
1.Бююль А., Цефель П. SPSS: искусство обработки информации. – СПб: ООО «ДиасофтЮП», 2005. – 608с.
2.Девятко И. Ф. Методы социологического исследования. – М.: Книжный дом «Университет», 2002. – 295с.
3.Крыштановский А.О. Анализ социологических данных. – М., 2007
–281с.
4.Малхотра Н. Маркетинговые исследования. – М.: Вильямс, 2003. –
563с.
5.Наследов А. SPSS: компьютерный анализ данных в психологии и социальных науках. – СПб., 2005. – 416с.
6.Ростовцев П.С., Ковалева Г.Д. Анализ социологических данных с применением статистического пакета SPSS: Учебно-методическое пособие.
–Новосибирск: НГУ, 2002. – 160с.
7.Толстова Ю. Н. Анализ социологических данных. – М.: Научный мир, 2000. – 352с.
8.Сигель Э. Практическая бизнес-статистика. – М.: Вильямс, 2008. –
1056с.
9.Хили Дж. Статистика: социологические и маркетинговые исследования. – СПб.: Питер, 2005. – 638с.
10.SPSS BASE 8.0. Руководство пользователя. – М.:СПСС Русь, 1998. – 754с.
Рекомендуемые Интернет-ресурсы
1.Алексеева А.Ю., Ечевская О.Г., Ростовцев П.С., Ковалева Г.Д. Анализ социологических данных с применением статистического пакета SPSS. Сборник задач. – Новосибирск: НГУ, 2003. – URL: http://socionet.ru/publication.xml?h=repec:rus:nsusme:etchevskaya
2.Англо-русский статистический глоссарий. – URL: http://www.uran.donetsk.ua/~masters/2002/fvti/spivak/library/book2/book2.htm
3.Мангейм Дж. Б., Рич Р. К. Политология. Методы исследования: Пер. с англ. / Предисл. А.К. Соколова. – М.: Издательство “Весь Мир”, 1997. – 544 с. – URL: http://grachev62.narod.ru/Mr/
4.Сообщество пользователей SPSS в Живом Журнале («SPSS в психологии и социальных науках») – URL:
http://community.livejournal.com/ru_spss/
5.Тексты по статистике / – URL: http://forum.gfk.ru/texts/
6.Электронный учебник StatSoft. – URL: http://www.statsoft.ru/statportal/tabID__44/DesktopDefault.aspx
59
Учебное издание
Лазарева А.Ю.
Количественные методы социологического исследования
Учебно-методическое пособие по дисциплине «Количественные методы социологического исследования»
Редактор В.К. Трофимов Корректор И.Л. Гончарова
Подписано в печать 17.02.2015,
формат бумаги 60x84/16, отпечатано на ризографе, шрифт 10, изд. л. 4,0, заказ № 17, тираж 50 экз.
630102, г. Новосибирск, ул. Кирова, 86, офис 107 тел. (383) 269-83-56
Издательский центр СибГУТИ