Классификация и типологизация
Под классификацией изучаемых объектов понимается разделение их на непересекающиеся группы по каким-либо формальным признакам.
Под типом понимается идеальный О-т обладающий ярко выраженными характеристиками интересующими исследователя.
Тип трактуется как идеальная модель или гипотетический объект, на котором изучаемые явления и закономерности проявляются в чистом виде.
Класс трактуется как группа объектов из статистической совокупности, полученная в результате логико-математических, формальных построений.
В социологии обычная группировка данных является основным приемом решения задачи классификации. Группировку обычно называют многомерной классификацией. В случае, если для построения классификации используют несколько признаков, говорят о многомерной классиффикации.
Основные группы методов построения классификации
Принудительная (механическая) классификация (при которой известны формальные критерии разделения О-в на классы. 1 критерий – одномерная классификация, несколько критерии – многомерная классификация).
Классификация с обучением (классификация по заданным типам). Осуществляется основе теоретических типов (дискрименантный анализ).
Автоматическая классификация – это классификация без «обучения» и без формальных критериев.(Кластерный анализ например). Особенность метода – возможность получить «естественные типы», т.е. выделять группы О-в наиболее сходных друг с другом, по достаточно большому числу признаков.
Оптимальна группировка должна иметь:
Наибольшую однородность внутри группы
Возможно больше различий между группами
Группировка О-в по нескольким признакам одновременно называется многомерной классификацией социальных О-в. Данный вид классификации также имеет название – перекрестная группировка.
Кластерный анализ (ка)
КА относится к методам автоматической многомерной классификации.
Автоматическая классификация – это способ построения классификации в условиях когда число и характер классов заранее не известен.
КА – это общее название множества вычислительных процедур, которые используются для многомерной классификации данных.
Методы КА явл. не параметрическими т.е. они м.б. применены как к количественным так и к качественным данным.
Цель всех методов кластерного анализа – разделить множество О-в на несколько непересекающихся групп таким образом, чтобы О-ты одной группы были макс. похожи, а О-ты из разных групп были макс. не похожи.
Кластеры хар-ся следующим образом:
Кластер – это непустое множество О-в.
Кластеры должны отличаться друг от друга.
Все изучаемые О-ты д.б. распределены по кластерам.
Кластеры хар-ся следующими свойствами:
Плотность – позволяет определить кластер как скопление точек в пространстве данных, причем это скопление точек д.б. относительно плотным с другими областями пространства.
Дисперсия – хар-т степень рассеяния точек в пространстве относительно центра кластера.
Размер – тесно связан с дисперсией. Если кластер можно идентифицировать, то можно и измерить его радиус.
Форма – расположение точек в пространстве (обычно кластеры изображаются в виде гиперсфер или элипсоидов).
Отделимость – хар-т степень перекрытия (пересечения) кластеров и расстояние кластеров друг от друга в пространстве.
Метод КА необходим для изучения структуры О-в.
Выделяют 2 основные задачи КА:
Разведочная – заключ. в том, что строится классификация О-в и по результатам интерпретации выборки полученных классов, выделяют типы О-в астречающиеся в ГС.
Подтверждающая – мы провяем гипотезу о том, действительно ли типы, определенные каким-либо другим способом присутствуют в имеющихся данных.