Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги2 / 196

.pdf
Скачиваний:
0
Добавлен:
24.02.2024
Размер:
3.51 Mб
Скачать

2.2. Пример применения факторного анализа и метода главных компонент

ственной корреляции-R2 используются для определения общностей, как в предыдущем методе. После первоначального выделения факторов метод корректирует их нагрузки с помощью метода наименьших квадратов с целью минимизировать остаточные суммы квадратов.

Maximum likelihood factors (метод максимального правдоподобия) – в этом методе считается заранее известным число факторов (оно устанавливается в поле ввода максимального числа факторов). STATISTICA оценит нагрузки и общности, которые максимизируют вероятность наблюдаемой в таком случае матрицы корреляций. В диалоговом окне результатов анализа доступен χ-квадрат тест для проверки справедливости принятой гипотезы о числе общих факторов.

Centroid method (центроидный метод) – основан на геометрическом подходе.

Principal axis method (метод главных осей) – основан на итеративной процедуре вычисления общностей по текущим собственным значениям и собственным векторам. Итерации продолжаются до тех пор, пока не превышено максимальное число итераций или минимальное изменение в общностях больше, чем это определено в соответствующем поле.

Max. no. of factors (Максимальное число факторов). Заданное в этом поле число определяет, сколько факторов может быть выделено при работе рассмотренных выше методов. Это поле работает вместе с полем Min. eigenvalue (Минимальное собственное значение). Часто при заполнении этого поля руководствуются критерием Кайзера, который рекомендует использовать лишь те факторы, для которых собственные значения не меньше 1.

В МГК по умолчанию предполагается, что дисперсии всех переменных равны 1. Соответственно, общая дисперсия равна числу переменных и максимально возможное число факторов тоже равно числу переменных.

Остальные поля доступны только при выбранном методе Centroid method (Центроидный метод) или Principal axis method (Метод главных осей), и определяют необходимые для успешного выполнения последовательных итераций параметры минимального изменения в общностях и максимального числа итераций.

При нажатии закладки Descriptives (описательные статистики) от-

крывается окно Define Method of Factor Extraction (Определить метод выделения факторов) (рис. 2.6).

61

Глава 2. Факторный анализ и метод главных компонент в пакете STATISTICA

Рис. 2.6. Окно определения методов выделения факторов

При нажатии на кнопку Review correlations, means, standart deviations (Просмотреть корреляции, средние, стандартные отклонения) открывается окно просмотра описательных статистик для анализируемых данных (рис. 2.7), где можно посмотреть средние, стандартные отклонения, корреляции, ковариации, построить различные графики. Здесь можно провести дополнительный анализ текущих данных, проверить соответствие выборочных переменных нормальному закону распределения и существование линейной корреляции между переменными.

При нажатии на кнопку Correlations (Корреляции) открывается окно корреляционного анализа исследуемых показателей (рис. 2.8).

Нажав кнопку Cancel, вернемся к окну выбора методов факторного анализа (рис. 2.5). Выбираем Principal components (Метод главных компонент) и переходим к окну Factor Analysis Results, результатов факторного анализа методом главных компонент (рис. 2.9).

62

2.2. Пример применения факторного анализа и метода главных компонент

Рис. 2.7. Окно просмотра корреляций, средних и стандартных отклонений

Рис. 2.8. Окно корреляционного анализа исследуемых показателей

63

Глава 2. Факторный анализ и метод главных компонент в пакете STATISTICA

Рис. 2.9. Окно результатов факторного анализа методом главных компонент

Вверхней части окна результатов факторного анализа дается информационное сообщение:

Number of variables (число анализируемых переменных) – 4; Method (метод анализа) – главные компоненты;

log(10) determination of correlation matrix (десятичный логарифм де-

терминанта корреляционной матрицы) – -0,70535;

Number of Factor extraction (число выделенных факторов) – 2;

Eigenvalues (собственные значения) – 1,90837 и 1,16951.

Внижней части окна находятся подразделы, позволяющие всесторонне просмотреть результаты анализа численно и графически.

Plot of loadings, 2D и 3D (двухмерный и трехмерный графики нагрузок) – эти опции построят графики факторных нагрузок в проекции на плоскость любых двух выбранных факторов (рис. 2.10) и в проекции в пространство трех выбранных факторов (для чего необходимо наличие как минимум трех выделенных факторов).

64

2.2. Пример применения факторного анализа и метода главных компонент

Factor 2

Factor Loadings, Factor 1 vs. Factor 2

Rotation: Unrotated

Extraction: Principal components

0,1

 

 

 

 

 

 

 

 

 

 

 

 

Stoim

 

 

 

 

 

 

 

 

0,0

 

 

 

 

 

 

 

 

 

 

-0,1

 

Ves_Netto

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-0,2

 

 

 

 

 

 

 

 

 

 

-0,3

 

 

 

 

 

 

 

 

 

 

-0,4

 

 

 

 

 

 

 

 

 

 

-0,5

 

 

 

 

 

 

 

 

 

 

-0,6

 

 

 

 

 

 

 

 

 

 

-0,7

 

 

 

 

 

 

 

Country

 

 

 

 

 

 

 

 

 

Kod

 

 

 

-0,8

 

 

 

 

 

 

 

 

 

 

-0,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1,2

-1,0

-0,8

-0,6

-0,4

-0,2

0,0

0,2

0,4

Factor 1

Рис. 2.10. График факторных нагрузок

При нажатии на кнопку Summary. Factor loadings (Факторные нагрузки) открывается таблица с текущими факторными нагрузками (рис. 2.11), т.е. вычисленными для данного метода вращения факторов, который указан справа от соответствующей кнопки. В этой таблице факторам соответствуют столбцы, а переменным – строки, и для каждого фактора указывается нагрузка каждой исходной переменной, показывающая относительную величину проекции переменной на факторную координатную ось. Факторные нагрузки могут интерпретироваться как корреляции между соответствующими переменными и факторами – чем выше нагрузка по модулю, тем больше близость фактора к исходной переменной; т.о., они представляют наиболее важную информацию для интерпретации полученных факторов. В сгенерированной таблице для облегчения трактовки будут выделены факторные нагрузки по абсолютной величине больше 0,7.

65

Глава 2. Факторный анализ и метод главных компонент в пакете STATISTICA

Рис. 2.11. Таблица факторных нагрузок

Анализ представленных данных позволяет сделать вывод, что первый фактор хорошо коррелирует с весом нетто товара и его стоимостью, а второй – со страной происхождения и видом товара. Все это имеет логическое объяснение – первый фактор определяет объем и таможенную стоимость поставки, а второй – ее характер и происхождение.

Однако не всегда факторный анализ дает такие четкие и легко объяснимые результаты. В таком случае целесообразно прибегнуть к повороту осей, надеясь получить решение, которое можно интерпретировать в предметной области. Для этого достаточно в выпадающем меню Factor rotation (Вращение факторов) выбрать тот способ вращения, который позволяет получить простую структуру, при которой большинство наблюдений находится вблизи осей координат (рис. 2.12).

Враскрывающемся меню можно выбрать различные повороты оси:

Varimax – Варимакс – предназначен для максимизации дисперсий квадратов исходных факторных нагрузок по переменным для каждого фактора;

Biquartimax – Биквартимакс – предназначен для одновременной максимизации суммы дисперсий квадратов исходных факторных нагрузок по факторам и максимизации суммы дисперсий квадратов исходных факторных нагрузок по переменным;

66

2.2. Пример применения факторного анализа и метода главных компонент

Quartimax – Квартимакс – означает максимизацию дисперсии квадратов факторных нагрузок по факторам;

Equamax – Эквимакс – взвешенная смесь вращения по методам варимакс и квартимакс, но в отличие от метода биквартимакс, относительный вес, предназначенный критерию варимакс при вращении, равен числу факторов, деленному на 2.

Дополнительный термин в названии методов – normalized (нормализованные) – указывает на то, что факторные нагрузки в процедуре нормализуются, т.е. делятся на корень квадратный из соответствующей дисперсии. Термин raw (исходные) показывает, что вращаемые нагрузки не нормализованы.

Рис. 2.12. Выбор метода вращения факторов

Часто возникает вопрос: сколькими же факторами следует ограничиваться на практике? Для этого в программном пакете STATISTICA существует опция Scree plot (Критерий каменистой осыпи) в окне Factor Analysis Results (рис. 2.13).

Полученные в результате анализа данные говорят о том, что уже первые две главные компоненты описывают 76,95% дисперсии исходных данных. Третья главная компонента привносит еще приблизительно 20,34% дисперсии, так что в сумме получается 97,29% дисперсии.

67

Глава 2. Факторный анализ и метод главных компонент в пакете STATISTICA

Выбрав вкладку Scores (Оценка), нажмем на кнопку Factor scores и получим таблицу с координатами каждой из исследуемых поставок на пространстве исследуемых факторов (рис. 2.14).

Метод главных компонент включен не только в модуль факторного анализа, но и выделен в отдельный модуль Principal Components & Classification Analysis. Для запуска данного модуля надо выбрать его из меню

Statistics (рис. 2.15).

Eigenvalue

Eigenvalues of correlation matrix

Active variables only

2,2

 

 

 

 

 

 

 

 

 

 

 

 

2,0

 

 

47,71%

 

 

 

 

 

 

 

 

 

1,8

 

 

 

 

 

 

 

 

 

 

 

 

1,6

 

 

 

 

 

 

 

 

 

 

 

 

1,4

 

 

 

 

 

 

 

 

 

 

 

 

1,2

 

 

 

 

29,24%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20,34%

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

2,71%

 

 

 

0,0

 

 

 

 

 

 

 

 

 

 

 

 

-0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,0

0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

4,5

5,0

Eigenvalue number

Рис. 2.13. Графическое отображение вклада главных компонент в дисперсию исходных данных

После запуска откроется стартовое окно, позволяющее выбрать настройки предстоящего анализа (рис. 2.16).

Для продолжения работы над нашей выборкой поставок мясопродуктов в данном модуле в разделе Variables for analysis достаточно выбрать уже исследованные нами показатели при работе в модуле факторного анализа (рис. 2.17).

68

2.2. Пример применения факторного анализа и метода главных компонент

Рис. 2.14. Координаты каждой из исследуемых поставок на пространстве исследуемых факторов

Рис. 2.15. Запуск модуля Principal Components & Classification Analysis

69

Глава 2. Факторный анализ и метод главных компонент в пакете STATISTICA

Рис. 2.16. Стартовое окно модуля Principal Components & Classification Analysis

Рис. 2.17. Выбор переменных для анализа

В появившемся окне выберем вкладку Variables (Переменные) и

нажмем кнопку Plot var. factor coordinates, 2D (рис. 2.18) для получения

70

Соседние файлы в папке книги2