Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Практикум по прикладой статистике

.pdf
Скачиваний:
120
Добавлен:
02.05.2015
Размер:
4.48 Mб
Скачать

Завершающим этапом анализа является нахождение матрицы значений главных компонент. Для этого определяется обратная матрица факторного отображения:

 

- 0,34

-0,26

0,34

0,31

 

 

 

 

 

 

 

 

A 1

 

0,34

0,58

0,38

0,46

 

 

 

-1,19

-0,99

1,42

.

 

1,20

 

 

 

- 3,22

2,40

-3,52

2,30

 

 

 

 

Матрица значений главных компонент рассчитывается по формуле F A 1Z и принимает вид:

- 0,09

1,22

0,13

-0,28

-1,70

0,72

 

 

 

 

 

 

 

 

 

 

- 0,73

-0,71

1,96

-0,17

-0,31

-0,03

 

F

-1,69

0,48

-0,31

1,33

0,20

0,00

.

 

 

 

0,70

0,36

0,35

0,94

-0,64

-1,72

 

 

 

Более удобной для восприятия является транспонированная матрица значений главных компонент для каждого объекта.

 

 

 

 

 

Таблица 3.2

 

Методы значений главных компонент

 

 

 

 

 

 

 

 

 

№ объекта

 

Главные компоненты

 

 

 

 

 

 

 

F1

F2

F3

F4

 

 

 

 

 

 

 

 

 

 

 

1

 

-0,09

-0,73

-1,69

0,70

 

 

 

 

 

 

 

 

2

 

1,22

-0,71

0,48

0,36

 

 

 

 

 

 

 

 

3

 

0,13

1,96

-0,31

0,35

 

 

 

 

 

 

 

 

4

 

-0,28

-0,17

1,33

0,94

 

 

 

 

 

 

 

 

5

 

-1,70

-0,31

0,20

-0,64

 

 

 

 

 

 

 

 

6

 

0,72

-0,03

0,00

-1,72

 

 

 

 

 

 

 

 

50

Решение типовой задачи с помощью ППП Statistica

Задача. В таблице представлены значения показателей социально-экономического развития районов Республики Бурятия. По представленным данным провести компонентый анализ, дать экономическую интерпретацию главным компонентам, ранжировать районы по первой главной компоненте.

х1 –среднемесячная номинальная начисленная заработная плата, руб.;

х2 – средняя обеспеченность населения жильем, кв. м.; х3 – валовая добавленная стоимость на душу населения, руб.; х4 – уровень занятости населения, %.

Таблица 3.3 Показатели социально-экономического развития сельских районов

Республики Бурятия

Район

 

 

Показатели

 

 

х1

 

х2

х3

х4

Баргузинский

8941

 

15,8

18411,80

29,30

Баунтовский

10649

 

20,7

63944,77

55,38

Бичурский

6688

 

16,9

41830,46

25,43

Джидинский

6021

 

16,6

39122,30

27,84

Еравнинский

7318

 

13,9

35226,71

32,17

Заиграевский

9969

 

20,9

25299,43

28,66

Закаменский

7012

 

17,5

41356,49

33,33

Иволгинский

8093

 

16,5

18964,51

17,13

Кабанский

9184

 

20,1

65763,98

39,51

Кижингинский

7402

 

16,8

27316,53

29,91

Курумканский

7679

 

16,5

31122,05

32,29

Кяхтинский

8047

 

16,4

21705,61

29,81

Муйский

14471

 

20,6

126974,32

50,94

Мухоршибирский

10098

 

17,8

37730,34

42,78

Окинский

11264

 

14,8

269018,31

87,50

Прибайкальский

8721

 

17

31423,97

34,07

Северо-Байкальский

13997

 

22,3

40484,61

46,88

Селенгинский

10400

 

18,1

81056,98

34,78

Тарбагатайский

7559

 

17,3

38058,59

25,93

Тункинский

7628

 

19,8

42246,22

30,22

Хоринский

7431

 

18,3

29858,65

32,77

 

 

51

 

 

 

Решение:

1.Ввод данных в программу ППП Statistica путем непосредственного набора данных в рабочий лист (Spreadsheet) или переноса подготовленной таблицы данных из Excel.

2.Открыть меню Статистика (Statistics) и выбрать команду Многомерные исследовательские методы (Multivariate Exploratory Techniques) → Компонентный анализ (Principal Components & Classification Analysis). Откроется диалоговое окно компонентного анализа (рис. 3.1).

Рис. 3.1.Диалоговое окно компонентного анализа

3. На стартовой панели компонентного анализа нажать кнопку Переменные (Variables). Откроется окно выбора переменных, в котором предлагается задать четыре типа переменных: Переменные для анализа (Variables for analysis), Вспомогательные переменные (Supplementary variables), Переменные с основными наблюдениями (Variable with active cases), Группировочная переменная (Grouping variable). Первая группа переменных является основной и участвует в компонентном анализе, т.е. в формировании главных компонент. Остальные переменные являются дополнительными и не участвуют в формировании главных компонент. Не допускается включение одной и той же переменной одновременно в состав основных и дополнительных переменных.

В окне выбора переменных (рис. 3.2) в поле Переменные для анализа (Variables for analysis) выбрать Var 1- Var 4. Нажать кнопку Ok.

52

Рис. 3.2. Окно выбора переменных

4. Вернуться в диалоговое окно факторного анализа. Нажать кнопку Ok. Откроется окно результатов компонентного анализа

(рис. 3.3).

Рис. 3.3. Диалоговое окно результатов компонентного анализа

5. Нажать на кнопку Факторные координаты переменных

(Factor coordinates of variables). Откроется таблица координат исходных переменных в пространстве главных компонент, которая в свою очередь представляет собой матрицу факторных нагрузок

(рис. 3.4).

53

Рис. 3.4. Матрица факторных нагрузок

6. Перейти на опцию Факторные координаты переменных (Factor coordinates of cases). Откроется матрица координат объектов наблюдения в пространстве главных компонент (рис. 3.5).

Рис. 3.5. Координаты объектов наблюдения в пространстве главных компонент

54

7. Выбрать опцию Собственные числа (Eigenvalues). В первом столбце открывшейся таблицы представлены собственные значения главных компонент, во втором столбце – доля объясненной дисперсии исходных переменных каждой компонентой, в третьем и четвертом столбцах – накопленные значения собственных чисел и объясненной дисперсии соответственно (рис. 3.6).

Рис. 3.6. Матрица значений собственных чисел

8.Перейти на опцию График распределения переменных в пространстве факторов (Plot var. factor coordinates, 2D). Откроется окно выбора переменных, в котором нужно задать в качестве координатных осей выделенные компоненты (рис. 3.7).

9.Нажать на кнопку График распределения объектов наблюдения в пространстве факторов (Plot case factor coordinates, 2D). В окне нужно задать оси координат, затем откроется график

(рис. 3.8).

10.В диалоговом окне результатов компонентного анализа перейти на опцию Критерий каменистой осыпи (Screeplot). В соответствии с критерием число выделяемых компонент равно 2 (рис. 3.9).

11.Перейти на вкладку Переменные (Variables). Затем нажать на кнопку Общности (Communalities). В открывшемся окне представлена матрица общностей переменных, т.е. накопленная доля общности переменных (рис. 3.10).

12.Нажать на кнопку Вклад переменных (Contributions of variables), откроется матрица вкладов переменных в вариацию компонент (рис. 3.11).

55

Рис. 3.7. График распределения переменных в пространстве компонент

Рис. 3.8. График распределения объектов в пространстве компонент

56

Рис. 3.9. Критерий каменистой осыпи

Рис. 3.10. Общности переменных

57

Рис. 3.11. Вклад переменных в вариацию компонент

13. Выбрать опцию Собственные векторы (Eigenvectors). Откроется матрица собственных векторов главных компонент

(рис. 3.12).

Рис. 3.12. Матрица собственных векторов

14. В окне результатов компонентного анализа перейти на вкладку Наблюдения (Cases), выбрать опцию Факторные значения (Factor scores). Откроется матрица значений главных компонент

(рис. 3.13).

58

Рис. 3.13. Матрица значений главных компонент

15. Нажать на кнопку Коэффициенты факторных значений (Factor score coefficients). Откроется матрица, элементы которой являются коэффициентами линейных уравнений зависимости компонент от исходных переменных (рис. 3.14).

16. Нажать на кнопку Вклады наблюдений (Contributions of cases). Откроется матрица со значениями вкладов наблюдений в вариацию главных компонент (рис. 3.15).

17. Нажать на кнопку Квадраты косинусов (Cosine2), откроется таблица значений квадратов косинуса угла, образованного радиус вектором наблюдения и факторной осью. Значения квадрата косинуса характеризует общность переменных для каждого наблюдения обусловленной влиянием главных компонент (рис. 3.16).

59