- •Введение в теорию измерений
- •Статистические гипотезы
- •Компьютеры в медико-биологической статистике
- •Особенности в использовании пакета spss
- •View (Вид, просмотр),
- •Особенности использования пакета statistica for windows
- •Определение переменных
- •Приемы описательной статистики
- •Методы, основанные на критериях согласия распределений
- •4. Применим второй способ проверки на нормальность по оценке коэффициентов асимметрии и эксцесса:
- •Проверка на нормальность (опровержение гипотезы нормальности для малой выборки, пакеты spss и Statistica).
Проверка на нормальность (опровержение гипотезы нормальности для малой выборки, пакеты spss и Statistica).
Условие: проверить, соответствует ли нормальному закону распределения процент точных остановок стрелки прибора при оценке реакции на движущийся объект (РДО) у молодых (18—19 лет) сборщиц изделий из мелких деталей:
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
% |
90 |
50 |
90 |
90 |
91 |
84 |
91 |
94 |
91 |
85 |
92 |
90 |
Решение: алгоритм аналогичен прежним задачам.
1. В пакете Statistica получим:
• Визуально видны существенные отличия от нормаль ной кривой.
• Асимметрия, эксцесс, их ошибки: = -3,145; =0,637; =10,340; =1,232.
• Критерий W—Шапиро—Уилкса 0,479, р < 0,000,
2. То же самое в пакете SPSS:
• Визуально существенные отличия от нормальной кривой.
• Оценки асимметрии, эксцесса и их ошибок совпадают с полученными в пакете Statistica.
• Критерий W—Шапиро—Уилкса 0,479, =0,010. Резюме: данные противоречат гипотезе нормальности.
Выявление различий в распределениях признака
Для этой цели применяются модифицированные варианты критериев Колмогорова—Смирнова и Хи-квадрат Пирсона.
Критерий Хи-квадрат обладает значительным полиморфизмом использования: для проверки гипотез независимости, согласия и др. В данном случае формула критерия для оценки достоверности различий между двумя выборочными распределениями в общем случае (для выборок разного объема) имеет следующий вид:
где — выборки;— интервалы, на которые разбит ва-
риационный ряд; р — частоты.
Упражнение 6.
Сравнение двух эмпирических распределений при помощи критериев Колмогорова—Смирнова и Хи-квадрат (пакет Statistica).
Условие задачи: Определить различия в распределении показателей уровня эмоционального напряжения в выборках студентов NF и SP — темпераментов по Д. Кейрси.
№ |
NF |
SP |
№ |
NF |
SP |
№ |
NF |
SP |
№ |
NF |
SP |
1 |
35 |
12 |
15 |
53 |
65 |
29 |
36 |
26 |
43 |
35 |
25 |
2 |
46 |
23 |
16 |
23 |
48 |
30 |
35 |
25 |
44 |
37 |
30 |
3 |
24 |
34 |
17 |
34 |
35 |
31 |
37 |
30 |
45 |
36 |
35 |
4 |
34 |
51 |
18 |
21 |
34 |
32 |
35 |
65 |
46 |
35 |
80 |
№ |
NF |
SP |
№ |
NF |
SP |
№ |
NF |
SP |
№ |
NF |
SP |
5 |
2 |
4 |
19 |
35 |
21 |
33 |
35 |
29 |
47 |
35 |
45 |
6 |
30 |
67 |
20 |
40 |
79 |
34 |
35 |
45 |
48 |
35 |
50 |
7 |
46 |
89 |
21 |
37 |
23 |
35 |
37 |
40 |
49 |
36 |
65 |
8 |
47 |
56 |
22 |
42 |
24 |
36 |
36 |
55 |
50 |
36 |
60 |
9 |
63 |
12 |
23 |
39 |
56 |
37 |
36 |
60 |
51 |
36 |
55 |
10 |
42 |
22 |
24 |
36 |
27 |
38 |
35 |
35 |
52 |
37 |
70 |
11 |
13 |
25 |
25 |
41 |
28 |
39 |
35 |
70 |
53 |
37 |
75 |
12 |
35 |
43 |
26 |
38 |
20 |
40 |
35 |
75 |
54 |
35 |
50 |
13 |
78 |
88 |
27 |
43 |
50 |
41 |
35 |
40 |
55 |
37 |
85 |
14 |
34 |
78 |
28 |
35 |
15 |
42 |
36 |
85 |
56 |
35 |
80 |
Решение:
1. Выдвигаем статистические гипотезы:
— об отсутствии взаимных различий между распределениями эмпирических данных;
— о наличии таких различий.
2. Запустим пакет Statistica, переключимся в модуль (Ос новные статистики и таблицы). Последовательно выберем команды (Файл) — (Новые данные) и зададим имя и марш рут размещения и хранения файла.
Введем исходные данные: в первый столбец (1/ол1) запишем сначала данные первой выборки, а затем — второй.
Во втором столбце укажем значение группирующей
переменной, равное 1 для первой выборки и 2 для второй. Как отмечалось в решении предыдущей задачи, достаточные объемы выборок (п > 50) позволяют использовать для сравнения двух распределений критерии Колмогорова— Смирнова и Хи-квадрат.
Использование критерия Хи-квадрат: в стартовом окне модуля (Основные статистики и таблицы) выберем команду (Таблицы и заголовки).
В открывшемся окне (Определить таблицу) выполним следующее:
В поле (Анализ) оставим значение (Таблицы сопряженности).
В блоке (Многовходовые таблицы сопряженности) нажмем на кнопку (Определить таблицу) и в окне выбора переменных зададим в первом списке Var1, a во втором —
Жмем кнопку ОК, переходим в окно (Результаты по таблицам сопряженности). Здесь в (Статистика для двухвходовых таблиц) поставим флажок в поле (Хи-квадрат Пирсона) и активизируем кнопку (Подробные двухвходовые таблицы).
В окне результатов видим (Хи-квадрат Пирсона), равный 80,914 при р= 0,001. Результат показывает значимые отличия в распределениях рассматриваемых выборок.
Следующий вариант анализа — использование теста Колмогорова—Смирнова. Закроем все рабочие окна предыдущего анализа (кроме окна таблицы данных) и в главном меню нажмем кнопку (Анализ) — (Другие статистики), переключимся в модуль (Непараметрические статистики и подгонка распределения).
Откроется окно, в котором выберем команду (Двух-выборочный тест Колмогорова—Смирнова). В нем зададим зависимую переменную Var1 и независимую, группирующую переменную , а также коды для каждой из групп: 1 и 2.
После нажатия кнопки ОК на экран дисплея выводится таблица с результатами анализа, где показаны: уровень значимости различий по тесту Колмогорова—Смирнова и р < 0,001, на основании чего эмпирические распределения значимо отличаются.
Резюме: при применении пакетов Statistica и SPSS выявлены идентичные и статистически значимые отличия в распределениях эмпирических данных.