5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_
.pdfГлава 4. Приемы описательной статистики |
19 |
•Оценки асимметрии, эксцесса и их ошибок совпада
ют с полученными в пакете Statistica.
•Критерий W-Шапиро-Уилкса 0,479, р = O,o~o.
Резюме: данные противоречат гипотезе нормальности.
Выявление различий в распределениях приэнака
Для этой цели применяются модифицированные вари анты критериев КОЛМQгорова---Смирнова и Хи-квадрат Пир
сона.
Критерий Хи-квадрат обладает значительным полимор
физмом использования: для проверки гипотез независимо
сти, согласия и др. В данном случае формула критерия ДЛЯ
оценки достоверности различий между двумя выборочны
ми распределениями в общем случае (ДЛЯ выборок разного
объема) имеет следующий вид:
.х2 |
= |
I |
~(nJ~-n2р:)2 |
|
э.мnUРU'f. |
nl ·n2 |
.L.J |
; ; |
|
|
;=1 |
РI .Р2 |
||
где Л1-Л2 - выборки; k - |
интервалы, на которые разбит ва |
|||
риационный ряд; р - |
частоты. |
|
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Упражнение·8. • • • • • • •• • • • • • • • • • • • • • • •
Сравнение двух эмпирических распределений при по-
мощи критериев Колмогорова-Смирнова и Хи-квадрат
(пакет SPSS).
УслоВие задачи: Определить различия в распределении
показателей уровня эмоционального напряжения в выбор
ках студентов NF.и SP - |
|
темпераментов по Д. КеЙрси. |
|||||||||||||||||||||||
|
|
NI |
|
NF |
|
SP |
|
N2 |
|
NF |
|
SP |
|
.. |
|
NF |
|
SP |
|
'. N2 |
|
NF |
|
SP |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
1 |
|
35 |
|
12 |
|
15 |
|
53 |
|
65 |
|
29 |
|
36 |
|
26 |
|
43 |
|
35 |
|
25 |
|
|
|
|
2 |
|
46 |
|
23 |
|
16 |
|
23 |
|
48 |
|
30 |
|
35 |
|
25 |
|
44 |
|
37 |
|
30 |
|
|
3 |
|
24 |
|
34 |
|
17 |
|
34 |
|
35 |
|
31 |
|
37. |
|
30 |
|
45 |
|
з6 |
|
35 |
|
|
|
|
4 |
|
34 |
|
51 |
|
18 |
|
21 |
|
34 |
|
32 |
|
35 |
|
65 |
|
46 |
|
35 |
|
80 |
|
40 |
|
|
|
|
|
|
|
|
Медицинская статистика |
||||||
|
|
|
|
|
|
|
|
|
|
Окончание табл. |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N2 |
HP |
.ЗР |
NI |
HP |
ЗР |
NI |
HP |
ЗР |
|
N2 |
HP |
ЗР |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
2 |
4 |
19 |
35 |
21 |
33 |
35 |
29 |
|
47 |
35 |
45 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
30 |
67 |
20 |
40 |
79 |
34 |
35 |
45 |
|
48 |
35 |
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
4в |
89 |
21 |
37 |
23 |
35 |
37 |
40 |
|
49 |
зв |
в5 |
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
47 |
56 |
22 |
42 |
24 |
36 |
36 |
55 |
|
50 |
36 |
60 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
вз |
12 |
23 |
39 |
56 |
37 |
36 |
60 |
|
51 |
36 |
55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
42 |
22 |
24 |
36 |
27 |
38 |
35 |
35 |
|
52 |
37 |
70 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
13 |
25 |
25 |
41 |
28 |
39 |
35 |
70 |
|
53 |
37 |
75 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
35 |
43 |
26 |
38 |
20 |
40 |
35 |
75 |
|
54 |
35 |
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13 |
78 |
88 |
27 |
43 |
50 |
41 |
35 |
40 |
|
55 |
37 |
85 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
14 |
з4 |
78 |
28 |
Э5 |
15 |
42 |
эв |
85 |
|
56 |
35 |
80 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1.'Выдвигаем альтернативные гипотезы: об отсутствии и |
||||||||||||||
о наличии различий. |
|
|
|
|
. |
|
|
|
|
|
|
2. В стартовом окне SPSS флажком выберем (ввести
данные).
Поскольку объемы выборок значительны (n = 56), при
меним критерии Колмоrорова-Смирнова и Хи-квадрат.
Здесь нужна группирующая переменная, в связи с чем таб лицу организуем следующим образом: в первую колонку
( Var1) вставим данные первой выборки, а затем - второй.
Во вторую колонку (Var2) вставим значение группирующей
переменной, равное 1 ДЛЯ первой выборки и 2 ДЛЯ второй.
з. Выберем команды: (Статистики) - (Непараметричес
кие критерии) - (Две независимые выборки). Потом откро ем окно - (Критерии для двух независимых выборок) в нем:
•зададим в поле (Список проверяемых переменных)
переменную Var1:
•в поле (Группирующая переменная)укажем Var2. За
тем с помощью кнопки (Определить группы) введем значения групп 1 и 2;
•выберем применяемый для проверки критерий (тест
Колмогорова-Смирнова).
4.Нажав на кнопку ОК, выполним проверку и перейдем
вокно (Просмотр результатов). В таблице (Результаты тес-
Глава 4. Приемы описательной статистики |
4' |
та) найдем значение (Статистика критерия Колмогорова Смирнова) 2,268. При этом значение (Асимптотический двух сторонний уровень знаЧИМQСТИ) равно 0,000, т. е. установ
лен факт достоверных различий в эмпирических распреде
лениях.
5. Используя критерий Хи-квадрат в главном меню па
кета, выберем команды: (Статистики)' - (Подытожить) - (Таблицы сопряженности). В открывшемся окне таблиц со
Гlряженности в поле (Строки) введем основную переменную
Voг1, в которую записаны исходные данные из обеих выбо рок; в лоле Column(S) (Столбцы) введем группирующую пе
ременную Voг2.
6.Выберем команду (Статистики) и флажком зададим
(Хи-квадрат).
7.Проверим результаты (ПРОСМОТР результатов). В таб
Ilице (Результаты теста Хи-квадрат) в строке (Хи-квадрат
Пирсона) найдем -(Значение) статистики критерия (Асимп
тотический двухсторонний уровень значимости) 0,001, он свидетельствует о достоверности различий, вследствие чего
нулевая гипотеза отвергается. Уровни эмоционального на
пряжения существенно отличаются.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Упражнение 9. • • • • • • • • • • • • • • • • • • • • • • •
Сравнение двух эмпирических распределений ГlрИ по-
мощи критериев Колмогорова-Смирнова и Хи-квадрат
(пакет Statistica).
Решенu~:
1.Выдвигаем статистические гипотезы:
•Но - об отсутствии взаимных различий между рас
пределениями эмпирических данных;
•Н, - о наличии таких различий.
2. Запустим пакет Statistica, переключимся в модуль (Ос
новные статистики и таблицы). Последовательно выберем
команды (Файл) - (Новые данные) и зададим имя и марш рут размещения и хранения файла.
Введем исходные данные: в первый столбец (Voг1) за
пишем сначала данные первой выборки, а затем - второй.
4:1 Медицинская статистика
Во втором столбце (Var2) укажем значение группирующей переменной, равное 1 для первой выборки и 2 для второй.
Как отмечалось в ре~ении предыдущей задачи, доста
точные объемы выборок (n > 50) позволяют использовать для сравнения двух распределений критерии Колмогорова
Смирнова и Хи-квадрат.
з. Использование критерия Хи-квадрат: в стартовом окне
модуля (Основные статистики и таблицы) выберем команду (Таблицы и заголовки).
4. В открывшемся окне (Определить таблицу) выполним
следующее:
•В поле (АнагIИЗ) оставим значение, (Таблицы СОI"IРЯ
женности).
•В блоке (Многовходовые таблицы сопряженности)
нажмем на кнопку (Определить таблицу) и в окне вы
бора переменных зададим в первом списке Var1, а
во втором - Var2.
•Жмем кнопку ОК, переходим в окно (Результаты по
таблицам сопряженности). Здесь в (Статистика для
двухвходовых таблиц) поставим флажок в поле (Хи
квадрат Пирсона) и активизируем кнопку (Подробные двухвходовые таблицы).
•В окне результатов видим (Хи-квадрат Пирсона), рав ный 80,914 при Р =0,001. Результат показывает зна
чимые отличия в распределениях рассматриваемых
выборок.
5. Следующий вариант анализа - использование теста
Колмогорова-Смирнова. Закроем все рабочие окна пре дыдущего анализа (кроме окна таблицы данных) и в глав
ном меню нажмем кнопку (Анализ) - (Другие статистики), переключимся в модуль (Непараметрические статистики и
подгонка распределения).
6. Откроется окно, в котором выберем команду (Двух
выборочный тест Колмогорова-Смирнова). В нем зададим
зависимую переменную Var1 и независимую, группирующую переменную Var2, а также коды ДЛЯ каждой из групп: ,1 и 2.
Глава 4. Приемы описатепьной статистики |
41 |
После нажатия кнопки ОК на экран дисплея выводится таблица с результатами анализа, где показаны: уровень зна
чимости различий по тесту Колмогорова-Смирнова и р < 0,001, на основании чего эмпирические распределения
значимо отличаются.
Резюме: при применении пакетов Statistica и SPSS вы
явлены идентичные и статистически значимые отличия в рас
пределениях эмпирических данных.
-. |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
! |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
• |
ГлаВа 5 ---------
КРИТЕРИИ РАЗЛИЧИЙ В УРОВНЕ
ПРИЗНАКА
Задача оценки различий признаков - основа клини
ко-диагностического и профилактического процессов в
медицине. Для выявления таких различий в математичес
кой статистике разработаны высокоэффективные крите
рии: параметрические (Стьюдента, Фишера и др.) и непа раметриче"ские. Как мы уже отмечали, параметрические
критерии требуют выполнения условия нормальности, что
для реальных эмпирических данных часто не выполняет
ся. Поэтому чаще врачи-практики, да и научные сотруд
ники, внимание уделяют непараметрическим критериям,
которые не предполагают соответствия эмпирических дан
ных какому-либо теоретическому закону распределения. Безусловно, в случае нормального распределения эм
пирических данных параметрические критерии являются
более моwными по сравнению снепараметрическими.
Поэтому в обwем случае исследователь должен сначала
выполнить проверку на нормальность распределения и
лишь затем, в зависимости от ее результатов, принимать
решение о выборе статистического критерия.
Все статистические критерии выяв.ления различий ~ уровне исследуемого признака (параметрические и непа
раметрические) можно разделить на две основные группы:
Глава 5. Критерии раJПИЧИЙ в уровне признака |
41 |
•
•
для двух выборок;
для трех и более выборок.
Рассмотрим особенности этих двух rpупп критериев.
Наиболее популярным параметрическим критерием для
сравнения двух выборок является t-критерий Стьюдента для
независимых выборок. Вариант критерия, используемый в
SPSS и Statistica, предназначенный для сравнения средних величин выборок, ориентирован на проверку гипотезы од нородности О том, что выборки извлечены из одной и той
же генеральной совокупности.
При этом предполагается, что обе выборки извлечены
из генеральных совокупностей, имеющих нормальные рас
пределения. На практике получается, что критерий
Стьюдента при больших объемах выборок устойчив к от
клонениям от нормальности.
В том же случае, когда выборки взяты из иных сово
купностей, истинные значения признаков стРого говоря,
должны оцениваться с помощью специальных приемов.
Исходя из этого критерий Стьюдента требует нормально
сти распределений выборок.
для корректного использования критерия Стьюдента
необходимо иметь представление о дисперсиях генераль
ных совокупностей. Здесь же может быть несколько ва
риантов:
•дисперсии известны и равны;
•дисперсии известны, но неравны;
•дисперсии неизвестны, но предполагается их равен
ство;
•дисперсии неизвестны, их равенство не предпола
гается.
Могуг случаться и такие ситуаuии, когда исследователь
сталкивается с равными и неравными объемами выборок,
а также свя~нных и несвязанных выборок. В медико-био
логических исследованиях дисаерсии генеральных совокуп
ностей большей частью неизвестны, но предполагается их
равенство ме.>.КдУ собой; и выборки могут иметь различные
.8 |
Медицинска. аатмCl1tо |
объемы. В этом случае статистика критерия Стъюдента вы
числяется по следующей формуле:
|
|
XI-X2 |
t |
ЭAlllUpu'l. |
=--=.-=~"'===" |
|
2 JRll' |
|
|
|
s -+-. |
|
|
n) n2 |
где х - средние значения выборок; n - объемы выборок;
i- - объединенная оценка выборочной дисперсии,
формула ·которой показана ниже:
s2 =Sl2 • (л. -1)+si .(~-1) ,
л. +~-2
Выборочные дисперсии получаем по следующим фор
мулам:
s~;L(п:-х;)2
и
л.-l
sf; L(~_~)2.
"2 -1
Не менее поПулярен другой параметрический крите
рий - F-критерий Фишера. Эroт прием обработки стати
стической информации используют при проведении дис
персионного анализа при отыскании npичинно-следствен
ных связей между анализируемыми признаками. И мы
обсудим проблемы его использования чyrь позднее.
Из непараметрических критериев для сравнения двух выборок популярен U-критерий Манна-Уитни. Надо
признать, что в медико-биологических исследованиях эта
группа методик сгатистической обработкиданных исполь
зуется слабо. И причина такоro игнорирования совершен
но не поддается осмыслению, поскольку именно крите-
Глава 5. Критерм.. рам....й • уровне ПРМЭNaка |
.7 |
рий Манна-Уитни практически не имеет ограничений на
объемы выборок (уже одно то, что анализ можно вести,
имея всего три измерения (!) говорит само за себя). По
мимо этого он позволяет сравнивать выборки разного
объема.
Критерий легко адаптировать ДЛЯ проверки нулевой
гипотезы о том, что средние значения двух выборок не
отличаЮТСЯ дрyr от друга. Он - непараметрический ана лог критерия Стьюдента для независимbIX выборок, не
критичен к нормальности распределения, поскольку ос
нован на paHrax наблюдений. Для применения критерия Манна-Уитни данные выборок временно объединяют и
ран:жируют, а затем подсчитывают суммы paHroB, получен
ные для каждой выборки_ Статистика критерия вычисля ется по следующим формулам:
и |
|
x |
х |
|
=. +n -(n +l)_D |
||||
ЭIIIfIIJIIl.· |
". |
IIJ.. |
2 |
.1. 'шах, |
R.... =rnax(R. +~).
где nl ;! - объемы выборок,
R,.2 - суммы рангов по выборкам,
Rпrц - наибольшая из двух ранговых сумм,
n - объем выборки, имеющей наибольшую сумму
ж
ранюв.
)',,~~,,~ IlJ. • • • • • • • • • • • • • • • • • • • • • •
Та.езадача примеllellие критерия Стыодента дNЯ ВЫ-
явnения ра3Пичий в уровне ИСО1едуемого приэнака дnя
двух несвяэанных выборок (naкет Statistica)
Решение:
1. Выдвигаем альтернативные гипотезы.
2. ЗапуСТИВ пмет, neреКI1IОЧИМСЯ В модуль (Основные
статистики и таблицы).
3. В главном меню naкeтa выберем команды (Файл) -
(Новые данные) и зададим имя и маршрут размещения фай-
•• |
МеДИЦИНСКёlЯ статистика |
|
ла данных к этой задаче. Затем введем данные по выборкам
вотдельные столбцы: 1 - для первой и 2 _. для второй.
4.Выполним проверку нормальности расl1реде.лениЙ ана
логично решеНИI9 .ранним задачам. Для каждой выборки в
окне ее гистограммы получаем статистику Шапиро-Уилк
са и оценку ее значимости, как и предыдущем примере. По
скольку нормальность распределений подтверждена,·для
сравнения выборок можно применить параметрический кри
терий Стьюдента.
5.Для этого в окне модуля (Основные статистики и таб
лицы) (Тест для независимых выборок).
6.В диалоговом окне теста выполним следующее:
•В поле (Исходный файл) выберем (Каждая перемен
ная содержит данные одной групп'ы). Второе возмож
ное значение здесь - (Совместная запись наблюде
ний групп, использующая группирующую перемен
ную) - применяется, когда выборки записаны в общий столбец.
•Нажав кнопку (Переменные, или группы), расставим
'в списках переменные 1 и 2.
•В блоке (Параметры) поставим флажок в поле (Тест
сраздельным оцениванием дисперсий выборок) в
силу того, что мы не делали предположения о равен
~TBe этих ДИС11ерсиЙ. После чего, нажав ОК, возвра
тимся в окно теста и нажмем на кнопку (тестирова
ние).
7. В 110явившейся таблице результатов анализа даются
два значения критерия и соответственно две оценки его
уровня значимости. Именно второе значение критерия (Тест
с раздельным оцениванием дисперсий выборок) нам и нуж
но. И хотя оценка его значимости «р» (р-двухстороннее),
совпадает с предыдущей, в общем случае мы должны ори
ентироваться именно на нее. Таким образом, полученный
результат вновь показывает отсутствие значимых отличий в
средних значениях выборок. И это означает, что статисти~ чески значимые различия в выборках отсутствуют.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •