Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
8.17 Mб
Скачать

Глава 4. Приемы описательной статистики

19

Оценки асимметрии, эксцесса и их ошибок совпада­

ют с полученными в пакете Statistica.

Критерий W-Шапиро-Уилкса 0,479, р = O,o~o.

Резюме: данные противоречат гипотезе нормальности.

Выявление различий в распределениях приэнака

Для этой цели применяются модифицированные вари­ анты критериев КОЛМQгорова---Смирнова и Хи-квадрат Пир­

сона.

Критерий Хи-квадрат обладает значительным полимор­

физмом использования: для проверки гипотез независимо­

сти, согласия и др. В данном случае формула критерия ДЛЯ

оценки достоверности различий между двумя выборочны­

ми распределениями в общем случае (ДЛЯ выборок разного

объема) имеет следующий вид:

.х2

=

I

~(nJ~-n2р:)2

э.мnUРU'f.

nl ·n2

.L.J

; ;

 

;=1

РI .Р2

где Л12 - выборки; k -

интервалы, на которые разбит ва­

риационный ряд; р -

частоты.

 

• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •

Упражнение·8. • • • • • • •• • • • • • • • • • • • • • • •

Сравнение двух эмпирических распределений при по-

мощи критериев Колмогорова-Смирнова и Хи-квадрат

(пакет SPSS).

УслоВие задачи: Определить различия в распределении

показателей уровня эмоционального напряжения в выбор­

ках студентов NF.и SP -

 

темпераментов по Д. КеЙрси.

 

 

NI

 

NF

 

SP

 

N2

 

NF

 

SP

 

..

 

NF

 

SP

 

'. N2

 

NF

 

SP

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

35

 

12

 

15

 

53

 

65

 

29

 

36

 

26

 

43

 

35

 

25

 

 

 

2

 

46

 

23

 

16

 

23

 

48

 

30

 

35

 

25

 

44

 

37

 

30

 

 

3

 

24

 

34

 

17

 

34

 

35

 

31

 

37.

 

30

 

45

 

з6

 

35

 

 

 

4

 

34

 

51

 

18

 

21

 

34

 

32

 

35

 

65

 

46

 

35

 

80

 

40

 

 

 

 

 

 

 

 

Медицинская статистика

 

 

 

 

 

 

 

 

 

 

Окончание табл.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N2

HP

.ЗР

NI

HP

ЗР

NI

HP

ЗР

 

N2

HP

ЗР

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

2

4

19

35

21

33

35

29

 

47

35

45

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

30

67

20

40

79

34

35

45

 

48

35

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

89

21

37

23

35

37

40

 

49

зв

в5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

47

56

22

42

24

36

36

55

 

50

36

60

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

вз

12

23

39

56

37

36

60

 

51

36

55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

42

22

24

36

27

38

35

35

 

52

37

70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

13

25

25

41

28

39

35

70

 

53

37

75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

35

43

26

38

20

40

35

75

 

54

35

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

78

88

27

43

50

41

35

40

 

55

37

85

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

з4

78

28

Э5

15

42

эв

85

 

56

35

80

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.'Выдвигаем альтернативные гипотезы: об отсутствии и

о наличии различий.

 

 

 

 

.

 

 

 

 

 

 

2. В стартовом окне SPSS флажком выберем (ввести

данные).

Поскольку объемы выборок значительны (n = 56), при­

меним критерии Колмоrорова-Смирнова и Хи-квадрат.

Здесь нужна группирующая переменная, в связи с чем таб­ лицу организуем следующим образом: в первую колонку

( Var1) вставим данные первой выборки, а затем - второй.

Во вторую колонку (Var2) вставим значение группирующей

переменной, равное 1 ДЛЯ первой выборки и 2 ДЛЯ второй.

з. Выберем команды: (Статистики) - (Непараметричес­

кие критерии) - (Две независимые выборки). Потом откро­ ем окно - (Критерии для двух независимых выборок) в нем:

зададим в поле (Список проверяемых переменных)

переменную Var1:

в поле (Группирующая переменная)укажем Var2. За­

тем с помощью кнопки (Определить группы) введем значения групп 1 и 2;

выберем применяемый для проверки критерий (тест

Колмогорова-Смирнова).

4.Нажав на кнопку ОК, выполним проверку и перейдем

вокно (Просмотр результатов). В таблице (Результаты тес-

Глава 4. Приемы описательной статистики

4'

та) найдем значение (Статистика критерия Колмогорова­ Смирнова) 2,268. При этом значение (Асимптотический двух­ сторонний уровень знаЧИМQСТИ) равно 0,000, т. е. установ­

лен факт достоверных различий в эмпирических распреде­

лениях.

5. Используя критерий Хи-квадрат в главном меню па­

кета, выберем команды: (Статистики)' - (Подытожить) - (Таблицы сопряженности). В открывшемся окне таблиц со­

Гlряженности в поле (Строки) введем основную переменную

Voг1, в которую записаны исходные данные из обеих выбо­ рок; в лоле Column(S) (Столбцы) введем группирующую пе­

ременную Voг2.

6.Выберем команду (Статистики) и флажком зададим

(Хи-квадрат).

7.Проверим результаты (ПРОСМОТР результатов). В таб­

Ilице (Результаты теста Хи-квадрат) в строке (Хи-квадрат

Пирсона) найдем -(Значение) статистики критерия (Асимп­

тотический двухсторонний уровень значимости) 0,001, он свидетельствует о достоверности различий, вследствие чего

нулевая гипотеза отвергается. Уровни эмоционального на­

пряжения существенно отличаются.

• • • • • • • • • • • • • • • • • • • • • • • • •

Упражнение 9. • • • • • • • • • • • • • • • • • • • • • • •

Сравнение двух эмпирических распределений ГlрИ по-

мощи критериев Колмогорова-Смирнова и Хи-квадрат

(пакет Statistica).

Решенu~:

1.Выдвигаем статистические гипотезы:

Но - об отсутствии взаимных различий между рас­

пределениями эмпирических данных;

Н, - о наличии таких различий.

2. Запустим пакет Statistica, переключимся в модуль (Ос­

новные статистики и таблицы). Последовательно выберем

команды (Файл) - (Новые данные) и зададим имя и марш­ рут размещения и хранения файла.

Введем исходные данные: в первый столбец (Voг1) за­

пишем сначала данные первой выборки, а затем - второй.

4:1 Медицинская статистика

Во втором столбце (Var2) укажем значение группирующей переменной, равное 1 для первой выборки и 2 для второй.

Как отмечалось в ре~ении предыдущей задачи, доста­

точные объемы выборок (n > 50) позволяют использовать для сравнения двух распределений критерии Колмогорова­

Смирнова и Хи-квадрат.

з. Использование критерия Хи-квадрат: в стартовом окне

модуля (Основные статистики и таблицы) выберем команду (Таблицы и заголовки).

4. В открывшемся окне (Определить таблицу) выполним

следующее:

В поле (АнагIИЗ) оставим значение, (Таблицы СОI"IРЯ­

женности).

В блоке (Многовходовые таблицы сопряженности)

нажмем на кнопку (Определить таблицу) и в окне вы­

бора переменных зададим в первом списке Var1, а

во втором - Var2.

Жмем кнопку ОК, переходим в окно (Результаты по

таблицам сопряженности). Здесь в (Статистика для

двухвходовых таблиц) поставим флажок в поле (Хи­

квадрат Пирсона) и активизируем кнопку (Подробные двухвходовые таблицы).

В окне результатов видим (Хи-квадрат Пирсона), рав­ ный 80,914 при Р =0,001. Результат показывает зна­

чимые отличия в распределениях рассматриваемых

выборок.

5. Следующий вариант анализа - использование теста

Колмогорова-Смирнова. Закроем все рабочие окна пре­ дыдущего анализа (кроме окна таблицы данных) и в глав­

ном меню нажмем кнопку (Анализ) - (Другие статистики), переключимся в модуль (Непараметрические статистики и

подгонка распределения).

6. Откроется окно, в котором выберем команду (Двух­

выборочный тест Колмогорова-Смирнова). В нем зададим

зависимую переменную Var1 и независимую, группирующую переменную Var2, а также коды ДЛЯ каждой из групп: ,1 и 2.

Глава 4. Приемы описатепьной статистики

41

После нажатия кнопки ОК на экран дисплея выводится таблица с результатами анализа, где показаны: уровень зна­

чимости различий по тесту Колмогорова-Смирнова и р < 0,001, на основании чего эмпирические распределения

значимо отличаются.

Резюме: при применении пакетов Statistica и SPSS вы­

явлены идентичные и статистически значимые отличия в рас­

пределениях эмпирических данных.

-.

!

ГлаВа 5 ---------

КРИТЕРИИ РАЗЛИЧИЙ В УРОВНЕ

ПРИЗНАКА

Задача оценки различий признаков - основа клини­

ко-диагностического и профилактического процессов в

медицине. Для выявления таких различий в математичес­

кой статистике разработаны высокоэффективные крите­

рии: параметрические (Стьюдента, Фишера и др.) и непа­ раметриче"ские. Как мы уже отмечали, параметрические

критерии требуют выполнения условия нормальности, что

для реальных эмпирических данных часто не выполняет­

ся. Поэтому чаще врачи-практики, да и научные сотруд­

ники, внимание уделяют непараметрическим критериям,

которые не предполагают соответствия эмпирических дан­

ных какому-либо теоретическому закону распределения. Безусловно, в случае нормального распределения эм­

пирических данных параметрические критерии являются

более моwными по сравнению снепараметрическими.

Поэтому в обwем случае исследователь должен сначала

выполнить проверку на нормальность распределения и

лишь затем, в зависимости от ее результатов, принимать

решение о выборе статистического критерия.

Все статистические критерии выяв.ления различий ~ уровне исследуемого признака (параметрические и непа­

раметрические) можно разделить на две основные группы:

Глава 5. Критерии раJПИЧИЙ в уровне признака

41

для двух выборок;

для трех и более выборок.

Рассмотрим особенности этих двух rpупп критериев.

Наиболее популярным параметрическим критерием для

сравнения двух выборок является t-критерий Стьюдента для

независимых выборок. Вариант критерия, используемый в

SPSS и Statistica, предназначенный для сравнения средних величин выборок, ориентирован на проверку гипотезы од­ нородности О том, что выборки извлечены из одной и той

же генеральной совокупности.

При этом предполагается, что обе выборки извлечены

из генеральных совокупностей, имеющих нормальные рас­

пределения. На практике получается, что критерий

Стьюдента при больших объемах выборок устойчив к от­

клонениям от нормальности.

В том же случае, когда выборки взяты из иных сово­

купностей, истинные значения признаков стРого говоря,

должны оцениваться с помощью специальных приемов.

Исходя из этого критерий Стьюдента требует нормально­

сти распределений выборок.

для корректного использования критерия Стьюдента

необходимо иметь представление о дисперсиях генераль­

ных совокупностей. Здесь же может быть несколько ва­

риантов:

дисперсии известны и равны;

дисперсии известны, но неравны;

дисперсии неизвестны, но предполагается их равен­

ство;

дисперсии неизвестны, их равенство не предпола­

гается.

Могуг случаться и такие ситуаuии, когда исследователь

сталкивается с равными и неравными объемами выборок,

а также свя~нных и несвязанных выборок. В медико-био­

логических исследованиях дисаерсии генеральных совокуп­

ностей большей частью неизвестны, но предполагается их

равенство ме.>.КдУ собой; и выборки могут иметь различные

.8

Медицинска. аатмCl1tо

объемы. В этом случае статистика критерия Стъюдента вы­

числяется по следующей формуле:

 

 

XI-X2

t

ЭAlllUpu'l.

=--=.-=~"'==="

 

2 JRll'

 

 

s -+-.

 

 

n) n2

где х - средние значения выборок; n - объемы выборок;

i- - объединенная оценка выборочной дисперсии,

формула ·которой показана ниже:

s2 =Sl2 (л. -1)+si .(~-1) ,

л. +~-2

Выборочные дисперсии получаем по следующим фор­

мулам:

s~;L(п:-х;)2

и

л.-l

sf; L(~_~)2.

"2 -1

Не менее поПулярен другой параметрический крите­

рий - F-критерий Фишера. Эroт прием обработки стати­

стической информации используют при проведении дис­

персионного анализа при отыскании npичинно-следствен­

ных связей между анализируемыми признаками. И мы

обсудим проблемы его использования чyrь позднее.

Из непараметрических критериев для сравнения двух выборок популярен U-критерий Манна-Уитни. Надо

признать, что в медико-биологических исследованиях эта

группа методик сгатистической обработкиданных исполь­

зуется слабо. И причина такоro игнорирования совершен­

но не поддается осмыслению, поскольку именно крите-

Глава 5. Критерм.. рам....й уровне ПРМЭNaка

.7

рий Манна-Уитни практически не имеет ограничений на

объемы выборок (уже одно то, что анализ можно вести,

имея всего три измерения (!) говорит само за себя). По­

мимо этого он позволяет сравнивать выборки разного

объема.

Критерий легко адаптировать ДЛЯ проверки нулевой

гипотезы о том, что средние значения двух выборок не

отличаЮТСЯ дрyr от друга. Он - непараметрический ана­ лог критерия Стьюдента для независимbIX выборок, не­

критичен к нормальности распределения, поскольку ос­

нован на paHrax наблюдений. Для применения критерия Манна-Уитни данные выборок временно объединяют и

ран:жируют, а затем подсчитывают суммы paHroB, получен­

ные для каждой выборки_ Статистика критерия вычисля­ ется по следующим формулам:

и

 

x

х

 

=. +n -(n +l)_D

ЭIIIfIIJIIl.·

".

IIJ..

2

.1. 'шах,

R.... =rnax(R. +~).

где nl ;! - объемы выборок,

R,.2 - суммы рангов по выборкам,

Rпrц - наибольшая из двух ранговых сумм,

n - объем выборки, имеющей наибольшую сумму

ж

ранюв.

)',,~~,,~ IlJ. • • • • • • • • • • • • • • • • • • • • • •

Та.езадача примеllellие критерия Стыодента дNЯ ВЫ-

явnения ра3Пичий в уровне ИСО1едуемого приэнака дnя

двух несвяэанных выборок (naкет Statistica)

Решение:

1. Выдвигаем альтернативные гипотезы.

2. ЗапуСТИВ пмет, neреКI1IОЧИМСЯ В модуль (Основные

статистики и таблицы).

3. В главном меню naкeтa выберем команды (Файл) -

(Новые данные) и зададим имя и маршрут размещения фай-

••

МеДИЦИНСКёlЯ статистика

 

ла данных к этой задаче. Затем введем данные по выборкам

вотдельные столбцы: 1 - для первой и 2 _. для второй.

4.Выполним проверку нормальности расl1реде.лениЙ ана­

логично решеНИI9 .ранним задачам. Для каждой выборки в

окне ее гистограммы получаем статистику Шапиро-Уилк­

са и оценку ее значимости, как и предыдущем примере. По­

скольку нормальность распределений подтверждена,·для

сравнения выборок можно применить параметрический кри­

терий Стьюдента.

5.Для этого в окне модуля (Основные статистики и таб­

лицы) (Тест для независимых выборок).

6.В диалоговом окне теста выполним следующее:

В поле (Исходный файл) выберем (Каждая перемен­

ная содержит данные одной групп'ы). Второе возмож­

ное значение здесь - (Совместная запись наблюде­

ний групп, использующая группирующую перемен­

ную) - применяется, когда выборки записаны в общий столбец.

Нажав кнопку (Переменные, или группы), расставим

'в списках переменные 1 и 2.

В блоке (Параметры) поставим флажок в поле (Тест

сраздельным оцениванием дисперсий выборок) в

силу того, что мы не делали предположения о равен­

~TBe этих ДИС11ерсиЙ. После чего, нажав ОК, возвра­

тимся в окно теста и нажмем на кнопку (тестирова­

ние).

7. В 110явившейся таблице результатов анализа даются

два значения критерия и соответственно две оценки его

уровня значимости. Именно второе значение критерия (Тест

с раздельным оцениванием дисперсий выборок) нам и нуж­

но. И хотя оценка его значимости «р» (р-двухстороннее),

совпадает с предыдущей, в общем случае мы должны ори­

ентироваться именно на нее. Таким образом, полученный

результат вновь показывает отсутствие значимых отличий в

средних значениях выборок. И это означает, что статисти~ чески значимые различия в выборках отсутствуют.

• • • • • • • • • • • •