Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
352.doc
Скачиваний:
13
Добавлен:
30.04.2022
Размер:
2.75 Mб
Скачать

11. Критерии согласия

Пусть статистическое распределение выровнено с помощью некоторой теоретической кривой f(x) (рис.). Между теоретическим и статистическим распределениями неизбежны некоторые расхождения, как бы хорошо ни была подобрана кривая. Спрашивается: объясняются ли эти расхождения только лишь случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они существенны и связаны с тем, что данная кривая плохо выравнивает данное статистическое распределение. Таким образом, возникает вопрос, связанный с согласованием теоретического и статистического распределений, а именно вопрос проверки гипотез.

Для ответа на этот вопрос служат так называемые «критерии согласия».

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия: («хи-квадрат») К. Пирсона, Колмогорова, Смирнова и др.

Рассмотрим один из наиболее часто применяемых критериев согласия – так называемый «критерий » Пирсона. Критерий не доказывает справедливость гипотезы - генеральная совокупность распределена по закону А, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Пусть произведено n независимых опытов, в каждом из которых величина Х приняла определенное значение. Результаты опытов сведены в k разрядов в виде статистического ряда:

Таблица 10

Ii

x1;x2

x2;x3

. . .

xi;xi+1

. . .

xk;xk+1

pi*

p1*

p2*

. . .

pi*

. . .

pk*

Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина Х имеет данный закон распределения (заданный функцией распределения F(x) или плотностью f(x)), который назовем «теоретическим».

Зная теоретический закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из разрядов: p1, p2, ..., pk.

Проверяя согласованность теоретического и статистического распределений, исходят из расхождений U между теоретическими вероятностями pi и наблюдаемыми частотами (за счет чисто случайных причин). В качестве меры расхождения между теоретическим и статистическим распределениями выбирается сумма квадратов отклонений (pi*- pi), взятая с некоторыми «весами» сi:

.

Коэффициенты сi вводят потому, что в общем случае отклонения, относящиеся к различным разрядам, нельзя считать равноправными по значимости. Одно и то же по абсолютной величине отклонение (pi*- pi) может быть мало значительным, если сама вероятность pi велика, и очень заметным, если она мала. Поэтому в качестве сi Пирсон предложил отношение

,

тогда мера расхождения обозначается :

.

Для удобства вычислений применяется формула

или

( 2 )

где - эмпирические частоты, - теоретические частоты.

Распределение зависит от параметра k, называемого числом «степеней свободы» распределения. Число степеней свободы k равно числу разрядов r (число групп выборки или число вариант) минус число s независимых условий («связей»), наложенных на частоты pi* . Например, сумма всех частот равна единице, это требование (условие) накладывается во всех случаях; совпадение теоретических и статистических средних, дисперсий (накладываемые условия для нормального распределения) и так далее. Итак, если предполагаемое распределение нормальное, то число степеней свободы .

Для распределения составлены специальные таблицы. Пользуясь ими можно для каждого значения и числа степеней свободы k , найти вероятность того, что величина, распределенная по закону , превзойдет это значение.

Распределение дает возможность оценить степень согласованности теоретического и статистического распределений. Пусть величина Х действительно распределена по закону F(x). Тогда вероятность р, определенная по таблице 4 приложения, есть вероятность того, что за счет чисто случайных причин мера расхождения теоретического и статистического распределений будет не меньше, чем фактически наблюдаемое в данной серии опытов значение . Если эта вероятность мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе Н о том, что закон распределения величины Х есть F(x). Эту гипотезу следует отбросить как неправдоподобную. Однако, если вероятность р сравнительно велика, можно признать расхождения между теоретическим и практическим распределениями несущественными и отнести их за счет случайных причин. Гипотезу Н о том, что величина Х распределена по закону F(x), можно считать правдоподобной или, по крайней мере, не противоречащей опытным данным.

Итак, схема применения критерия к оценке согласованности теоретического и статистического распределений:

1. Определяется мера расхождения по формуле (2).

2. Определяется число степеней свободы k, как число разрядов r минус число наложенных связей s:

k = r - s.

3. По k и с помощью таблицы определяется вероятность того, что величина, имеющая распределение превзойдет данное значение .

Если эта вероятность весьма мала, то гипотеза отбрасывается как неправдоподобная. Если же эта вероятность относительно велика, гипотезу можно признать не противоречащей опытным данным. На практике, если р оказывается меньшим, чем 0,1, рекомендуется проверить эксперимент, если возможно – повторить его и в случае, если заметные расхождения появятся снова, пытаться искать более подходящий для описания статистических данных закон распределения.

Подчеркнем, что с помощью любого критерия согласия можно только в некоторых случаях опровергнуть выбранную гипотезу Н и отбросить ее как явно несогласную с опытными данными. Если же вероятность р велика, то этот факт сам по себе не считается доказательством справедливости гипотезы Н, а указывает только на то, что гипотеза не противоречит опытным данным.

Для проверки нулевой гипотезы: генеральная совокупность распределена нормально, используют следующее правило. Обозначим значение критерия, вычисленное по данным наблюдений, через .

Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия

(3)

и по таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы найти критическую точку , .

Если < - нет оснований отвергнуть нулевую гипотезу.

Если > - нулевую гипотезу отвергают.

Для контроля вычислений формулу (3) преобразуют к виду

. (4)

Пример. При уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:

Эмп. частоты….. .6 13 38 74 106 85 30 14

Теорет. частоты…3 14 42 82 99 76 37 13

Решение. Вычислим , для чего составим расчетную таблицу 11.

Таблица 11

1

2

3

4

5

6

7

8

i

-

( - )

( - ) /

/

1

2

3

4

5

6

7

8

6

13

38

74

106

85

30

14

3

14

42

82

99

76

37

13

3

-1

-4

-8

7

9

-7

1

9

1

16

64

49

81

49

1

3

0,07

0,38

0,78

0,49

1,07

1,32

0,08

36

169

1444

5476

11236

7225

900

196

12

12,07

34,38

66,78

113,49

95,07

24,32

15,08

366

366

=7,19

373,19

Контроль: =7,19 (по формуле (4)). Вычисления произведены правильно.

Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) r = 8, k = 8 – 3 = 5.

По таблице критических точек распределения , по уровню значимости и числу степеней свободы k = 5 находим .

Так как < - нет оснований отвергнуть нулевую гипотезу. Другими словами расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]