Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 3000387.doc
Скачиваний:
6
Добавлен:
30.04.2022
Размер:
2.87 Mб
Скачать

3.4 Проверка статистических гипотез. Проверка гипотез о законе распределения

Информация, полученная по выборке, может быть использована для оценки правомерности некоторых предположений (гипотез) о генеральной совокупности.

Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин.

Гипотезы о неизвестном параметре Θ распределения бывают простые (Θ = Θ0) и сложные (Θ < Θ0, Θ > Θ0, Θ ≠ Θ0).

Проверяемую гипотезу обозначают H0, альтернативную – H1. Гипотезу проверяют на основании выборки. Случайный характер выборки может приводить к ошибкам. Ошибка первого рода имеет место тогда, когда отвергается верная гипотеза H0. Вероятность такой ошибки называется уровнем значимости и обозначается α. Чем меньше α, тем меньше вероятность отклонить верную гипотезу.

При ошибке второго рода отвергается верная на самом деле альтернативная гипотеза – H1 (принимается неверная гипотеза H0). Вероятность этой ошибки обозначают через β, а (1–β) называется мощностью критерия. Обычно при заданном уровне значимости α отыскивается критерий с наибольшей мощностью.

Проверка статистической гипотезы состоит из следующих этапов:

  • определение гипотез H0 и H1;

  • выбор статистики критерия (испытывать гипотезу можно на основе любой статистики, имеющей любое вероятностное распределение) и задание уровня значимости α;

  • по статистике критерия и уровню значимости α определяют границу (квантиль), определяющую критическую область (т.е. область отклонения гипотезы H0);

  • по выборке подсчитывают значение критерия;

  • если фактически наблюдаемое значение критерия попадает в критическую область, то основная гипотеза H0 отклоняется и принимается H1.

Проверка гипотез о законе распределения

Рассмотрим, как можно проверить гипотезу о распределении генеральной совокупности.

Пусть (x1, x2, … xm) – выборка из генеральной совокупности ξ с неизвестной функцией распределения, о которой выдвинута простая гипотеза H0: Fξ(x)=F(x), где F(x) полностью задана. Это распределение назовем теоретическим. Альтернативное распределение в данном случае не конкретизируется и речь идет просто о согласии данных и гипотезы H0.

Для проверки таких гипотез разработано несколько критериев согласия, раиболее известным является критерий Пирсона (χ2: хи-квадрат). При использовании χ2 –критерия вся область изменения генеральной совокупности делится на m интервалов (которые могут иметь различную длину). По выборке по этим же интервалам составляется статистический ряд (xi ni, где n – объем выборки: ) и вычисляются оценки параметров теоретического распределения. Тем самым теоретическое распределение будет полностью определено. Теперь по теоретическому распределению подсчитывают вероятности pi того, что случайная величина X принимает значения из i-го интервала по формуле

P(α≤X≤β) = F(β)–F(α).

По найденным pi ищутся теоретические частоты (mi=n·pi).

Гипотеза H0 верна, если теоретические (mi) и эмпирические (ni) частоты достаточно мало отличаются друг от друга. В 1900 году К. Пирсон предложил использовать в качестве меры отклонения эмирических данных (ni) от гипотетических значений (mi) следующую статистику

Согласно теореме Пирсона эта величина при имеет χ2 – распределение с числом степеней свободы (k=mr–1), m – число интервалов выборки, r – число параметров гипотетического распределения. Чем больше χ2, тем хуже согласованы теоретическое и эмпирическое распределения.

Поскольку относительная частота события является состоятельной оценкой его вероятности, то при больших n разности в сумме должны быть малы и, следовательно, значение статистики не должно быть слишком большим. При достаточно большом значении χ2 нужно отвергнуть гипотезу H0. Поэтому естественно задать только правостороннюю критическую область для гипотезы H0 в виде , где критическая граница tα при заданном уровне значимости α должна быть выбрана из условия

Пример 32. Пользуясь критерием согласия Пирсона, проверить при уровне значимости α=0,01 гипотезу H0 о том, что случайная величина X, статистический ряд которой приведен в таблице, распределена по нормальному закону.

Интервалы значений xi

(-4, -3)

(-3, -2)

(-2, -1)

(-1, 0)

Относительные частоты pi*

0,012

0,050

0,144

0,266

Интервалы значений xi

(0, 1)

(1, 2)

(2, 3)

(3, 4)

Относительные частоты pi*

0,240

0,176

0,092

0,020

Решение. Для вычисления вероятностей pi необходимо вычислить параметры, определяющие нормальный закон распределения (a и σ). Их оценки, рассчитанные по выборке объемом n = 500, дадут значения и .

Используя формулу

,

находим для каждого i-го интервала вероятность pi (вероятность попадания в i-й интервал случайной величины X, подчиненной нормальному закону распределения с параметрами , ) и результат оформим таблицей.

Интервалы значений xi

(-4, -3)

(-3, -2)

(-2, -1)

(-1, 0)

Вероятности pi

0,0126

0,0522

0,1422

0,2433

Интервалы значений xi

(0, 1)

(1, 2)

(2, 3)

(3, 4)

Вероятности pi

0,2668

0,1789

0,0770

0,0212

По данным двух таблиц вычислим наблюдаемое значение статистики Пирсона χ2 . Получим χ2 = 3,99.

Теперь определяем число степеней свободы k; так как количество интервалов равно m=8, а число параметров нормального распределения r=2, то k=8–2–1=5. По таблице распределения Пирсона для k=5 и α=0,01 найдем Так как , то нет оснований отвергать проверяемую гипотезу.