- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
Выяснение вопроса о принадлежности выборочных данных нормально распределенному признаку генеральной совокупности является одной из важнейших задач математической статистики. Предположение о нормальном распределении некоторой случайной величины требуется при проверке многих статистических гипотез, в основных положениях дисперсионного и регрессионного анализов.
Существует несколько способов, позволяющих по выборочным данным с различной степенью уверенности принять или отвергнуть предположение о нормальном распределении признака. Один из них рассматривается ниже.
Пусть непрерывная случайная величина (признак) представлена выборкой значений в виде интервального распределения, причем известны выборочное среднее и исправленное выборочное с.к.о. .
Пусть имеются основания предполагать, что случайная величина подчинена нормальному закону распределения (например, из визуального соответствия гистограммы и нормальной кривой).
Проверка этой гипотезы при уровне значимости с помощью критерия Пирсона осуществляется по следующей схеме.
1. Нужно проанализировать интервальное распределение выборки, объем которой должен быть не менее 50, и в случае, если какому-нибудь частичному интервалу выборочных значений соответствует эмпирическая частота , которая меньше, чем 5, этот интервал следует объединить с соседним (соседними), поставив в соответствие новому интервалу сумму эмпирических частот объединенных интервалов. Так как нормальное распределение определено для всех действительных значений , то принято левую границу первого частичного интервала расширить до , а правую границу последнего до . По окончании описанной процедуры будем обозначать число частичных интервалов через .
2. В предположении, что исследуемая случайная величина действительно распределена нормально с параметрами и ( ~ ), нужно вычислить вероятности попадания ее значений в каждый из частичных интервалов по формуле
; , (11.1)
где , и заменены соответственно на и , а значения функции Лапласа можно найти в таблицах приложения 2. При безошибочном счете должно выполняться условие
.
3. Нужно вычислить теоретические частоты по формулам
, (11.2)
где –объем выборки. Отметим, что при этом должно выполняться условие .
4. Теперь требуется вычислить наблюдаемое значение критерия :
. (11.3)
Кроме того, нужно найти критическое значение критерия ( ) в зависимости от выбранного уровня значимости и числа степеней свободы . Это осуществляется с помощью таблиц приложения 3.
5. Наконец необходимо сравнить полученные значения и :
если > , то гипотеза о нормальном распределении случайной величины при уровне значимости отвергается;
если < , то считают, что при заданном уровне значимости нет оснований отвергнуть гипотезу о нормальном распределении рассматриваемой случайной величины .
Пример 11.3. Имеется 200 изделий, изготовленных на некотором станке. Требуется при уровне значимости проверить гипотезу о подчинении нормальному закону распределения отклонений контролируемого размера изделий от номинала.
Решение. Обозначим рассматриваемые отклонения через и будем исходить из следующего выборочного распределения:
Таблица 11.1
Интервалы значений (мк)
|
(-20; -15) |
(-15; -10) |
(-10; -5) |
(-5; 0) |
(0; 5) |
Частоты значений |
7 |
11 |
15 |
24 |
49 |
Продолжение таблицы 11.1
(5; 10) |
(10; 15) |
(15; 20) |
(20; 25) |
(25; 30) |
41 |
26 |
17 |
7 |
3 |
Пусть известным образом вычислены = 4.3 мк и = 9.7 мк.
Согласно рекомендациям, данным выше, объединим последние два интервала таблицы 11.1. В результате получим уже 9 (m = 9) частичных интервалов (вместо первоначальных десяти). Теперь заполним следующую таблицу.
Таблица 11.2
Интервалы значений |
|
|
|
|
(- ; -15) |
0.0233 |
7 |
4.66 |
1.18 |
(-15; -10) |
0.0475 |
11 |
9.50 |
0.24 |
(-10; -5) |
0.0977 |
15 |
19.54 |
1.05 |
(-5; 0) |
0.1615 |
24 |
32.30 |
2.13 |
(0; 5) |
0.1979 |
49 |
39.58 |
2.24 |
(5; 10) |
0.1945 |
41 |
38.90 |
0.11 |
(10; 15) |
0.1419 |
26 |
28.38 |
0.20 |
(15; 20) |
0.0831 |
17 |
16.62 |
0.01 |
(20; + ) |
0.0526 |
10 |
10.52 |
0.02 |
Сумма |
1 |
200 |
200 |
7.18 |
Здесь
;
;
...........................................................................................
Поскольку
,
(0.05; 93) = (0.05; 6)=12.6,
то
< .
В ы в о д. В нашем случае при уровне значимости нет оснований отвергнуть гипотезу о нормальном распределении величин отклонений от номинала контролируемого размера изделий.
ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ К ЛАБОРАТОРНОЙ РАБОТЕ