- •Практические занятия по предмету “Теории вероятностей и математическая статистика” 2-курс, направление математика, (рус.Гр.)
- •2.2 Числовые характеристики дискретных случайных величин
- •Решение типовых примеров:
- •Задания для закрепления:
- •Решение типовых примеров:
- •Задания для закрепления:
- •Решение типовых примеров:
- •Решение типовых примеров:
- •Задания для закрепления:
- •Решение типовых примеров:
- •Задания для закрепления:
- •Пусть требуется изучить множество объектов относительно некоторого качественного или количественного признака.
- •Решение типовых примеров:
- •Гистограмма частот
- •Задания для закрепления:
- •Построить гистограмму частот.
- •Структура денежных доходов и удельный вес расходов в денежных доходах населения (в процентах к денежным доходам) по годам
- •Точечные оценки
- •Решение типовых примеров:
- •Задания для закрепления:
- •Решение типовых примеров:
- •Решение типовых примеров:
- •Задания для закрепления:
- •Решение типовых примеров:
- •Задания для закрепления:
- •Критерия согласия Пирсона
- •Проверка гипотезы о нормальном распределении генеральной совокупности
- •Решение типовых примеров:
- •Задания для закрепления:
- •Решение типовых примеров:
- •Задания для закрепления:
Критерия согласия Пирсона
Пусть нулевая гипотеза НО состоит в том, что выборка объема n соответствует случайной величине Х с функцией распределения FO (x). Для статистической проверки этой гипотезы используется так называемый -критерий. Разобьем числовую ось на m непересекающихся интервалов , . Положим , . Эти вероятности вычисляются по известной функции . Обозначим через число элементов попавших в интервал . За меру отклонения распределения выборки от гипотетического принимается величина:
.
К. Пирсон доказал, что в случае справедливости гипотезы НО распределение случайной величины при сходится к распределению с степенями свободы. Зададим уровень надежности . Находим по таблице №9 (см. Приложение) критических значений распределения такое значение , что , где по выборке имеет « хи - квадрат » распределение c k степенями свободы.
Далее по выборке вычислим значение
.
Если при этом окажется , то такое отклонение значимо, и мы с уровнем надежности отвергаем гипотезу НО, как не согласующуюся с опытными данными. В приложениях интервалы выбирают так, чтобы число элементов выборки в каждом из них было не очень маленьким, например .
Если распределение зависит от неизвестных параметров, то вероятности вычисляют, заменяя параметры их оценками. В этом случае должно быть уменьшено на d - на число неизвестных параметров: т.е. .
Рассмотрим подробнее следующий случай.
Проверка гипотезы о нормальном распределении генеральной совокупности
-
Весь интервал наблюдаемых значений Х (т.е. выборки объема n) делят на m частичных интервалов одинаковой длины. Находят середины частичных интервалов ; в качестве частоты варианты принимают число вариант, которые попали в i - й интервал. В итоге получают последовательность равностоящих вариант и соответствующих им частот:
При этом .
-
Вычисляют выборочную среднею и выборочное среднее квадратическое отклонение .
-
Нормируют случайную величину X, т.е. переходят к случайной величине и вычисляют концы интервалов и , причем наименьшее значение Z, т.е. полагают равным , а наибольшее, т.е. полагают равным .
-
Вычисляют теоретические вероятности попадания Х в интервалы по равенству
,
где Ф(z) - интегральная функция Лапласа, значения которой приведены в приложении в таблице №4.
-
И наконец, находят значение статистики :
.
-
Нормальное распределение имеет параметра, т.е. , поэтому число степеней свободы .
-
Находят по таблице №9 (см. Приложение) критических значений распределения значение .
-
Если , то с уровнем надежности , нет оснований отвергнуть нулевую гипотезу.
-
Если , то с уровнем надежности отвергается гипотеза НО, как не согласующаяся с опытными данными.
Решение типовых примеров:
Пример 8. (Проверка гипотезы о распределении) Через равные промежутки времени в тонком слое раствора золота регистрировалось число частиц золота, попадавших в поле зрения микроскопа. В результате наблюдений было получено следующее эмпирическое распределение:
Х i |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
i |
112 |
168 |
130 |
68 |
32 |
5 |
1 |
1 |
В первой строке приведено число Х i частиц золота, а во второй строке - частота (i, т.е. число интервалов времени, в течение которых в поле зрения попало ровно Хi частиц; объем выборки . Проверить используя критерий , согласие с законом распределения Пуассона, приняв за уровень значимости .
Решение: Нулевая гипотеза НО состоит в том, что выборка, представленная статистическим рядом соответствует случайной величине Х, распределенной по закону Пуассона. Найдем выборочное среднее:
.
Примем в качестве оценки параметра распределения Пуассона выборочное среднее: .Следовательно предполагаемый закон Пуассона имеет вид:
.
Найдем теоретические вероятности попадания частиц золота в поле зрение микроскопа при наличии закона Пуассона с параметром :
Объединим малочисленные частоты (5+1+1=7) и соответствующие им теоретические вероятности (0,0155+0,0040+0,0009=0,0204). В результате объединения получим следующую таблицу:
Х i |
0 |
1 |
2 |
3 |
4 |
5 |
i |
112 |
168 |
130 |
68 |
32 |
7 |
p i |
0,2144 |
0,3301 |
0,2542 |
0,1305 |
0,0502 |
0,0204 |
Находим значение статистики . По таблице №9 (см. Приложение) по уровню надежности и числу степеней свободы находим . Так как , то нет основания отвергнуть нулевую гипотезу.
Вывод: Нет основания отвергнуть гипотезу о распределении случайного числа частиц золота, попадавших в поле зрения микроскопа, по закону Пуассона.
Пример 9. (Испытание гипотезы о нормальности распределения). Пользуясь критерием , при уровне надежности установить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки объема n=100:
номер интервала |
границы интервала |
Частота |
номер интервала |
границы интервала |
Частота |
||
i |
xi |
xi+1 |
ni |
i |
xi |
xi+1 |
ni |
1 |
3 |
8 |
6 |
5 |
23 |
28 |
16 |
2 |
8 |
13 |
8 |
6 |
28 |
33 |
8 |
3 |
13 |
18 |
15 |
7 |
33 |
38 |
7 |
4 |
18 |
23 |
40 |
|
|
|
|
Решение: Найдем середины частичных интервалов ; в качестве частоты варианты примем число вариант, которые попали в i - й интервал. В итоге получим распределение:
Вычислим выборочную среднею и выборочное среднее квадратическое отклонение:
Нормируют случайную величину X, т.е. переходят к случайной величине и вычисляют концы интервалов и .
Вычисляют теоретические вероятности попадания Х в интервалы по равенству:
,
где Ф(z) - интегральная функция Лапласа, значения которой приведены в приложении в таблице №4. Причем наименьшее значение Z, т.е. полагают равным , а наибольшее, т.е. полагают равным .
Например:
Аналогично вычисляются остальные теоретические вероятности. Ниже приведены результаты вычислений:
i |
границы интервала |
Ф (z i)
|
Ф (zi+1) |
pi = Ф (z i) - Ф (z i+1)
|
|
|
zi |
zi=1 |
|
|
|
1 2 3 4 5 6 7
|
- -1,74 -1,06 -0,37 0,32 1,00 1,69 |
-1,74 -1,06 -0,37 0,32 1,00 1,69
|
-0,5 -0,4591 -0,3554 -0,1443 0,1255 0,3413 0,4545 |
-0,4591 -0,3554 -0,1443 0,1255 0,3413 0,4545 0,5 |
0,0409 0,1037 0,2111 0,2698 0,2158 0,1132 0,0455 |
|
|
|
|
|
|
Найдем значение статистики , для чего составим следующую расчетную таблицу:
i |
pi |
npi=100pi |
ni |
ni - npi |
(ni - npi)2 |
|
1 2 3 4 5 6 7
|
0,0409 0,1037 0,2111 0,2698 0,2158 0,1132 0,0455 |
4,09 10,37 21,11 26,98 21,58 11,32 4,55 |
6 8 15 40 16 8 7 |
1,91 -2,37 -6,11 13,02 -5,58 -3,32 2,45 |
3,648 5,617 37,332 169,52 31,136 11,02 6,002 |
0,89 0,54 1,77 6,28 1,44 0,97 1,32 |
|
|
|
|
|
|
|
Нормальное распределение имеет параметра, т.е. , поэтому число степеней свободы . Найдем по таблице №9 (см. Приложение) критических значений распределения значение . Так как , то надежностью 95% отвергается гипотеза НО.
Вывод: Гипотеза о нормальном распределении генеральной совокупности не согласуется с данными выборки.