8028
.pdf2.1. Предполагая, что наблюдаемая величина Х имеет нормальное распреде-
ление, построим доверительные интервалы для математического ожидания a=М[X]
и среднеквадратического отклонения = D( X ) при уровне надежности =0,95.
Поскольку известно, что величина t=(Хср-а) n /S имеет распределение Стью-
дента с n-1 степенью свободы, то решая уравнение Р( t <t )= относительно t
можно построить симметричный интервал ХВ - <а<ХВ + , в котором с вероятно-
стью находится математическое ожидание а. Величина =t S/ n представляет со-
бой точность оценки. Решение t =t( ,n-1) есть обращенное распределение Стьюден-
та, оно протабулировано и может быть найдено и таблиц, например из [1,2 прило-
жение 3]. В рассматриваемом примере t =t(0,95;29)=2,045 , = 2,045*2,758/ 30
=1,03 и тогда доверительный интервал для математического ожидания будет
6,367 -1,03< a < 6,367+1,03 или 5,337< a < 7,397.
Для нахождения доверительного интервала оценки среднеквадратического от-
клонения воспользуемся тем, что величина
2=(n-1)S2/ 2 имеет распределение «Хи-квадрат» с n-1 степенью свободы. Задав-
шись надежностью интервальной оценки и решая уравнение |
P( 2 |
2 2 ) |
от- |
|
1 |
2 |
|
носительно 2 можно построить |
доверительный интервал. Определяя 12 , 22 из таб- |
||||
лиц, например [1,2 приложение |
5], |
переходим к эквивалентному |
уравнению |
||
P{(n 1)s2 / 2 2 (n 1)s2 |
/ 2} , |
построим доверительный интервал для в виде |
|||
2 |
1 |
|
|
|
|
min < < max . В нашем примере для |
=0.95 получим 2 |
16.05, 2 45.72 |
, тогда до- |
||
|
|
|
1 |
2 |
|
верительный интервал будет |
|
|
|
|
|
4,92 < 2 < 14,08 |
или |
2,22 < < 3,75. |
|
|
|
В нем оцениваемый параметр находится с вероятностью =0,95 |
|
2.2. Отметим, что построенные доверительные интервалы являются областями принятия гипотез Н0={а=Хср} и Н0={ =S} при их проверке с уровнем значимости
1- . Теперь проверим гипотезу о равенстве математического ожидания и диспер-
сии наблюдаемой случайной величины указанным в задании гипотетическим значе-
ниям =0,8S, а=1,2Хср.
30
Проверим сначала гипотезу о том, что истинная дисперсия наблюдаемой ве-
личины равна =0,8S, т.е. Н0={ =0,8*2,785=2,228}. Зададимся уровнем значимости гипотезы и альтернативными гипотезами Н1 ={ 2,228} или Н2
={ >2,228}. Для проверки основной гипотезы воспользуемся критерием «Хи-
квадрат» К=(n-1)(S/ )2.
Наблюдаемое значение критерия kнабл =(30-1) (2,785/2,228)2 =45,313. Крити-
ческая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр.л = 2кр( 1- ; 29) = 16,047, kкр.п= 2кр( 0.025; 29) =45,722. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается, т.е. отличие наблюдаемого значения дисперсии от гипотетического не значительны. Если в качестве альтернативной рассматривать гипотезу Н2, по-
скольку <S значительно (20%), то при этом критическая область будет правосто-
ронней, а критическую точку kкр= 2кр( ; 29) =42,557 найдем из таблиц. Тогда наблюдаемое значение критерия kнабл =45,313 попадает в критическую область и проверяемая гипотеза отвергается. Результат проверки гипотезы при различных аль-
тернативах оказался разным, в итоге гипотеза отвергается.
Проверим теперь гипотезу о том, что истинное математическое ожидание наблюдаемой величины равна а=1,2Хср, т.е. Н0={а=1,2*6,367=7,64}. Зададимся уровнем значимости гипотезы и альтернативными гипотезами Н1 ={а
7,64} или Н2 ={а<7,64}. Для проверки основной гипотезы воспользуемся критери-
ем Стьюдента К=(Хср-а) n /S.
Наблюдаемое значение критерия kнабл=(6,367-7,64) 30 /2,785=-2,504. Крити-
ческая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр.л= Ткр( ; 29) = -2,045, kкр.п=Ткр( ; 29) = 2,045. Видим, что kнабл принадлежит критической области и значит, гипотеза отвергает-
ся, т.е. отличие наблюдаемого значения дисперсии от гипотетического значительны.
Если в качестве альтернативной рассматривать гипотезу Н2, поскольку а>Хср зна-
чительно (20%), то критическая область левосторонняя, а критическая точка
31
kкр= Ткр( , 29)=-1,699, тогда наблюдаемое значение критерия kнабл=-2,504 попадает в критическую область и проверяемая гипотеза опять отвергается. Результат проверки гипотезы при различных альтернативах оказался одинаковым, в итоге ги-
потеза отвергается.
2.3. Проверим гипотезу об однородности выборки, т.е. гипотезу о равенстве математического ожидания и дисперсии случайных величин, наблюдаемых в первой и второй половинах имеющейся выборки.
Разобьем выборку на две равные части объемов n1=15, n2=15 и вычислим по ним выборочные средние и выборочные стандарты
Хср1=5,8, Хср2=6,93, S1=2,957, S2=2,576.
Основная проверяемая гипотеза Н0={ = , а1=а2 }. Зададимся уровнем зна-
чимости гипотезы и альтернативными гипотезами Н1={ } или
Н2={а1 а2}, поскольку отличия в значениях Хср , S для разных частей выборки не существенны (менее чем 16%).
Для проверки основной гипотезы по отношению к альтернативной гипотезе
Н1 воспользуемся критерием Фишера
max( S |
, S |
2 |
) 2 |
|
||
|
1 |
|
|
|
>1 |
|
|
|
|
|
|||
K= |
|
, S |
|
|
|
|
min( S1 |
2 ) |
|
Наблюдаемое значение критерия kнабл=1,317. Критическая область Ккр при альтернативной гипотезе Н1 правосторонняя, а критическую точку найдем из таблицkкр = Fкр( ;15;15) =2,403. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается. Если в качестве альтернативной рас-
сматривать гипотезу Н2, то для проверки основной гипотезы воспользуемся крите-
рием Стьюдента
|
|
X |
ср1 Х ср2 |
|
|
|
|
|
|
|||||
К= |
|
|
|
n n (n n 2) |
, |
|||||||||
|
|
|
|
1 |
2 |
1 |
2 |
|||||||
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
n1 n2 |
|
|
|
|
|
(n 1)S 2 |
(n |
2 |
1)S 2 |
|
|
|
||||||
|
|
1 |
1 |
|
2 |
|
|
|
|
|
|
|
|
Наблюдаемое значение критерия kнабл = -1,119. Критическая область Ккр при этом Н1 двухсторонняя, а критические точки найдем из таблиц
32
kкр.л = Ткр( 15+15-2) = -2,048, kкр.п = Ткр( 15+15-2) = 2,048. Видим, что kнабл |
не принад- |
лежит критической области и значит, гипотеза опять принимается, |
т.е. отличие |
наблюдаемых значений математического ожидания и дисперсии в первой и второй половине выборки незначительны. Гипотеза об однородности выборки принимает-
ся.
Задание 3
3.1. Построим гистограмму выборки ХВ как удобную форму представления выборочного распределения. Для этого разобьем наблюдаемый интервал значений в выборке на m равновеликих интервалов
xmin= 1; xmax= 12; m=5; = xmax xmin =2,2 m
Количество интервалов разбиения m выбирается исходя из свойств выборки, реко-
мендуется использовать формулу m=1+3,2*lg(n), m=5,73 примем m=5. Граничные точки интервалов hj=[xj , xj+1], j=1,.., m и их центры xj+0.5 вычисляем по формулам следующим образом:
xj= xmin + ( j-1)* ; |
xj+0.5= (xj + xj+1)/2. |
Подсчитав для каждого интервала частоты попадания в него элементов выборки nj и
относительные частоты j =nj/n , сведем все результаты расчета наблюдаемых ча-
стот nj, j в следующую таблицу3 и построим гистограмму частот рис. 3.
Таблица 3
|
|
|
|
hj |
|
|
|
|
|
1 - 3,2 |
3,2 - 5,4 |
5,4 - 7,6 |
7,6 - 9,8 |
9,8 - 12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
xj+0.5 |
|
|
|
|
2,1 |
4,3 |
6,5 |
8,7 |
10,9 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
nj |
|
|
|
|
|
6 |
3 |
11 |
7 |
3 |
30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j |
|
|
|
|
|
0,2 |
0,1 |
0,37 |
0,23 |
0,1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|||||||
Теоретические частоты нормальной случайной величины |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||
uj= |
x j 0.5 |
Х ср |
-1,55808 |
-0,7547 |
0,04869 |
0,8520761,655462 |
|
|||||||||
|
|
S |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
||||||||
njт= |
n |
(uj) |
2,596642 |
6,57481 |
8,73068 |
6,0800442,220542 |
26,20272 |
|||||||||
S |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
(nТ |
n |
j |
)2 |
|
|
|
|
|
|
|
|||
j2 |
= |
|
j |
|
|
|
|
|
4,4607011,9436710,5898530,1391960,273606 |
7,407027 |
||||||
|
|
nТj |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
33
Теоретические частоты показательной случайной величины
njт= n exp( - xj+0.5 ) |
7,454 |
5,276 |
3,735 |
2,644 |
1,871 |
21 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(nТ |
n |
j |
)2 |
|
|
|
|
|
|
|
j2 |
= |
j |
|
|
|
0,284 |
0,982 |
14,135 |
7,180 |
0,681 |
23,26 |
|
|
nТj |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис.3.
3.2.Используя критерий согласия Пирсона, проверим гипотезу Н0={X~N(a, )}
онормальном распределении наблюдаемой случайной величины Х с параметрами
а=Хср, =S. Для этого подсчитаем теоретические частоты попадания величины Х в
интервалы hj
njт=nP(xj<Х<xj+1) =n(F (xj+1 )–F(xj)) n *f(xj+0.5).
Поскольку проверяется гипотеза о нормальном распределении то из таблиц находим
значения F(xj)= Ф( |
õj X ñð |
) , где Ф(u)= функция Лапласа, а f(u) - функция Гаусса. |
|
||
|
S |
Все результаты расчетов теоретических частот njт приведены в таблице 3 и на рис. 3, где приводится так же и кривая теоретических частот.
Согласно критерия Пирсона величина суммарного отклонения наблюдаемых частот от теоретических
2 = |
m |
(n |
|
nТ )2 |
|
|
|
j |
|
j |
|
|
|
Т |
|
||
|
j 1 |
|
|
n j |
|
34
при условии справедливости основной гипотезы имеет распределение «хи-квадрат» с m-3 степенями свободы и может быть принята за критерий проверки гипотезы Н0.
Задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу)
3=0,01 находим критическую точку критерия из решения уравнения
P( 2 > 2кр) = 3.
Его решения представляются обратным «хи-квадрат» распределением и находятся из таблиц 2кр= 2( , m-3), например в [1,2 приложение 5]. Тогда критерий проверки основной гипотезы Н0 о нормальном распределении выборочного признака Х состоит в следующем:
если 2набл 2кр гипотеза принимается (отклонения
теоретических и наблюдаемых частот не значительны),
если 2набл > 2кр гипотеза отвергается (отклонения значительны)
В нашем примере величина 2набл рассчитана в таблице и ее значение
2набл=7,407, а 2кр= 2(0,01, 2)=9,2 . Тогда согласно критерию Пирсона гипотеза о нормальном распределении случайной величины Х принимается.
3.3. Теперь проверим гипотезу Н0 ={X ~Е( )} о показательном распределе-
нии наблюдаемой случайной величины Х с параметром =1/Хср.
Теоретические частоты подсчитаем исходя из вида функции плотности показатель-
ного распределения
njт fX(xj+0.5) n ; fX(xj+0.5)= exp( - * xj+0.5 ) .
Рассчитанные теоретические частоты и суммарное относительное отклонение наблюдаемых и теоретических частот приводятся так же в таблице 3 и отражены на рис. 3 .
Из таблицы видно, что наблюдаемое значение критерия при проверке гипоте-
зы 2набл=23,26 принадлежит правосторонней критической области, так как крити-
ческая точка 2кр= 2(0,01, 5-2)=11,3. Тогда согласно критерию Пирсона гипотеза о показательном распределении наблюдаемой случайной величи-
ны Х отклоняется.
35
Задание 4
Пусть в опыте наблюдается одновременно значения двух случайных величин
Х, Y (двух признаков). В результате получена двухмерная выборка объема n=30
приведенная в таблице 4.
4.1. Вычислим выборочные средние Хср, Yср выборочные дисперсии Dx, Dy и
среднеквадратические отклонения xв, yв по каждому из признаков (признак X
рассчитан в Задании 1 ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
Xср=6,367; x=2,738; |
Yср=13,39; |
y=4,543 |
||||||||||||||
|
Выборочный коэффициент корреляции |
между наблюдаемыми случайными |
||||||||||||||||||
величинами вычислим по формуле: |
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
(XY ) |
ср Х |
срYср |
, |
где ( XY)ср |
1 n |
|
|
||||||
|
|
|
|
В |
|
|
|
|
|
|
|
|
X iYi |
|
|
|||||
|
|
|
|
|
|
X Y |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n i 1 |
|
|
||||
получим выборочное среднее произведение |
(XY)ср =91,943 и коэффициент корре- |
|||||||||||||||||||
ляции В= 0,538. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 4. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
X |
|
Y |
|
|
i |
|
X |
|
|
Y |
|
i |
|
X |
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
1 |
2 |
|
14,7 |
|
11 |
|
8 |
|
|
13,3 |
|
21 |
|
6 |
|
9,9 |
|
||
|
2 |
5 |
|
4,4 |
|
12 |
|
6 |
|
|
4,9 |
|
22 |
|
7 |
|
17,5 |
|
||
|
3 |
7 |
|
19,9 |
|
13 |
|
2 |
|
|
6,5 |
|
23 |
|
3 |
|
6,3 |
|
||
|
4 |
1 |
|
5,2 |
|
14 |
|
3 |
|
|
15,1 |
|
24 |
|
9 |
|
17,9 |
|
||
|
5 |
12 |
|
14 |
|
15 |
|
7 |
|
|
14,8 |
|
25 |
|
4 |
|
15 |
|
||
|
6 |
5 |
|
7,9 |
|
16 |
|
6 |
|
|
18 |
|
26 |
|
7 |
|
15,3 |
|
||
|
7 |
9 |
|
19,6 |
|
17 |
|
8 |
|
|
20 |
|
27 |
|
6 |
|
15 |
|
||
|
8 |
6 |
|
11,3 |
|
18 |
|
3 |
|
|
3,8 |
|
28 |
|
8 |
|
12,2 |
|
||
|
9 |
8 |
|
14,2 |
|
19 |
|
8 |
|
|
17,7 |
|
29 |
|
11 |
|
12,6 |
|
||
|
10 |
6 |
|
12 |
|
20 |
|
12 |
|
|
17,5 |
|
30 |
|
6 |
|
14,7 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Построим прямую линейной среднеквадратической регрессии
y1 Yср B Y (x X ср )
X
Вычислим коэффициенты этой прямой и получим ее уравнение y1 0,893x 7,706 .
Оно представляет собой линейное приближение уравнения регрессии y M[Y x] и
36
построено методом наименьших квадратов, т.е. сумма квадратов отклонения наблюдаемых в выборке точек (xi, yi) от соответствующих точек прямой (xi, y1 (xi))
является минимальной среди всех возможных прямых. Построенная прямая приве-
дена на рис. 4, на нем же приведены и точки выборки.
|
Прямая линейной |
|
|
|
среднеквадратической регрессии |
||
25 |
|
|
|
20 |
|
|
|
15 |
|
|
Y |
|
|
|
|
10 |
|
|
Y" |
5 |
|
|
|
0 |
|
|
|
0 |
5 |
10 |
15 |
|
|
Рис.4. |
|
4.2. Выборочный коэффициент корреляции В является случайной величиной,
поэтому полученное на нашей выборке значение В = 0,538 может не отражать ис-
тинного значения коэффициента корреляции (X,Y).
Проверим гипотезу о значимости выборочного коэффициента корреляции, это позволит судить о наличии корреляционной связи между признаками Х и Y. В каче-
стве основной гипотезы возьмем предположение об отсутствии корреляции
Н0={ =0}, допустим так же что двухмерная случайная величина (X,Y) имеет нор-
мальное распределение. Примем за критерий случайную величину
Т= B |
|
|
n 2 |
|
|
, |
|
|
|
|
|
||
|
|
|
||||
|
1 2 |
|||||
|
|
|
B |
которая, при справедливости основной гипотезы, имеет распределение Стьюдента с n-2 степенями свободы. Тогда, задаваясь уровнем значимости ошибки II-рода
37
(отвергнуть верную гипотезу) 4=0,05 и альтернативной гипотезой Н0={ 0},
находим критические точки двухсторонней критической области из решения уравнения
P(t >tкр) = 4
Эти решения представляются обратным распределением Стьюдента и находятся из таблиц tкр=Ткр( /2; n-2), например в [1,2 приложение 6]. Тогда критерий проверки основной гипотезы Н0 об отсутствии корреляции между X и Y состоит в следующем:
если tнабл tкр |
гипотеза принимается ( найденный коэффициент |
корреляции не значителен, случайно отличен от нуля), |
|
если tнабл > tкр |
гипотеза отвергается (корреляция значительна ) |
В нашем примере tнабл =3,377, а tкр=Ткр(0,025,28)=2,05 и тогда согласно крите-
рию гипотеза об отсутствии корреляции наблюдаемых случайных величин Х и Y
отвергается, т.е. найденный выборочный коэффициент корреляции значим.
38
Литература
1. Гмурман В.Е. Теория вероятностей и математическая статистика. |
М., |
“Высшая школа”, 2001.
2.Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М., “Высшая школа”, 2001.
3.Большев Л.Н., Смирнов Н.В. Таблицы математической статистики.
М., “Наука”, 1965.
4. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. М., “Наука”, 1969.
Содержание
1.Введение……………………………………………………………..3
2.Простые и сложные статистические гипотезы ……………….…..3
3.Проверка статистических гипотез …………………………………4
4.Построение критерия проверки гипотезы …………….……..……6
5.Примеры построения критериев проверки гипотез о значении параметров распределения нормальной случайной величины ...8
6.Примеры построения критериев значимости……………….. ….14
7.Критерий согласия Пирсона ……………………..………………..18
8.Задания для выполнения расчетно-графических работ ………....23
9.Пример выполнения расчетно-графической работы .….…….......28
Литература ………………………………….…………………..…..39
39