8028
.pdfКкр = {k>kкр}, |
|
/////// |
|
///////////// |
|
|
|
kкр |
|
К |
|
Критическая точка kкр |
здесь однозначно определяется согласно общего под- |
хода к построению критических областей критерия из условия
равенства вероятности ошибки I-рода заданному уровню значимости :
|
|
P(k>kкр) = 2 (k, n 1)dk |
= |
kкр |
|
Решение этого уравнения kкр = 2кр( , n-1) находятся однозначно, представ-
ляет собой обращение функции распределения «хи-квадрат» случайной величины и приводится в таблицах, например в [1, 2].
Случай Б: Н1 ={ < }. В этом случае |
критическая область критерия будет |
|||
левосторонней |
|
|
|
|
Ккр = {0<k<kкр}, |
/////// |
//////// |
||
|
|
kкр |
К |
|
а критическая точка однозначно определяется из уравнения |
|
|
kкр |
|
P(k<kкр) = 2 (k, n 1)dk |
= |
0 |
|
Таблиц его решений обычно не строится, поскольку левосторонняя критиче-
ская точка может быть легко выражена через функцию для правосторонней крити-
ческой точки. Действительно, т.к. P(k<kкр)+ (k>kкр)=1, то P(k>kкр)=1- и тогда решение для левосторонней точки будет следующим kкр = 2кр(1- , n-1).
Случай В: Н1={ }. В этом случае, объединяющем два предыдущих слу-
чая, критическая область критерия будет двухсторонней
Ккр = {k<kкр.л ; k>kкр.п }, |
//// /2 |
//// ////// |
/2 ////// |
10
kкр.л |
kкр.п |
К |
однако здесь критические точка kкр.л , kкр.п не определяется однозначно из уравне-
ния
kкр.п |
|
P(k<kкр.л) + P(k>kкр.п) = 2 (k, n 1)dk |
= |
kкр. л |
|
Доказано [1], что при условиях P(k<kкр.л)= и P(k>kкр.п)= мощность критерия
1- по отношению к конкурирующей гипотезе Н1 будет максимальной, тогда из этих двух условий критические точки находятся однозначно:
kкр.л = 2кр( 1- , n-1); kкр.п = 2кр( , n-1).
Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оцен-
ка дисперсии наблюдаемой нормальной случайной величины S2=40,25 или оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины равна 36 т.е. Н0={ =36}. За-
дадимся уровнем значимости гипотезы и альтернативной гипотезой Н1 ={}.
Наблюдаемое значение критерия |
kнабл =(15-1)40.25/36 =15.653. Критиче- |
ская область Ккр двухсторонняя, а критические точки будут: |
|
kкр.л = 2кр( 1- , 14) = 5.63; |
kкр.п = 2кр( 0.025, 14) =26.1 |
Видим, что kнабл не принадлежит критической области и значит, гипотеза принима-
ется, т.е. отличие наблюдаемого значения дисперсии от гипотетического не значи-
тельны. Если бы такая оценка дисперсии была получена по выборке меньшего объема n=7, то
kкр.л = 2кр( 1- , 6) = 14.4; |
kкр.п = 2кр( 0.025, 6) =1.24; |
тогда наблюдаемое значение критерия kнабл попадает в критическую область и про-
веряемая гипотеза отвергается.
5.2. Проверим теперь гипотезу о равенстве значения истинного (гипотетиче-
ского) математического ожидания а некоторой величине а0. Основная гипотеза тем
11
самым будет следующей Н0={а=а0}. В качестве критерия К возьмем случайную ве-
личину имеющую, при справедливости основной гипотезы, распределение Стью-
дента с n-1 степенями свободы:
|
|
|
fK( k H0 ) = Т(k,n-1), М[K]=0, D[K]=(n-2)/(n-3) |
К=(Хср-а0) n /S, |
Задаваясь уровнем значимости для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей
(альтернативной) гипотезы H1 в следующих случаях:
Случай А: Н1={а>а0}. В этом случае при справедливости конкурирующей ги-
потезы ожидаем сдвиг вероятных значений критерия К в большую сторону, поэтому критическая область критерия будет правосторонней Ккр={k>kкр}. Критическая точ-
ка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = .
Решение этого уравнения kкр= Tкр( , n-1) представляет собой обращение функции распределения случайной величины Стьюдента и приводится в многочис-
ленных таблицах, например в [ 1, 2].
Случай Б: Н1 ={ а<а0 }. В этом случае критическая область критерия будет ле-
восторонней Ккр={k<kкр}, а значения критерия отрицательными. Критическая точка kкр определяется из уравнения P(k<kкр)= , решение которого, в силу симметрии распределения Стьюдента, будет следующим kкр= Tкр( , n-1).
Случай В: Н1={а а }. В этом случае критическая область критерия будет двухсторонней Ккр={k<kкр.л ; k>kкр.п }. Однако здесь критические точки kкр.л и kкр.п
не определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)= Доказано, что при условии P(k<kкр.л)= P(k>kкр.п) = мощность критерия 1 - по отноше-
нию к конкурирующей гипотезе Н1 будет максимальной, тогда из этих уравнений
критические точки находятся однозначно: |
|
kкр.л = Ткр( , n-1); |
kкр.п =Ткр( , n-1). |
12
Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оцен-
ка математического ожидания наблюдаемой нормальной случайной величины
Хср=10,2 и оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том , что истинное математическое ожидание наблюдаемой ве-
личины равна 15 т.е. Н0 |
={а =15}. Зададимся уровнем значимости гипотезы |
||
и альтернативной гипотезой |
Н1={а }. Наблюдаемое значение критерия |
||
kнабл=(10,2-15)4/6,5=-2.954. |
Критическая область Ккр двухсторонняя, а критиче- |
||
ские точки будут: |
|
|
|
kкр.л =-Ткр( , 15) =-2.13; |
kкр.п =Ткр( 0.025, 15)=2.13 |
Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается,
т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.
Отметим, что при проверке гипотез Н0={а=Хср} и Н0={ =S2} при уровне зна-
чимости будут построены двухсторонние критические области такими, что об-
ласть принятия гипотез Кпр совпадет с доверительными интервалами, построенными с надежностью .
13
6. Примеры построения критериев значимости.
Пусть в опыте наблюдаются две нормально распределенные случайные вели-
чины X, Y с неизвестными значениями математических ожиданий ах, ау и дисперсий
х2, у2. Используя выборки ХВ={xj, nx}, YВ={yj, ny} объемов nx и ny, построим оценки неизвестных параметров случайных величин
ах*=Хср, аy*=Yср, х*= Sx, y*= Sy.
Сравним параметры двух наблюдаемых случайных величин, т.е. проверим гипотезу об однородности дисперсии { х2 = у2} и математического ожидания {ах = ау}.
6.1. Проверим гипотезу об однородности дисперсии Н0={ х2= у2}. В качестве критерия примем величину К, распределенную при условии
справедливости основной гипотезы по закону Фишера – Снедекора со степенями свободы n1, n2.
|
S 2 |
|
|
|
K= |
max |
>1; fK(k)=F(k, n1, n2); |
M[K]=n2/(n2-1) >1 |
|
S 2 |
||||
|
|
|
||
|
min |
|
|
|
Где Smax=max(Sx, Sy); |
Smin= min(Sx, Sy): n1, n2 |
объемы выборок с наибольшим и |
наименьшим значением стандарта S соответственно. Критическую область критерия строим как обычно исходя из вида альтернативных гипотез.
Случай А. Н1={ х2> у2} или Н2={ х2< у2}. Такие гипотезы рассматриваются,
когда имеется основание полагать что дисперсия одной из величин больше другой
(например когда Sx и Sy существенно отличаются по величине своих значений). В
этом случае критическая область будет правосторонней Ккр={k>kкр}, поскольку при справедливости любой из альтернатив, наиболее вероятное значение критерия сме-
щается в право.
Критическая точка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = .
Решение этого уравнения kкр= Fкр( , n1, n2) представляет собой обращение функции распределения случайной величины Фишера и приводится в многочислен-
ных таблицах, например в [1, 2].
14
Случай Б. Н3={ х2 у2}. Такая альтернативная гипотеза рассматривается то-
гда, когда неизвестно какая из величин обладает большей дисперсией. В этом случае имеются одновременно две альтернативных гипотезы Н1, Н2.
Если рассмотреть критерий К’=(Sx/Sy)2, то для него критическая область будет двухсторонней с критическими точками
kкр.л = Fкр(1- , nх,nу), kкр.п = Fкр( , nх,nу) .
Поскольку, критерии К’ и К связаны следующим соотношением:
К = К’ при Sх2 > Sу2 и К = 1/К’ при Sх2 < Sу2,
то правосторонние части критических областей для К и К’ совпадают, а левосторон-
няя часть критической области для К’ опять же совпадает с правосторонней частью для критерия К. Таким образом, критическая область
критерия Фишера и в этом случае правосторонняя с критической точкой kкр= Fкр( , n1,n2).
6.2. Проверим теперь гипотезу о равенстве математических ожиданий у наблюдаемых случайных величин Н0={ах=ау} при условии равенства их дисперсии
{ х2= у2}. В качестве критерия примем величину К, распределенную при условии справедливости основной гипотезы по закону Стьюдента с nх+ nу -2 степенями сво-
боды.
K= |
|
|
|
X ср |
Yср |
|
|
|
nx ny |
(nx ny |
2) |
|
; |
fK(k)=Т(k, nх+ nу -2), M[K]=0 |
|
|
|
|
|
|
|
|
|
|
|
nx ny |
|
||||
(n |
x |
1)S 2 (n |
y |
1)S 2 |
|
||||||||||
|
|
|
|
|
|
||||||||||
|
|
|
x |
|
y |
|
|
|
|
|
Рассмотрим опять два типа альтернативных гипотез:
Случай А. Н1={ах>ау} или Н2={ах<ау}. Критическая область при наличии таких альтернативных гипотез будет правосторонней или, соответственно, левосторонней и определяемая критическими точками распределения Стьюдента kкр = Tкр( ,nх+
nу -2).
Случай Б. Н3={ах ау}. Такая альтернативная гипотеза эквивалентна наличию двух равновозможных альтернатив Н1 и Н2. В этом случае критическая область
15
двухсторонняя Ккр={k<kкр.л; k>kкр.п} , тогда из условий P(k<kкр.л)=
P(k>kкр.п)= критические точки находятся однозначно:
kкр.л = Ткр( , nх+ nу -2); |
kкр.п =Ткр( , nх+ nу -2). |
Рассмотрим числовой пример: Пусть по выборкам объема nх=12 nу=8 получе-
ны оценки математических ожиданий наблюдаемых нормальных случайных вели-
чин Хср=10,2; Yср=16,8 и оценки среднеквадратических отклонения Sх=6,5 и Sу=7,4.
Примером подобных данных могут быть показания двух приборов при измерении одной и той же физической величины. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу об однородности случайных величин. Сначала проверим гипотезу о равенстве диспер-
сий Н0={ х2= у2}. Зададимся уровнем значимости гипотезы и воспользуем-
ся критерием Фишера – Снедекора . Поскольку значения Sх=6,5 и
Sу=7,4 отличаются незначительно, то в качестве альтернативной гипотезы примем
Н3 ={ х2 у2}. Критическая область односторонняя Ккр={k>kкр}, а критическую точку найдем из таблиц kкр = Fкр( , 8,12) = 4,5. Наблюдаемое значение крите-
рия kнабл=(7.4/6.5)2 =1,296 не принадлежит критической области, поэтому гипотеза о равенстве дисперсии принимается.
Поскольку гипотеза о равенстве дисперсии принимается, то проверим теперь гипотезу о равенстве математических ожиданий Н0={ах = ау}. Пусть уровень значи-
мости этой гипотезы а за единственную альтернативную гипотезу примем
Н2={ах < ау} и воспользуемся критерием Стьюдента.
Критическая область левосторонняя Ккр={k<kкр}, а критическую точку найдем из таблиц kкр= -Tкр( 5, 8+12-2)=-2.1. Наблюдаемое значение критерия kнабл=(10.1-16.8)*9.295/29.122=-2.385 принадлежит критической области, поэтому гипотеза о равенстве математических ожиданий отвергается (наблюдаемые в вы-
борках отличия значительны).
16
6.3. Проверим гипотезу о значимости коэффициента корреляции двух случай-
ных величин X, Y совместно наблюдаемых в выборках ХВ={xj}, YВ={yj} равного объема n . Вычислим выборочный коэффициент корреляции
в= |
n |
( XY)ср X срYср |
где (XY)ср= |
1 |
n |
, |
|||
|
|
|
|
|
|
xi yi |
|||
n 1 |
S |
S |
|
n |
|||||
|
y |
|
i 1 |
|
|||||
|
|
|
x |
|
|
|
|
Поскольку, отличное от нуля значение в характеризует степень зависимости вели-
чин X и Y , то для проверки значимости коэффициента корреляции проверим ги-
потезу Н0={ =0} при наличии альтернативной гипотезы Н1={ 0}. В качестве кри-
терия примем величину К, распределенную при условии справедливости основной гипотезы Н0 по закону Стьюдента с n-2 степенями свободы.
К= в |
n 2 |
|
2 |
fК(k)= T(k , n-2); М[K] = 0; D[K]=n-2/n-3 |
|
1 |
в |
|
|
|
|
|
|
Вэтом случае критическая область будет двухсторонней
Ккр={k<kкр.л;k>kкр.п}. Однако здесь критические точки kкр.л , kкр.п |
не |
|
|||||
определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)= где |
заданный |
||||||
уровень |
значимости. |
Доказано, |
что |
при |
условии |
P(k<kкр.л)= |
P(k>kкр.п)= мощность критерия 1- по отношению к конкурирующей гипотезе
Н1 будет максимальной, тогда из этих уравнений критические точки находятся од-
нозначно:
kкр.л = Ткр( , n-2); kкр.п =Ткр( , n-2).
Числовой пример. Пусть в опыте одновременно наблюдаются случайные величины
X, Y и получены выборки ХВ={xj}, YВ ={yj} объема n=15. По ним вычислены выбо-
рочные характеристики Хср=10,2; Yср=16,8; Sх=6,5 и Sу=7,4; (ХY)ср=160 тогда мож-
но вычислить наблюдаемое значение критерия
в=(15/14)(160-10,2*16,8)/(6,5*7,4)=-0,253; kнабл=-0,253 15 21 0.253 2 =-3,618
Задаваясь уровнем значимости гипотезы =0,05 найдем из таблиц критические точ-
ки двухсторонней критической области критерия kкр= Ткр(0,05 ;13)= Поскольку kнабл принадлежит критической области т.к.
17
kнабл >kкр, то гипотезу об отсутствии корреляционной зависимости между X, Y
отвергаем. Наблюдаемый коэффициент корреляции значим.
Используемые в различных критериях проверки функции для критических точек правосторонней области Ткр( ; n); Fкр( ; n1 n2); 2кр( ; n); представляют собой обратные распределения соответствующих величин и приводятся в таблицах
[1; 2]. В случае отсутствия в таблице нужных значений Fкр( ) можно воспользоваться табличной интерполяцией; например линейной.
При использовании вычислительных средств функции Fкр( ) обычно встроены в программное обеспечение. Так в приложения Excel из среды Microsoft Office в
категории статистических функций «f*» реализованы:
ХИ2ОБР( ; n) = 2кр( ; n); |
FРАСПОБР( ; n1 n2)= Fкр( ; n1; n2); |
|
CТЬЮДРАСПОБР(2 ; n) = Ткр( ; n); |
НОРМОБР(1- ) = Фкр( ). |
7. Критерий согласия Пирсона.
При рассмотрении критериев проверки гипотез о значении параметров слу-
чайных величин или критериев значимости предполагался вид закона распределе-
ния случайной величины. Закон для непрерывной случайной величины Х задается в общем случае функцией распределения FX(x, s) или функцией плотности распре-
деления fX(x, s), где s параметры распределения s=1,..,r.
Критерием согласия называется критерий проверки гипотезы о предполагае-
мом виде закона распределения. Рассмотрим один из подобных критериев, а именно критерий Пирсона.
Основной гипотезой при проверке является простая гипотеза о виде распреде-
ления с определенными параметрами Н0={ fX(x, s), s=1,..,r }. Пусть при наблюдении за случайной величиной получена выборка XB={xi, n} объема n. Суть критерия за-
ключается в сравнении частот эмпирических, полученных в наблюдаемой выборке,
и теоретических, вычисленных по виду предполагаемого распределения случайной величины. Эти частоты обычно различаются , но значимо ли это различие? Возмож-
но, это различие случайно и связано с конкретно наблюдаемой выборкой и величи-
18
ной ее объема, а возможно, что эти различия значимы и связаны с неверным пред-
положением о виде распределения случайной величины.
Эмпирические частоты строятся по выборке путем объединения наблюдаемых значений в группы. Это достигается, например, построением гистограммы выборки.
Разобьем наблюдаемый интервал значений в выборке на m равновеликих интерва-
лов:
= (Xmax – Xmin)/m , Xmax=max(xi) , Xmin=min(xi) .
Граничные точки интервалов разбиения hj=[xj, xj+1] ; j=1,..,m и их центры xj+0.5 вычисляются следующим образом хj=Xmin + (j-1) ; xj+0.5=( xj+1+ xj)/2. Подсчитав, число значений выборки, попавших в интервал hj, получим эмпирическую частоту nj
или относительную эмпирическую частоту j =nj/n попадания Х в интервал hj.
Для построения теоретических частот njт воспользуемся тем, что относитель-
ная теоретическая частота попадания случайной величины в интервал hj есть веро-
ятность попадания случайной величины в этот интервал jт=P(xj<X<xj+1). По-
скольку вероятность P(xj<X<xj+1)=FX(xj+1, s)-FX(xj, s) или равна приближенно при малых интервала разбиения
|
x j 1 |
|
|
P(xj<X<xj+1)= |
|
f X (x, s )dx |
fX(x, s) , |
|
|
|
|
|
x j |
|
|
то теоретическая частота попадания случайной величины Х в интервал hj будет njт=n jт или по приближенной формуле njт fX(x, s)n .
В качестве критерия проверки основной гипотезы Н0 примем случайную величину, характеризующую суммарное относительное отклонение теоретических и
эмпирических частот.
m |
(n |
|
nТ )2 |
|
К = |
|
j |
|
j |
|
|
Т |
|
|
j 1 |
|
|
n j |
|
Доказано, что распределение случайной величины К при n стремится к распре-
делению «хи-квадрат» 2 с m-r-1 степенями свободы, где m - число интервалов ги-
стограммы, r - число параметров предполагаемого распределения. Принимая за аль-
тернативную гипотезу Н1 гипотезу противоположную основной Н0 и учитывая что
К>0 , можно показать, что критическая область критерия будет правосторонней
19