Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8028

.pdf
Скачиваний:
0
Добавлен:
23.11.2023
Размер:
1.33 Mб
Скачать

Ккр = {k>kкр},

 

///////

 

/////////////

 

 

 

kкр

 

К

Критическая точка kкр

здесь однозначно определяется согласно общего под-

хода к построению критических областей критерия из условия

равенства вероятности ошибки I-рода заданному уровню значимости :

 

 

P(k>kкр) = 2 (k, n 1)dk

=

kкр

 

Решение этого уравнения kкр = 2кр( , n-1) находятся однозначно, представ-

ляет собой обращение функции распределения «хи-квадрат» случайной величины и приводится в таблицах, например в [1, 2].

Случай Б: Н1 ={ < }. В этом случае

критическая область критерия будет

левосторонней

 

 

 

 

Ккр = {0<k<kкр},

///////

////////

 

 

kкр

К

 

а критическая точка однозначно определяется из уравнения

 

 

kкр

 

P(k<kкр) = 2 (k, n 1)dk

=

0

 

Таблиц его решений обычно не строится, поскольку левосторонняя критиче-

ская точка может быть легко выражена через функцию для правосторонней крити-

ческой точки. Действительно, т.к. P(k<kкр)+ (k>kкр)=1, то P(k>kкр)=1- и тогда решение для левосторонней точки будет следующим kкр = 2кр(1- , n-1).

Случай В: Н1={ }. В этом случае, объединяющем два предыдущих слу-

чая, критическая область критерия будет двухсторонней

Ккр = {k<kкр.л ; k>kкр.п },

//// /2

//// //////

/2 //////

10

kкр.л

kкр.п

К

однако здесь критические точка kкр.л , kкр.п не определяется однозначно из уравне-

ния

kкр.п

 

P(k<kкр.л) + P(k>kкр.п) = 2 (k, n 1)dk

=

kкр. л

 

Доказано [1], что при условиях P(k<kкр.л)= и P(k>kкр.п)= мощность критерия

1- по отношению к конкурирующей гипотезе Н1 будет максимальной, тогда из этих двух условий критические точки находятся однозначно:

kкр.л = 2кр( 1- , n-1); kкр.п = 2кр( , n-1).

Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оцен-

ка дисперсии наблюдаемой нормальной случайной величины S2=40,25 или оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины равна 36 т.е. Н0={ =36}. За-

дадимся уровнем значимости гипотезы и альтернативной гипотезой Н1 ={}.

Наблюдаемое значение критерия

kнабл =(15-1)40.25/36 =15.653. Критиче-

ская область Ккр двухсторонняя, а критические точки будут:

kкр.л = 2кр( 1- , 14) = 5.63;

kкр.п = 2кр( 0.025, 14) =26.1

Видим, что kнабл не принадлежит критической области и значит, гипотеза принима-

ется, т.е. отличие наблюдаемого значения дисперсии от гипотетического не значи-

тельны. Если бы такая оценка дисперсии была получена по выборке меньшего объема n=7, то

kкр.л = 2кр( 1- , 6) = 14.4;

kкр.п = 2кр( 0.025, 6) =1.24;

тогда наблюдаемое значение критерия kнабл попадает в критическую область и про-

веряемая гипотеза отвергается.

5.2. Проверим теперь гипотезу о равенстве значения истинного (гипотетиче-

ского) математического ожидания а некоторой величине а0. Основная гипотеза тем

11

самым будет следующей Н0={а=а0}. В качестве критерия К возьмем случайную ве-

личину имеющую, при справедливости основной гипотезы, распределение Стью-

дента с n-1 степенями свободы:

 

 

 

fK( k H0 ) = Т(k,n-1), М[K]=0, D[K]=(n-2)/(n-3)

К=(Хср0) n /S,

Задаваясь уровнем значимости для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей

(альтернативной) гипотезы H1 в следующих случаях:

Случай А: Н1={а>а0}. В этом случае при справедливости конкурирующей ги-

потезы ожидаем сдвиг вероятных значений критерия К в большую сторону, поэтому критическая область критерия будет правосторонней Ккр={k>kкр}. Критическая точ-

ка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = .

Решение этого уравнения kкр= Tкр( , n-1) представляет собой обращение функции распределения случайной величины Стьюдента и приводится в многочис-

ленных таблицах, например в [ 1, 2].

Случай Б: Н1 ={ а<а0 }. В этом случае критическая область критерия будет ле-

восторонней Ккр={k<kкр}, а значения критерия отрицательными. Критическая точка kкр определяется из уравнения P(k<kкр)= , решение которого, в силу симметрии распределения Стьюдента, будет следующим kкр= Tкр( , n-1).

Случай В: Н1={а а }. В этом случае критическая область критерия будет двухсторонней Ккр={k<kкр.л ; k>kкр.п }. Однако здесь критические точки kкр.л и kкр.п

не определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)= Доказано, что при условии P(k<kкр.л)= P(k>kкр.п) = мощность критерия 1 - по отноше-

нию к конкурирующей гипотезе Н1 будет максимальной, тогда из этих уравнений

критические точки находятся однозначно:

 

kкр.л = Ткр( , n-1);

kкр.п кр( , n-1).

12

Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оцен-

ка математического ожидания наблюдаемой нормальной случайной величины

Хср=10,2 и оценка среднеквадратического отклонения S=6,5. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том , что истинное математическое ожидание наблюдаемой ве-

личины равна 15 т.е. Н0

={а =15}. Зададимся уровнем значимости гипотезы

и альтернативной гипотезой

Н1={а }. Наблюдаемое значение критерия

kнабл=(10,2-15)4/6,5=-2.954.

Критическая область Ккр двухсторонняя, а критиче-

ские точки будут:

 

 

 

kкр.л =-Ткр( , 15) =-2.13;

kкр.п кр( 0.025, 15)=2.13

Видим, что kнабл принадлежит критической области и значит, гипотеза отвергается,

т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.

Отметим, что при проверке гипотез Н0={а=Хср} и Н0={ =S2} при уровне зна-

чимости будут построены двухсторонние критические области такими, что об-

ласть принятия гипотез Кпр совпадет с доверительными интервалами, построенными с надежностью .

13

6. Примеры построения критериев значимости.

Пусть в опыте наблюдаются две нормально распределенные случайные вели-

чины X, Y с неизвестными значениями математических ожиданий ах, ау и дисперсий

х2, у2. Используя выборки ХВ={xj, nx}, YВ={yj, ny} объемов nx и ny, построим оценки неизвестных параметров случайных величин

ах*ср, аy*=Yср, х*= Sx, y*= Sy.

Сравним параметры двух наблюдаемых случайных величин, т.е. проверим гипотезу об однородности дисперсии { х2 = у2} и математического ожидания х = ау}.

6.1. Проверим гипотезу об однородности дисперсии Н0={ х2= у2}. В качестве критерия примем величину К, распределенную при условии

справедливости основной гипотезы по закону Фишера – Снедекора со степенями свободы n1, n2.

 

S 2

 

 

K=

max

>1; fK(k)=F(k, n1, n2);

M[K]=n2/(n2-1) >1

S 2

 

 

 

 

min

 

 

Где Smax=max(Sx, Sy);

Smin= min(Sx, Sy): n1, n2

объемы выборок с наибольшим и

наименьшим значением стандарта S соответственно. Критическую область критерия строим как обычно исходя из вида альтернативных гипотез.

Случай А. Н1={ х2> у2} или Н2={ х2< у2}. Такие гипотезы рассматриваются,

когда имеется основание полагать что дисперсия одной из величин больше другой

(например когда Sx и Sy существенно отличаются по величине своих значений). В

этом случае критическая область будет правосторонней Ккр={k>kкр}, поскольку при справедливости любой из альтернатив, наиболее вероятное значение критерия сме-

щается в право.

Критическая точка kкр однозначно определяется из условия равенства вероятности ошибки I-рода заданному уровню значимости P(k>kкр) = .

Решение этого уравнения kкр= Fкр( , n1, n2) представляет собой обращение функции распределения случайной величины Фишера и приводится в многочислен-

ных таблицах, например в [1, 2].

14

Случай Б. Н3={ х2 у2}. Такая альтернативная гипотеза рассматривается то-

гда, когда неизвестно какая из величин обладает большей дисперсией. В этом случае имеются одновременно две альтернативных гипотезы Н1, Н2.

Если рассмотреть критерий К=(Sx/Sy)2, то для него критическая область будет двухсторонней с критическими точками

kкр.л = Fкр(1- , nх,nу), kкр.п = Fкр( , nх,nу) .

Поскольку, критерии Ки К связаны следующим соотношением:

К = Кпри Sх2 > Sу2 и К = 1/Кпри Sх2 < Sу2,

то правосторонние части критических областей для К и Ксовпадают, а левосторон-

няя часть критической области для Копять же совпадает с правосторонней частью для критерия К. Таким образом, критическая область

критерия Фишера и в этом случае правосторонняя с критической точкой kкр= Fкр( , n1,n2).

6.2. Проверим теперь гипотезу о равенстве математических ожиданий у наблюдаемых случайных величин Н0={аху} при условии равенства их дисперсии

{ х2= у2}. В качестве критерия примем величину К, распределенную при условии справедливости основной гипотезы по закону Стьюдента с nх+ nу -2 степенями сво-

боды.

K=

 

 

 

X ср

Yср

 

 

 

nx ny

(nx ny

2)

 

;

fK(k)=Т(k, nх+ nу -2), M[K]=0

 

 

 

 

 

 

 

 

 

 

nx ny

 

(n

x

1)S 2 (n

y

1)S 2

 

 

 

 

 

 

 

 

 

 

x

 

y

 

 

 

 

 

Рассмотрим опять два типа альтернативных гипотез:

Случай А. Н1={аху} или Н2={аху}. Критическая область при наличии таких альтернативных гипотез будет правосторонней или, соответственно, левосторонней и определяемая критическими точками распределения Стьюдента kкр = Tкр( ,nх+

nу -2).

Случай Б. Н3={ах ау}. Такая альтернативная гипотеза эквивалентна наличию двух равновозможных альтернатив Н1 и Н2. В этом случае критическая область

15

двухсторонняя Ккр={k<kкр.л; k>kкр.п} , тогда из условий P(k<kкр.л)=

P(k>kкр.п)= критические точки находятся однозначно:

kкр.л = Ткр( , nх+ nу -2);

kкр.п кр( , nх+ nу -2).

Рассмотрим числовой пример: Пусть по выборкам объема nх=12 nу=8 получе-

ны оценки математических ожиданий наблюдаемых нормальных случайных вели-

чин Хср=10,2; Yср=16,8 и оценки среднеквадратических отклонения Sх=6,5 и Sу=7,4.

Примером подобных данных могут быть показания двух приборов при измерении одной и той же физической величины. Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу об однородности случайных величин. Сначала проверим гипотезу о равенстве диспер-

сий Н0={ х2= у2}. Зададимся уровнем значимости гипотезы и воспользуем-

ся критерием Фишера – Снедекора . Поскольку значения Sх=6,5 и

Sу=7,4 отличаются незначительно, то в качестве альтернативной гипотезы примем

Н3 ={ х2 у2}. Критическая область односторонняя Ккр={k>kкр}, а критическую точку найдем из таблиц kкр = Fкр( , 8,12) = 4,5. Наблюдаемое значение крите-

рия kнабл=(7.4/6.5)2 =1,296 не принадлежит критической области, поэтому гипотеза о равенстве дисперсии принимается.

Поскольку гипотеза о равенстве дисперсии принимается, то проверим теперь гипотезу о равенстве математических ожиданий Н0={ах = ау}. Пусть уровень значи-

мости этой гипотезы а за единственную альтернативную гипотезу примем

Н2={ах < ау} и воспользуемся критерием Стьюдента.

Критическая область левосторонняя Ккр={k<kкр}, а критическую точку найдем из таблиц kкр= -Tкр( 5, 8+12-2)=-2.1. Наблюдаемое значение критерия kнабл=(10.1-16.8)*9.295/29.122=-2.385 принадлежит критической области, поэтому гипотеза о равенстве математических ожиданий отвергается (наблюдаемые в вы-

борках отличия значительны).

16

6.3. Проверим гипотезу о значимости коэффициента корреляции двух случай-

ных величин X, Y совместно наблюдаемых в выборках ХВ={xj}, YВ={yj} равного объема n . Вычислим выборочный коэффициент корреляции

в=

n

( XY)ср X срYср

где (XY)ср=

1

n

,

 

 

 

 

 

 

xi yi

n 1

S

S

 

n

 

y

 

i 1

 

 

 

 

x

 

 

 

 

Поскольку, отличное от нуля значение в характеризует степень зависимости вели-

чин X и Y , то для проверки значимости коэффициента корреляции проверим ги-

потезу Н0={ =0} при наличии альтернативной гипотезы Н1={ 0}. В качестве кри-

терия примем величину К, распределенную при условии справедливости основной гипотезы Н0 по закону Стьюдента с n-2 степенями свободы.

К= в

n 2

 

2

fК(k)= T(k , n-2); М[K] = 0; D[K]=n-2/n-3

 

1

в

 

 

 

 

 

Вэтом случае критическая область будет двухсторонней

Ккр={k<kкр.л;k>kкр.п}. Однако здесь критические точки kкр.л , kкр.п

не

 

определяются однозначно из уравнения P(k<kкр.л)+P(k>kкр.п)= где

заданный

уровень

значимости.

Доказано,

что

при

условии

P(k<kкр.л)=

P(k>kкр.п)= мощность критерия 1- по отношению к конкурирующей гипотезе

Н1 будет максимальной, тогда из этих уравнений критические точки находятся од-

нозначно:

kкр.л = Ткр( , n-2); kкр.п кр( , n-2).

Числовой пример. Пусть в опыте одновременно наблюдаются случайные величины

X, Y и получены выборки ХВ={xj}, YВ ={yj} объема n=15. По ним вычислены выбо-

рочные характеристики Хср=10,2; Yср=16,8; Sх=6,5 и Sу=7,4; (ХY)ср=160 тогда мож-

но вычислить наблюдаемое значение критерия

в=(15/14)(160-10,2*16,8)/(6,5*7,4)=-0,253; kнабл=-0,253 15 21 0.253 2 =-3,618

Задаваясь уровнем значимости гипотезы =0,05 найдем из таблиц критические точ-

ки двухсторонней критической области критерия kкр= Ткр(0,05 ;13)= Поскольку kнабл принадлежит критической области т.к.

17

kнабл >kкр, то гипотезу об отсутствии корреляционной зависимости между X, Y

отвергаем. Наблюдаемый коэффициент корреляции значим.

Используемые в различных критериях проверки функции для критических точек правосторонней области Ткр( ; n); Fкр( ; n1 n2); 2кр( ; n); представляют собой обратные распределения соответствующих величин и приводятся в таблицах

[1; 2]. В случае отсутствия в таблице нужных значений Fкр( ) можно воспользоваться табличной интерполяцией; например линейной.

При использовании вычислительных средств функции Fкр( ) обычно встроены в программное обеспечение. Так в приложения Excel из среды Microsoft Office в

категории статистических функций «f*» реализованы:

ХИ2ОБР( ; n) = 2кр( ; n);

FРАСПОБР( ; n1 n2)= Fкр( ; n1; n2);

CТЬЮДРАСПОБР(2 ; n) = Ткр( ; n);

НОРМОБР(1- ) = Фкр( ).

7. Критерий согласия Пирсона.

При рассмотрении критериев проверки гипотез о значении параметров слу-

чайных величин или критериев значимости предполагался вид закона распределе-

ния случайной величины. Закон для непрерывной случайной величины Х задается в общем случае функцией распределения FX(x, s) или функцией плотности распре-

деления fX(x, s), где s параметры распределения s=1,..,r.

Критерием согласия называется критерий проверки гипотезы о предполагае-

мом виде закона распределения. Рассмотрим один из подобных критериев, а именно критерий Пирсона.

Основной гипотезой при проверке является простая гипотеза о виде распреде-

ления с определенными параметрами Н0={ fX(x, s), s=1,..,r }. Пусть при наблюдении за случайной величиной получена выборка XB={xi, n} объема n. Суть критерия за-

ключается в сравнении частот эмпирических, полученных в наблюдаемой выборке,

и теоретических, вычисленных по виду предполагаемого распределения случайной величины. Эти частоты обычно различаются , но значимо ли это различие? Возмож-

но, это различие случайно и связано с конкретно наблюдаемой выборкой и величи-

18

ной ее объема, а возможно, что эти различия значимы и связаны с неверным пред-

положением о виде распределения случайной величины.

Эмпирические частоты строятся по выборке путем объединения наблюдаемых значений в группы. Это достигается, например, построением гистограммы выборки.

Разобьем наблюдаемый интервал значений в выборке на m равновеликих интерва-

лов:

= (Xmax – Xmin)/m , Xmax=max(xi) , Xmin=min(xi) .

Граничные точки интервалов разбиения hj=[xj, xj+1] ; j=1,..,m и их центры xj+0.5 вычисляются следующим образом хj=Xmin + (j-1) ; xj+0.5=( xj+1+ xj)/2. Подсчитав, число значений выборки, попавших в интервал hj, получим эмпирическую частоту nj

или относительную эмпирическую частоту j =nj/n попадания Х в интервал hj.

Для построения теоретических частот njт воспользуемся тем, что относитель-

ная теоретическая частота попадания случайной величины в интервал hj есть веро-

ятность попадания случайной величины в этот интервал jт=P(xj<X<xj+1). По-

скольку вероятность P(xj<X<xj+1)=FX(xj+1, s)-FX(xj, s) или равна приближенно при малых интервала разбиения

 

x j 1

 

 

P(xj<X<xj+1)=

 

f X (x, s )dx

fX(x, s) ,

 

 

 

 

x j

 

 

то теоретическая частота попадания случайной величины Х в интервал hj будет njт=n jт или по приближенной формуле njт fX(x, s)n .

В качестве критерия проверки основной гипотезы Н0 примем случайную величину, характеризующую суммарное относительное отклонение теоретических и

эмпирических частот.

m

(n

 

nТ )2

К =

 

j

 

j

 

 

Т

 

j 1

 

 

n j

 

Доказано, что распределение случайной величины К при n стремится к распре-

делению «хи-квадрат» 2 с m-r-1 степенями свободы, где m - число интервалов ги-

стограммы, r - число параметров предполагаемого распределения. Принимая за аль-

тернативную гипотезу Н1 гипотезу противоположную основной Н0 и учитывая что

К>0 , можно показать, что критическая область критерия будет правосторонней

19

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]