Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 800672

.pdf
Скачиваний:
26
Добавлен:
01.05.2022
Размер:
28.85 Mб
Скачать

тематическое ожидание S2, используя результат предыдущего преобразования

 

 

 

 

 

 

[

 

] =

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

(

 

 

− ) −

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

−1

 

 

 

 

 

 

 

 

=

 

 

 

=

 

1

 

 

 

 

[( −

 

) ]−

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

−1

 

 

 

 

 

− 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь мы

 

воспользовались

тем,

 

что

 

 

 

 

 

 

 

 

 

 

 

−1

 

 

 

 

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выборочный

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

. Оценка дисперсии, определяемая как[(

) ] =

центральный момент второго порядка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= =

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

будет смещенной оценкой, со смещением-

 

 

, это следует из

 

 

того, что обе оценки

связаны

 

 

 

 

 

простым

 

соотношением

=

 

 

 

 

 

 

 

 

равно

 

 

 

 

 

 

 

 

 

[ ] =

 

 

 

 

[

] =

 

 

 

 

 

 

 

 

,

 

 

следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

Смещение оценки

 

 

 

 

 

 

 

 

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсия оценки S

 

 

 

 

Можно показать[[23],] −что=

 

 

 

 

 

 

 

 

 

 

 

 

= −

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[

 

] =

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т. е., если . В силу теоремы 1 будет состоятельной оценкой дисперсии генеральной совокупности. Если среднее генеральной совокупности п известно, то несмещенной оценкой дисперсии является статистика

41

Действительно,

 

=

1

( −

)

 

 

 

[ ] =

1

=

( − ) =

1

[( − ) ] =

1

 

 

 

 

 

 

 

 

связаны

Свойства несмещенности и состоятельности не

2

 

друг с другом, т. е. ни одно из этих свойств не определяет другое. Например, оценка является смещенной оценкой дисперсии, однако эта оценка, как и оценка S2, является состоятельной. Это следует из того, что обе оценки связаны простым соотношением

=−1

Часто для оценки данного параметра может быть найдено несколько состоятельных и даже несмещенных оценок. Например, в случае выборки из генеральной совокупности имеющей нормальное распределение, наряду с выборочным средним, выборочная медиана является несмещенной и состоятельной оценкой среднего генеральной совокупности.

Дисперсии этих оценок равны соответственно и . Есте-

ственно, что при сравнении этих оценок следует отдать предпочтение выборочному среднему, как оценке, имеющей меньшую дисперсию. Такая оценка будет в среднем меньше отклоняться от истинного значения параметра, чем оценка с большей дисперсией, и будет более эффективной. Однако требования несмещенности и малой дисперсии могут быть несовместимы.

Чтобы найти разумный компромисс между величинами смещения и дисперсии, можно минимизировать средний квадрат ошибки, т. е. в качестве оценки параметра выбрать из условия минимума математического ожидания случайной величины ( - )2.

42

2.3.2.Интервальные оценки. Доверительный интервал и доверительная вероятность

При статистической обработке результатов наблюдений часто необходимо найти не только оценку неизвестного параметра , но и охарактеризовать точность этой оценки. С этой целью вводится понятие доверительного интервала.

Доверительным интервалом для параметра называ-

ется интервал ( , ), накрывающий истинное значение с

заданной вероятностью р = 1 - , т. е.

[ < < ] = 1− .

Число 1 - называется доверительной вероятностью,

 

 

 

ее

уровнем

значимости. Статистики

 

значение

и

=

 

( ,…,

)

определяемые по выборке x=1,

...,(хп

,…, )

 

 

 

 

 

из генеральной совокупности с неизвестным параметром

, называются соответственно нижней и верхней границами

доверительного интервала.

Доверительному интервалу можно дать следующую статистическую интерпретацию: в большой серии независимых экспериментов, в каждом из которых получена выборка объема п, в среднем (1- )*100% из общего числа построенных доверительных интервалов содержат истинное значение параметра .

Длина доверительного интервала, характеризующая точность интервального оценивания, зависит от объема выборки п и доверительной вероятности 1 - : при увеличении объема выборки длина доверительного интервала уменьшается, а с приближением доверительной вероятности к единице — увеличивается. Выбор доверительной вероятности определяется конкретными условиями. Обычно используются значения 1 - , равные 0,90; 0,95; 0,99.

При решении некоторых задач применяются односторонние интервалы, границы которых определяются из условий

43

Эти

[

 

<

 

] = 1 −

или

[

 

<

] = 1 −

 

 

 

 

 

 

 

 

 

интервалы

называются

соответственно

левосто-

ронними и правосторонними доверительными интервала-

ми.

Чтобы найти доверительный интервал для параметра , необходимо знать закон распределения статистики =

(

,…,

значение которой

является),

оценкой параметра 0. При этом для получения

доверительного интервала наименьшей длины при данном объеме выборки п и заданной доверительной вероятности 1 - в качестве оценки параметра следует брать наиболее эффективную оценку.

Один из методов построения доверительных интервалов состоит в следующем. Предположим, что существует стати-

 

 

 

Y такая, что:

 

 

 

стика Yа)=закон, распределения Y известен и не зависит от ;

.

б)

функция

 

 

,

непрерывна и строго монотонна по

 

Пусть, далее, 1 - заданная доверительная вероят-

ность, а

 

и

 

 

 

квантили распределения статистики Y

 

 

 

/

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

порядков

 

 

и

 

 

 

соответственно. Тогда с вероятностью 1 -

 

 

 

 

 

выполняется

неравенство

 

 

 

 

1 −

 

 

 

 

 

 

<

,

<

 

 

 

Решая

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

неравенство относительно , найдем границы ,

и

доверительного интервала для .

 

 

 

Рассмотрим доверительные интервалы для параметров

нормально распределенной генеральной совокупности.

(

Доверительный

 

интервал

для среднего. Пусть

,…,

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, — выборка п наблюдений случайной величины X,

которая имеет нормальное распределение N(m, 2). В качестве оценки т возьмем выборочное среднее х. Предположим, что дисперсия генеральной совокупности 2 известна. Рассмотрим

44

статистику

 

 

 

 

 

 

, имеющую стандартное нормальное рас-

 

 

 

 

 

 

пределение

N(0, 1) независимо от т и других параметров.

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кроме того, Y как функция т, непрерывна и монотонна. Най-

дем квантили

 

 

и

 

 

 

 

 

 

 

стандартного нормального распреде-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ления N(0, 1). Следовательно, вероятность события, состояще-

го в том, что

 

< Y <

 

 

 

 

будет равна заданной доверитель-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ной вероятности 1 - , т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<

 

/√

 

 

<

 

 

 

 

 

 

 

 

 

 

 

неравенство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решая

 

 

 

 

 

 

 

 

 

 

<

 

 

 

<

 

 

 

 

 

 

= 1 − относительно т,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

получим, что с вероятностью 1 - выполняется следующее

условие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<

<

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используя соотношение для квантилей стандартного

нормального распределения:

=-

 

 

найденный довери-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тельный интервал для т можно записать так:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<

<

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если дисперсия генеральной совокупности 2 неизвестна, то по выборке наблюдений определяют оценку дисперсии

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

=

 

=

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для среднего в этом случае

находят, используя статистику− 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеющую распределение

Стьюдента с п -1 степенью свободы.

 

 

=

 

/√

 

 

 

 

 

По заданной

доверительной

вероятности 1 - находим

с (п - 1)

( − 1)

и

 

 

( −1)

распределения Стьюдента

квантили

 

 

 

 

 

 

 

 

степенью свободы.

45

Решая неравенство

 

 

 

 

 

 

 

 

 

 

 

относительно т

и(

 

− 1) <

 

 

 

<

 

 

( − 1)

 

 

 

 

 

 

используя соотношение для квантилей рас-

пределения Стьюдента:

 

/√

 

( − 1)

 

 

 

( − 1) = −

 

 

 

 

 

 

 

 

 

 

 

 

 

 

получим, что доверительный интервал для среднего при неизвестной дисперсии равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( −1) < < +

 

 

 

 

 

( − 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для дисперсии. В зависи-

мости от того, известно или неизвестно среднее генеральной совокупности, для нахождения доверительного интервала применяют различные формулы. Рассмотрим случай, когда среднее генеральной совокупности неизвестно. В этом случае

в качестве оценки дисперсии используют выборочную дисперсию S2:

 

 

 

 

 

 

 

=

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Статистика

 

 

 

 

 

− 1

 

имеет распределение

 

 

 

 

 

 

 

 

 

1)

 

 

 

 

 

квантили

 

 

(

−1)

и

 

 

 

 

 

 

( − 1)

удовлетво-

. Определим

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( −

ряющие условию

 

 

(

 

−1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

− 1) <

 

 

 

 

 

 

 

<

 

 

 

( −1) = 1 −

 

Решая

 

 

 

 

 

 

 

 

 

 

 

 

 

неравенство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( −1) <

( −1)

<

 

 

 

 

( − 1)

 

 

 

 

 

 

 

 

 

 

 

 

относительно 2, получим доверительный интервал для дисперсии

46

(n −1)

<

 

<

(n

−1)

 

 

( − 1)

 

 

 

( − 1)

2.3.3. Проверка статистических гипотез. Основные понятия

Во многих случаях результаты наблюдений используются для проверки предположений (гипотез) относительно тех или иных свойств распределения генеральной совокупности. В частности, такого рода задачи возникают при сравнении различных технологических процессов или методов обработки по определенным измеряемым признакам, например по точности, производительности и т. д.

Пусть X — наблюдаемая дискретная или непрерывная случайная величина. Статистической гипотезой Н называется предположение относительно параметров или вида распределения случайной величины X. Статистическая гипотеза Н называется простой, если она однозначно определяет распределение случайной величины X; в противном случае, гипотеза Н называется сложной. Например, простой гипотезой является предположение о том, что случайная величина X распределена по нормальному закону N(0, 1); если же высказывается предположение, что случайная величина имеет нормальное распределение N(m, 1), где а т b, то это сложная гипотеза. Другим примером сложной гипотезы является предположение о том, что непрерывная случайная величина Х с вероятностью 1/3 принимает значение из интервала (1, 5); в этом случае распределение случайной величины X может быть любым из класса непрерывных распределений.

Часто распределение случайной величины X известно и по выборке наблюдений необходимо проверить предположения о значении параметров этого распределения. Такие гипо-

47

тезы называются параметрическими. В этой главе рассматривается проверка параметрических гипотез.

Проверяемая гипотеза называется нулевой гипотезой и обозначается H0. Наряду с гипотезой H0 рассматривают одну из альтернативных (конкурирующих) гипотез H1. Напри-

мер, если проверяется гипотеза H0 о параметре H0: = , где— известное значение, в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез

( ): > ;

( ): < ;

( ): ;

( ): = ,

где — известное значение. Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Правило, по которому принимается решение принять или отклонить гипотезу H0, называется критерием. Так как решение принимается на основе выборки наблюдений случайной величины X, необходимо выбрать подходящую статистику Z, называемую в этом случае статистикой критерия. При проверке простой параметрической гипотезы H0: = в качестве статистики критерия обычно выбирают ту же статистику, что и для оценки параметра .

Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, — достоверными. Этот принцип можно реализовать следующим образом. Перед анализом выборки назначается некоторая малая вероятность , называемая уровнем значимости. Пусть V — множество значений статистики Z, a Vk такое подмножество, что, при условии истинности гипотезы H0, вероятность попадания статистики критерия в Vk равна :

[ /

] =

Пусть в выборочное значение статистики Z, вычисленное по выборке наблюдений. Критерий формулируется

48

следующим образом: отклонить гипотезу H , если

при-

нять гипотезу H0, если

 

 

 

. Критерий,0основанныйв

на;

ис-

пользовании заранее

заданного уровня значимости ее, на-

в

 

/

 

 

 

зывают критерием значимости. Множество Vk всех значений статистики критерия Z, при которых принимается решение отклонить гипотезу H0, называется критической областью; область V \Vk называется областью принятия гипотезы H0.

Уровень значимости се определяет «размер» критической области Vk. Положение критической области на множестве значений статистики Z зависит от формулировки альтернативной гипотезы H1. Например, если проверяется гипотеза H0:

=

, а альтернативная гипотеза H1, формулируется как

:

 

>

 

(

 

<

 

)

, то критическая область размещается на

 

 

 

 

 

правом (левом) «хвосте» плотности распределения статистики

Z, т. е. имеет вид неравенства:

 

 

 

 

 

, где

и

квантили распределения

статистики соответственно по-

 

>

 

(

<

)

 

 

рядка)

1- и вычисленные при условии,

что верна гипотеза

H0. В этом случае критерий называется односторонним, соответственно право- и левосторонним. Если альтернативная гипотеза формулируется как : , критическая область размещается на обоих «хвостах» плотности распределения Z(pиc. 2.10), т. е. определяется совокупностью неравенств:

< и >

В этом случае критерий называется двусторонним. Таким образом, проверка статистической гипотезы при

помощи критерия значимости может быть разбита на следующие этапы:

1. Сформулировать проверяемую и альтернативную

,гипотезы.

2.Назначить уровень значимости ее.

49

3. Выбрать статистику Z критерия для проверки гипоте-

зы .

4. Определить выборочное распределение статистики Z критерия при условии, что верна гипотеза .

5. Определить критическую область Vk в зависимости от формулировки альтернативной гипотезы одним из нера-

 

и

<

 

<

, или совокупностью неравенств

венств:

>

,

 

<

 

 

 

 

 

 

6.Получить выборку наблюдений и вычислить выборочное значение статистики в, критерия.

7.Принять статистическое решение:

если

 

 

, , отклонить гипотезу

как не согла-

сующуюся с результатамив

наблюдений;

 

если,

 

 

 

принять гипотезу , т. е. считать, что

гипотеза

не

противоречит результатам наблюдений.

в

 

\

 

 

 

50