Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
27
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

132

Глава

3

выситвыбранную

величину Q\-a/2

или окажется меньше, чем Ѳ а / 2 .

Например, а может иметь значение 0,05 или 0,01. Затем берется

выборка и вычисляется Ѳ. Если Ѳ больше, чем Ѳі_а /2> или меньше,

чем Ѳа / 2> гипотеза отвергается. В

противном случае она прини­

мается. Интервал значений Ѳ, при

которых гипотеза

отвергается,

называется областью непринятия гипотезы; интервал

значений Ѳ,

при

которых гипотеза принимается, называется областью

приня­

тия

гипотезы.

 

Описанный выше критерий является двусторонним. Односто­ ронний критерий основывается либо на том, что Ѳ больше, чем некоторое значение Ѳ^а, и гипотеза Ѳ = Ѳ0 отвергается, если действительно Ѳ > Ѳ ^ , либо на том, что Ѳ меньше, чем Ѳ а . Непринятие гипотезы не предполагает ее безоговорочное отбрасы­ вание, а требует внимательного изучения экспериментальной процедуры и полученных данных, чтобы убедиться, нет ли какихлибо ошибок в эксперименте. Выяснение причин ошибок в методе исследования имеет большое значение.

Метод проверки гипотез имеет простейшую структуру в случае,

когда

существует

дихотомия состояний случайной величины:

1.

Н0: x —- истинное значение случайной

величины (нулевая

гипотеза).

 

 

2.

НІ'. x ne является истинным значением случайной величины

(альтернативная

гипотеза).

 

Например, два

значения параметра могут

представлять неко­

торую плотность распределения вероятности. В качестве гипотезы

Н0

принимается,

что эта плотность распределения

вероятности

равна р (х;

Ѳ0 ),

а альтернативная гипотеза состоит в том,

что

она

равна

p (x;

QT). Другой пример: гипотеза Н0

означает,

что

среднее по ансамблю значение переменной процесса не изменилось после модификации процесса, а гипотеза НХ означает, что это среднее изменилось. Применяются также критерии проверки, учитывающие одновременно несколько альтернативных гипотез, но их описание выходит за рамки данной книги.

При проверке гипотез решение принимается следующим обра­ зом. Основываясь на предположении, что нулевая гипотеза верна, вычисляют статистику по случайной экспериментальной выборке и проверяют, попадает ли вычисленное значение в область приня­

тия гипотезы; если оно не попадает в эту область, нулевая

гипотеза

отвергается, a

Н^ принимается. В противном случае Н0

прини­

мается,

a НІ

отвергается.

 

 

 

При проверке гипотез можно различить ошибки двух

типов.

О ш и б к а

п е р в о г о

р о д а . Эта ошибка возникает,

когда

гипотеза

верна, но

отвергается.

 

 

О ш и б к а

в т о р о г о

р о д а . Эта ошибка возникает,

когда

гипотеза

не верна,

но принимается.

 

 

 

Статистический

анализ

и его

применения

133

Ясно,

что появление ошибки

первого

рода связано

с тем, что

значение

а выбрано отличным

от

нуля. Если гипотеза верна

и, например, а = 0,05, то эта гипотеза будет отвергнута в 5% испытаний.

Фиг. 3.4.2 иллюстрирует ошибку второго рода применительно к среднему по ансамблю. В данном случае выдвигается гипотеза,

что р. =

\ І А .

Но для того,

чтобы продемонстрировать ошибку

второго

рода, предполагается,

что истинное значение

р, в действи­

тельности равно

А + о, как показано на фиг. 3.4.2.

Выбирается

 

 

 

р(£)

Рассеяние

X относительно

*

предполаваелюго

сред-

\

/

него по ансамблю

А

\

/

Область

принятия

 

 

гипотезы

 

 

 

Рассеяние X относительно истинного среднего по ансамблю /гА * s

Лис

2

 

 

MA

 

 

Ф и г .

3.4.2. Ошибка

второго рода.

а — вероятность отвергнуть

гипотезу

и = иА,

когда она верна; ß — вероятность

не отвергнуть гипотезу р. =

цА, когда

она неверна; (1 — ß) — вероятность отвергнуть

гипотезу

р. = &А,

когда она неверна.

некоторое значение а, которое фиксирует область непринятия (пунктирная штриховка). В этом случае гипотеза и- = р.А является ложной, однако имеется некоторая вероятность ß, что выборочное

среднее

попадет

в область принятия

гипотезы.

Если

гипотеза

р, == f i A

верна,

как

предполагалось,

двусторонний

критерий

(фиг. 3.4.2) приведет к правильному

решению в

100(1 — а ) %

испытаний и к ложному

решению (отклонению гипотезы) в 100а %

испытаний, что объяснялось выше. Однако если гипотеза

действи­

тельно

ложная, то

можно рассчитать

вероятность попадания

X в область непринятия, если значение

ô известно или

принято

равным

известному

числу.

 

 

1.0

Ф и г .

3.4.3а.

Оперативные характеристики

д л я двустороннего к р и т е р и я

 

 

 

 

 

t

=

0,05)

[5].

 

б =

I ц. — ц 0 I или

б* = I р,д — Ив ]

при объеме выборки п ; а — стандартное отклоне­

ние

по

ансамблю,

которое

должно оцениваться,

если неизвестно; ц 0 — известное сред­

нее по ансамблю;

А и и в

— средние по ансамблю соответственно для выборок А и В;

 

 

 

 

ß — вероятность

не заметить

различие.

 

 

1,00

 

 

 

 

 

Ф и г . 3.4.36. Оперативные характеристики д л я одностороннего к р и т е р и я t (а = 0,05) [6] .

Обозначения те же, что на фиг. 3.4.3а.

 

Статистический

анализ

и его применения

135

Вероятность ß представляет собой вероятность не обнаружить

разницу,

когда

она существует.

На фиг. 3.4.3 представлены

типичные

кривые

зависимости ß от разности d для выборок раз­

личных объемов; эти кривые называются оперативными

характе­

ристиками.

Вероятность 1 — ß называется мощностью

критерия

и определяет вероятность принятия правильного решения, когда в действительности гипотеза является ложной. С увеличением ô величина 1 — ß возрастает, a ß уменьшается.

Из этого описания двух типов ошибок следует, что попытка уменьшить ошибку одного типа ведет к увеличению ошибки друго­ го типа. Единственный способ уменьшить одновременно ошибки обоих типов состоит в увеличении объема выборки, что на прак­ тике может оказаться слишком сложным. Возможно, что ошибки одного типа могут иметь менее серьезные последствия, чем ошибки другого типа, и в этом случае можно найти некоторое приемлемое решение относительно выбора величины а и необходимого числа наблюдений. Опытный исследователь, чтобы сделать экономичный выбор величин а и ß, принимает во внимание оборудование, харак­ тер процесса и стоимость эксперимента.

Понятия оперативной характеристики и мощности критерия в равной степени применимы к проверке гипотез как для диспер­ сий (разд. 3.6), так и для других характеристик ансамбля, в частно­

сти

среднего значения.

 

Пример 3.4.1. Проверка гипотезы относительно среднего

Предположим, что некоторая

случайная переменная процес­

са X имеет среднее значение х

6,80. Взята выборка для этой

переменной и

для выборки объема п = 9 получено X = 6,50

ж sx

= 0,25 (sx

= 0,50). Проверим гипотезу Н0, состоящую в том,

что

случайная

переменная имеет прежнее среднее по ансамблю,

а именно х =

6,80. Альтернативная гипотеза Hi состоит в том,

что ц,х Ф 6,80. Если уровень значимости а выбран равным 0,05,

то для симметричного двустороннего критерия t гипотеза

Н0

принимается, если

| X — \іх | << ti^a/2SX.

В противном случае

Н0 отвергается

и

принимается

Hi.

 

 

Здесь

 

 

 

 

 

 

 

s- = - ^ - = - ^ - = 0 167

 

 

а величина ti-a/z

 

для п — 1 = 8

степеней

свободы и а =

0,05

равна 2,306.

 

 

 

 

 

0,30 =

I 6,50 - 6,80 I <

2,306 -0,167 = 0,39.

 

136

Глава 3

Следовательно, гипотеза Н0

принимается. Области принятия

инепринятия гипотезы показаны на фиг. П.3.4.1.

Область р(х)

принятия

гипотезы

Область

 

)

Область

непри нятия

I

гипотезы

1

/непринятии

 

 

 

гипотезы

jxx=6,80 "•Х = 6,50

Ф и г . П . 3 . 4 . 1 .

Пример 3.4.2. Мощность критерия для среднего

В

этом примере

предполагается, что гипотеза Н0

(и. = ц0 =

= 6,80 из примера

3.4.1) верна. Тогда,

если в действительности

Ц >

М-о ( д л я одностороннего критерия)

или и. ф и.0

(для двусто­

роннего критерия), можно рассчитать мощность критерия t, использованного в примере 3.4.1 для различения гипотез.

Мощность этого критерия равна

(двусторонний симметричный критерий),

(односторонний критерий).

Записав

 

s x i y n

sxIVn

s*

где X =

[i! — (AO/(O"JC/V n),

находим, что мощность критерия зави­

сит от

некоторой

комбинации ^-распределения относительно р,4 ,

^-распределения, расстояния между средними и ѵ. Приближен­

ные соотношения [7] для мощности

критерия, выраженной через

нормированную случайную

величину с нормальным распределе­

нием, имеют вид

 

 

 

1 — ß » Р {Ui ^ щ) +

Р {Uz^,

и2} (двусторонний критерий),

1 — ß а; Р {U ^

и}

(односторонний критерий),

Статистический

анализ и его

применения

137

где

 

 

 

 

 

 

2

і Л +

(*»/ 2 /2ѵ)

'

 

 

 

 

 

 

 

 

ц

 

 

*<х +

^

 

 

 

 

 

 

 

 

 

 

 

і Л + ( * и « / 2 ѵ ) '

 

 

a

С/ или Ui — аппроксимированная

нормированная

величина,

распределенная

по

нормальному

закону.

ох 0,40,

 

 

Если

р,х =

6,80

и

 

по

предположению

а = 0,05

и ѵ = ?г — 1 = 8 , мощность

двустороннего

критерия

по отноше­

нию к среднему значению [it =

7,10

вычисляется

следующим

образом:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

. _

7,10—6,80

_

0,30

_

9

9 _ .

 

 

 

 

 

 

 

0,40/Ѵэ - о д з Г - ^ '

 

/2 = —2,306 из табл. В.З

приложения

В .

 

 

 

У і

+ (^/2/2ѵ) = /

і

+

 

Ь

|

в

=1,15,

 

 

 

 

 

 

 

— 2.306 — 2,25

 

 

о

n ß

 

 

 

 

W l =

 

T Ï 5

 

=

—3,96,

 

 

 

 

и* =

~ 2

' 3

f + 2 ' 2

5

=

- 0,0488,

 

 

 

 

 

 

 

 

1,0

 

 

 

 

 

 

 

 

 

1 — ß «

0 +

(1,000 -

 

0,519)

= 0,481,

 

 

 

 

 

 

 

 

ß

«

0,519.

 

 

 

 

 

Такое

же значение

оперативной

характеристики

критерия

ß

(для п = 9)

можно

получить

с

помощью фиг. 3.4.3а для

 

 

 

 

л

 

І^о—Hill

 

° ' 3 0

_ п 7г.

 

но с меньшей точностью. Если

величина стх неизвестна, а оцени­

вается по sx,

то слишком большое значение

ах

может привести

к недооценке

| р,0 \Хі \/ох

и

к переоценке

ß;

ситуация будет

обратной, если величина ох

 

занижена.

 

 

Пример 3.4.3. Определение

объема выборки

 

 

Предположим, что экспериментатор хочет определить, сколь большую выборку нужно взять для того, чтобы увеличить мощ­ ность критерия в примере 3.4.1 с величины 0,481, скажем, до 1 — ß = 0,80. Значения 1 — ß можно вычислить для нескольких объемов выборки п и для данных значений ах и а и выбрать такое п, которое дает величину 1 — ß, наиболее близкую к 0,80.

138

Глава

3

Д л я

вычисления ß можно также

использовать и кривые на

фиг. 3.4.3, по которым можно найти величину п непосредственно

для вычисленного значения d. Согласно данным из примера

3.4.2,

 

 

d = - 2 g - = 0,75, а = 0,05

 

 

и для

1 — ß =

0,80,

ß = 0,20 по фиг. 3.4.3а находим

п «

16.

 

 

3.4.1.

Последовательная

проверка

 

 

Н а

практике

оказывается возможным

еще задолго

до

полу­

чения тг-го наблюдения (где п вычисляется как в примере 3.4.3) удостовериться, следует ли принять или отвергнуть гипотезу Н0,

воспользовавшись планом

(процедурой) последовательной

провер­

ки. Согласно этому плану,

проверка производится после

каждого

200

 

 

150

ДА?

100

60

о

О

1

2

 

З

А

 

 

 

Число наблюдений

п

 

 

 

 

Ф и г. 3.4.4. К а р т а последовательной

проверки

дл я

о б н а р у ж е н и я различия

•средних по ансамблю октановых чисел

бензина, a =

ß = 0 , 0 5 ,

ц.і==55, u-2 =

65

 

и ах « 9,5.

 

 

 

 

 

наблюдения, начиная

с первого

и до тех пор, пока

гипотеза

не

будет принята или отвергнута. После каждой проверки прини­

мается

одно из следующих решений:

1)

принять гипотезу Н0;

2)

отвергнуть гипотезу

Н0\

3)

провести еще одно

наблюдение.

Статистический анализ и его применения 139

Таким образом, вместо того, чтобы рассматривать только две области — принятия и непринятия гипотезы,— учитывается и третья область, которой соответствует решение продолжать

экспериментирование (фиг. 3.4.4). Верхняя

и нижняя

границы

этой области определяются лежащей в основе критерия

проверки

статистикой, природа которой зависит от

проверки,

которую

необходимо провести. Как только значение этой статистики попа­

дает в область ниже нижней границы, гипотеза Н0

принимается;

когда она превышает верхнюю границу, гипотеза Н0

отвергается.

После того как произошло одно из этих событий, испытания и про­ верка заканчиваются. В противном случае проводится дополни­ тельное наблюдение.

В качестве иллюстрации одного из возможных типов проверки опишем критерий отношения вероятностей, предложенный Вальдом. Этот критерий предполагает наличие последовательности независимых наблюдений случайной величины X из некоторой совокупности, имеющей нормальное распределение с известной дисперсией, но неизвестным средним значением. Нулевая гипотеза состоит в том, что Цх = а альтернативная гипотеза утверждает, что х = 2. При этих предположениях функция правдоподобия наблюдений, определяемая равенством (3.2.1), равна одному из следующих выражений:

1^(У2аохГпех1?[—25г2

Х

ИЛИ

L 2 = (V2i;вх)-пехр[—~%

Х

n

№ - ц 0 2 ]

і=1

n

№ - N ) 2 ] .

i=l

Данный критерий требует вычисления отношения

L2/Li

после

каждого наблюдения Xt,

. . .,

Хп.

Если

это отношение

превы­

шает верхнюю границу Іа,

принимается

гипотеза Цх

= ц 2 . Если

отношение оказывается меньше нижней границы h,

принимается

гипотеза х

= И-і- В т о м случае,

когда это отношение

заключено

в пределах

 

 

 

 

 

 

 

 

 

 

 

h < ^ - < l u ,

 

 

(3.4.3)

производится еще одно наблюдение. Верхняя и нижняя

границы

выбираются так, чтобы мощность критерия

равнялась а, когда

Их = Иі> и

1 — ß' когда

цх

=

ц.2.

Вальд

показал,

что

 

 

 

I

~

: i z

±

 

 

 

 

 

 

 

"

а

'

 

 

 

 

ß

140

 

 

 

Глава 3

 

и

что

вероятность

того, что последовательная проверка закон­

чится

выбором одной из гипотез, равна 1.

 

Подставив L u

L 2

и приближенные

значения для верхней

и

нижней границ

в

(3.4.3), получим

неравенство

т ^ г <

[ - 4 ç s

 

- ^ - № -

 

J <

 

^

 

ИЛИ

 

 

i=l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l n ( т М

< ~ 4 ç ï I № - ü . ) ' - № - f X i ) 4 < l n ( - ^ ) ,

 

 

 

 

i=i

 

 

 

 

 

 

 

 

 

которое можно привести к виду

 

 

 

 

 

 

 

 

Иг — Ш ,

 

\ 1 — а / 1 r

i=l

 

— И-1

V

а

/

 

r

 

 

 

 

 

 

 

 

 

 

 

(3.4.4)

 

 

 

 

 

 

 

 

 

 

 

где p. = V 2 (Ці +

JLI2) - Таким

образом,

в критерии

для

одного

из

двух средних

по

ансамблю

сумма измеренных

величин

вплоть

до п-то наблюдения может быть заключена в определенные

грани­

цы, если

известна

дисперсия

а х

и выбраны некоторые

значения

2 и fXj, а

и ß. На фиг. 3.4.4 показано,

как растут с увеличением п

 

 

 

 

п

в

 

 

 

 

 

 

п\і

ограничивающие пределы для

2

соответствии

с

членом

і=1

внеравенстве (3.4.4). Данные на этом графике представляют собой показания измерителя детонации бензина для двух различных

октановых чисел с = 55 и 2 = 65; а = ß = 0,05, а дисперсия ох была оценена из предыдущих испытаний по величине Sx = 9 , 5 с 20 степенями свободы. В этом случае неравенство (3.4.4) при­ нимает приблизительно следующий вид:

71

60« — 2,80 < S Х , < 6 0 / г + 2,80.

я=1

Если среднее по ансамблю цх известно и последовательной проверке подвергаются две альтернативные гипотезы о стандарт­ ных отклонениях

Я 4 :

ах

=

ffj,

H г'

=

о"2.

то функции правдоподобия можно образовать, как и раньше, полагая jui = u.2 = х и заменяя стандартные отклонения соот-

Статистический анализ и его применения 141

ветственно на Оі и ст2. Неравенство, аналогичное (3.4.4), имеет вид

2 1 n ( - J _ \ + l n . f |

»

.<

І^У^ з.<2(хІ _и )

/ 1 _ В \

i=i

 

0-2

 

Если величина р.^ неизвестна, следует принять

 

S г-^)2^ s г-х)2

 

і=1

і=і

 

и заменить и на п — 1 в верхнем и нижнем ограничивающих пре­ делах неравенства (3.4.5).

Можно провести и многие другие последовательные проверки,

которые описаны в литературе,

приведенной в конце этой главы.

3.5. П Р О В Е Р К А Г И П О Т Е З

О Т Н О С И Т Е Л Ь Н О С Р Е Д Н И Х

В табл. 3.5.1 собраны некоторые критерии, которые позво­ ляют сравнить среднее по ансамблю некоторого нового продукта (или некоторой переменной) со средним по ансамблю стандартного продукта (или переменной). При этом оказывается возможным определить: 1) отличаются ли эти величины и 2) превышает ли одна величина другую. В выбранных гипотезах стандартное среднее по ансамблю р,0 предполагается известным из прошлого опыта или других источников. (В последующих таблицах нулевым индексом будет обозначаться стандартное среднее, а отсутствие нулевого индекса будет означать среднее, подлежащее проверке.) После каждой проверки (третий столбец табл. 3.5.1) можно при­

нять

одно

из следующих решений:

1.

Если

неравенство оказывается справедливым, т. е. если

вычисленная разность превышает правую часть неравенства,

гипотеза

принимается.

 

 

 

2. Если

неравенство

оказывается

нарушенным,

т. е. если

вычисленная разность не

превышает

правую часть

неравенства,

то гипотеза

отвергается,

и маловероятно, что она верна.

В справочнике Национального бюро стандартов [8] приведены детальные карты, упрощающие вычисление оперативных харак­ теристик каждого критерия, и даны таблицы, позволяющие уста­ новить объем выборки, необходимый для обнаружения разности с помощью каждого из критериев.

Правила принятия решения, приведенные в табл. 3.5.1, ниже иллюстрируются примерами.

Соседние файлы в папке книги из ГПНТБ