Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
27
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

142

 

 

 

Глава

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица

3.5.1

К р и т е р и и д л я

с р а в н е н и я

среднего

з н а ч е н и я

нового продукта

 

 

(или переменной)

с некоторым

стандартом

[8]

 

 

Стандартное

 

Используемый

критерий

 

 

Гипотеза

 

проверки 1) (гипотеза

Замечания

отклонение а

 

принимается,

если нера­

 

 

 

 

венство

удовлетворяется)

 

 

 

Неизвестно;

исполь ­

I Х

~ И 0 І >

h _ а / 2

Yn

Двусторонний

 

к р и т е р и й

t

И Ф Но

зуется s и з

выборки

 

 

 

 

 

 

 

 

 

 

\ x - ^ \ > u i

_ a l i

y l

Двусторонний

 

Известно

 

 

 

 

 

 

 

 

 

к р и т е р и й

U

 

Неизвестно;

исполь ­

 

 

 

 

 

 

Односторонний

 

 

 

 

 

 

 

к р и т е р и й

t

М > Но

зуется s из

выборки

 

 

ax

 

Односторонний

 

 

 

 

 

 

Известно

 

 

 

 

 

 

 

 

 

 

 

 

к р и т е р и й

U

 

 

 

 

 

 

SX

 

Односторонний

 

Неизвестно;

исполь­

^ - X > t t

_ a

y -

 

к р и т е р и й

t

 

зуется s из

выборки

 

 

 

ax

 

Односторонний

 

 

 

н

и

^

 

 

Известно

 

- х >

а у -

 

к р и т е р и й

U

 

 

 

 

 

 

 

 

1) В каждом случае находится значение t или U для выбранного уровня значимости а; число степеней свободы для t равно п 1. Предполагается, что генеральная сово­

купность имеет нормальное распределение.

Пример 3.5.1. Проверка гипотезы относительно среднего

Десять разных термометров сопротивления откалиброваны по стандартному, который показывал 1000 мВ . Ниже приведены показания этих термометров:

986

1002

1005

996

991

998

994

1002

983

983

Можно ли считать, что эти отклонения обусловлены нормаль­ ными вариациями случайной переменной — показаний в милли­ вольтах, или на их характеристики повлиял некоторый фактор (при транспортировке или изготовлении).

Статистический анализ и его применения 143

Решение

Испытаем гипотезу, состоящую в том, что среднее по ансамблю

показаний

десяти термометров

р. отлично от р 0 = 1000,

выбирая

в качестве

Н0 первую

гипотезу

из табл. 3.5.1, а именно

\і ф

ц 0 .

Так как дисперсия ах

неизвестна,

нужно

воспользоваться

кри­

терием

 

 

 

 

 

 

 

 

 

 

 

 

І ^ — Ы >

* 1 - « / 2 -^7=-

 

 

 

 

 

 

 

 

Y п

 

 

 

 

Выбирая а = 0,05, так что а/2 = 0,025, и

* i _ a /

2 = 2,26,

можно

подсчитать

 

 

 

 

 

 

 

 

 

 

 

 

Х = ^ — і - = 994,0,

 

 

 

 

 

 

sx

= Л

'

= 64,9,

 

 

 

 

 

 

ѵ = л — 1 = 9,

 

 

 

 

 

 

 

| Х - і х 0

1 =

6,0,

 

 

 

 

«1-./2 t p f - -

2,26

1 / 2 = 2,26-2,55 =

5,76.

 

 

Так как 6 >

5,76,

можно сделать вывод, что для

уровня

значимости

а =

0,05

(но не для а

= 0,01)

гипотезу Я 0

следует

принять.

 

 

 

 

 

 

 

 

 

В табл. 3.5.2 приведены критерии проверки гипотез относи­ тельно средних по ансамблю двух продуктов (или переменных), для каждого из которых получена оценка по выборке. В этом

случае

можно проверить:

 

 

 

 

1. Отличаются ли средние значения каждого из продуктов

(или переменных), не уточняя при этом, какое из них

больше.

2. Превосходит ли среднее значение продукта (или перемен­

ной) А

среднее

значение

продукта (или переменной)

В.

Снова можно

выделить

подклассы

критериев в

зависимости

от степени имеющейся информации

о величине

стандартного

отклонения измеряемой величины. Как и раньше, если вычислен­ ная разность оказывается больше правой части неравенства, то гипотеза принимается; в противном случае она отвергается.

Кривые оперативных характеристик и

таблицы,

позволяющие

определить объем выборки для каждого

критерия,

можно найти

в справочнике Национального бюро стандартов

[81.

Чтобы проиллюстрировать общую процедуру проведения про­ верки гипотез при сравнении двух средних, проследим в общих чертах, как используется первый из критериев табл. 3.5.2. Осталь­ ные критерии применяются аналогичным образом.

 

 

 

 

 

 

 

 

 

 

Таблица

3.5.2

 

К р и т е р и и

д л я с р а в н е н и я средних значений д в у х

продуктов

 

 

 

 

 

(или

переменных)

[8]

 

 

 

 

 

Стандарт­

Используемый критерий

 

 

 

 

Гипотеза

 

ные откло­

проверки 1) (гипотеза при­

Замечания

 

 

 

нения

нимается, если неравенство

 

 

 

для Л и В

удовлетворяется)

 

 

 

 

 

 

 

ОА « ОВ,

| A \ A - Z B | >

 

\(пл-1)*\

+

(пв-і)а*в- ] V . F

 

 

 

 

 

 

 

 

 

оба не­

 

 

 

 

 

 

 

 

 

 

известны >h-a/2sp\

П а П

в

)

V = «A + «в — 2

 

 

 

°А ф о\в

АВ\>

 

 

 

і' —значение

* ! _ а / 2 Д л я V

 

 

оба не­

> * ' ( А

+ *

) 1

 

степеней свободы,

 

f U Ф Ив

известны

Л

(«y*A+«y*j»)a

 

 

ПА

ПВ

 

 

 

 

 

 

 

 

 

 

 

 

 

-2

 

 

 

 

 

 

 

 

"A + l

 

«B +

l

 

 

аА

и о в

А-Хв\>

 

 

 

 

 

 

 

 

 

известны

 

 

 

 

 

 

 

 

О"А « о-в ,

 

х А

- х в

>

 

 

V -

r ( « A - l ) s A

+ ( « B - l ) s

B

l

оба не­

> ч -

« °

 

( П

 

 

 

)

 

l

A+

 

rej3_2

J

 

известны

Р

А

+ П

в

1 1

2

 

v = n A

+ n B 2

 

 

 

 

 

 

 

 

V

п А

п

в

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

°А

0"в,

 

ХА ХВ^>

 

 

г'

— значение

14

для

 

V

оба не­

 

 

 

 

 

 

 

 

 

 

степеней свободы,

 

 

 

Ѵл> Ив известны

>*'

( s

i

+

 

s %

 

 

Y'2

 

 

(*і/»А + «Улв)а

 

 

-2

 

 

 

 

 

 

 

 

 

 

 

 

 

(SA /"A)2

(4/лв)а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ѵ

 

 

 

 

 

 

 

 

 

 

п в

1

 

 

 

«А + 1

 

ПВ+1

 

 

 

 

 

 

Ѵ

ПА

 

 

 

 

 

 

 

 

 

 

аА

и о в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

известны

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ХА ХВ^>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ПА

 

 

ПВ

 

 

 

 

 

 

 

 

 

1) Для получения выборок А и В проводится тгд и пв

наблюдений;

t берется для

-j- rig — 2 степеней

свободы. s p и

другие

объединенные значения

s обсуждаются

в разделе 2.4.1. Предполагается, что генеральная совокупность имеет нормальное рас­ пределение.

Статистический

анализ и его

применения

145

Предположим, что имеются выборки случайных переменных А и В, распределенных по нормальному закону с указанными ниже средними значениями и дисперсиями:

 

 

 

А

 

в

Выборочные

значения

ХАі, ХА^,

ПА

^ в 4 . Хщ,

Х В г І £

Среднее по

ансамблю

 

ц А

 

в

Дисперсия по ансамблю

 

а А

 

o ß

Можно вычислить

следующие

выборочные статистики:

 

1

П Л

 

 

 

 

 

і=1

 

 

 

1

П *

 

 

 

 

 

і=1

 

 

 

 

 

 

ПА

 

& =

-Т7=тЪ

 

(ХА-ХА)\

 

 

пА-

 

і=1

 

 

 

 

 

 

^ =

- ^ - г ^ ( х в - х в г ,

 

 

п в -

 

 

 

 

 

 

 

і=1

 

 

 

VA =

пА

— 1,

 

 

ѵ Б

=

п в

— 1.

Выборочные средние

ХА

я X в

распределены

по нормальному

закону с параметрами

(и.Л , оА/пА)

 

и

(ц.в , о-Упв ) соответственно.

Разность двух средних D = ХА

— X в

также

распределена

по

нормальному закону относительно значения Ô =

и.А — ц,в

с дис­

персией

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ѵаг{£} =

- ^ - + - ^ - .

 

 

(3.5.1)

 

 

 

v

'

п А

'

n B

 

 

 

v

>

Если sA

значимо не

отличается

от s|,

проверяются

гипотезы

 

 

ц Л

= р в

и а\ та ав = оЛ

 

 

 

Если эти гипотезы справедливы, то разность

D = ХА

Хв

распределена

по нормальному

закону

относительно

Ô =

А

— u.B = 0

с

дисперсией

 

 

 

 

 

 

 

 

 

 

 

V a r { 0 H o " ( J L +

1 L . ) .

 

 

(3.5.2)

146

Глава 3

Используя выражение (2.4.12), можно вычислить следующую оценку для о2 :

 

Ѵ А«А + V B S В

 

 

 

 

 

 

4 = л, J . «

Д л я

ѵ = ѵ А + ѵ в = и А + п в —2.

 

Ѵ А + Ѵ В

 

 

 

 

 

Таким

образом, статистика

 

 

_

 

 

* = •

 

 

 

 

 

 

* B

і

/

1 4-

1

 

 

 

 

 

l"A

«В

имеет

^-распределение

с ѵ = геА

+

тгв

— 2 степенями свободы.

Если величина t значимо отлична от нуля, следует считать, что

И А Ф И В -

Пример 3.5.2. Сравнение двух средних

Два разных сорта бензина использовались для определения числа пройденных километров по шоссе на литр израсходованного бензина. Каждый сорт бензина (октановые числа 90 и 94) исполь­ зовался в пяти идентичных автопробегах по одному и тому же маршруту; были получены следующие результаты:

 

 

Октановые числа

 

 

94

90

Выборочное

среднее, км/ л

22,7

21,3

Выборочное

стандартное отклонение, км/ л 0,45

0,55

Различны ли

эти сорта при уровне

значимости а = 0,05?

Если это так, то является ли бензин с октановым числом 94 значимо лучшим по сравнению с бензином с октановым числом 90?

Решение

Прежде всего проверим гипотезу, что [ І 9 4 Ф ^ І 9 0 . Предположим,

что сг9 4 «

а 9 0 ; способ

проверки

этого предположения

будет изло­

жен

в разд.

3.6.

 

 

 

 

 

 

 

 

 

 

 

 

I Y

У | | (

 

о "94 + "90\

1 /

2

 

 

 

 

 

\X9i-Xç)0\>ti-a,2Sp[

 

П ы П з

о

 

)

,

 

 

 

 

 

( ^ 4 + n 9 0 S l / 2 ^ / 5 + 5_n/2 =

 

 

 

 

 

 

 

S p =

[

4.(0,45)11+4.(0,55).

= { ^ 2

)

m =

^

 

 

 

 

 

 

h-a/2

= 2,306,

 

 

 

 

 

 

 

 

 

 

v = 5 + 5 —2 = 8,

 

 

 

 

 

 

 

 

 

I X M

- X e o

I = 22,7-21,3 =

 

1,4,

 

 

 

 

 

 

2,306-0,50.0,632 = 0,73.

 

 

 

 

Так

как

1,4 >

0,73,

гипотеза

принимается

 

и

9 4 Ф

| І 9 О .

Статистический анализ и его применения 147

Затем проверим гипотезу, утверждающую, что

u^4

> Иэо,

по-прежнему предполагая, что а 9 4 «

од0.

 

 

 

( Л 9 4 — Ä 9 0 ) > t i - a S p \

9 4 9 0

) .

 

 

•Х94—Х90 = 1)4,

 

 

 

ti-aSp ( - Щ - ) 1 / 2 = 1,860-0,50.0,632 = 0,59.

 

 

Эта гипотеза тоже принимается.

 

 

 

 

Все рассмотренные до сих пор критерии

опирались

на

опре­

деленные предположения о характеристиках

исследуемых случай­

ных величин. Конечно, на практике некоторые или даже все эти предположения могут оказаться неверными. При этом для одних критериев отклонения могут быть более серьезными, чем для дру­

гих. Те критерии,

которые

относительно менее чувствительны

к отклонениям от

предполагаемых характеристик,

называются

устойчивыми. Так как в каждом критерии используется

несколько

предположений, устойчивость

критерия оценивается по раздель­

ному влиянию отклонений от нормального закона, независимости, равенства дисперсий и случайности.

Основополагающими предположениями для критерия t являют­ ся: 1) измеряемые случайные переменные распределены по нор­ мальному закону и 2) выборки являются случайными. Решение, принимаемое на основе критерия t (и других критериев), зависит, и иногда критически, от степени приближения эксперименталь­ ных условий к предполагаемым.

Влияние отклонения от нормального закона на критерий t Стыодента изучалось и иллюстрировалось многими исследовате­ лями. Согласно грубому эмпирическому правилу, критерий t, используемый при сравнении средних, относительно нечув­ ствителен к отклонениям исследуемой случайной переменной от нормального закона распределения.

Уолш [9] исследовал влияние отклонений от случайности выборки на критерий t Стыодента при большом числе наблюде­ ний. Было найдено, что даже небольшое отклонение от предпола­ гаемой случайности приводит к существенным изменениям уровня значимости и доверительной вероятности. В этой работе описаны модифицированные критерии, нечувствительные к условию слу­ чайности выборки. В разд. 3.7 обсуждаются критерии, которые можно использовать вместо критерия Ï.

3.6. П Р О В Е Р К А Г И П О Т Е З Д Л Я Д И С П Е Р С И Й

Цель этого раздела состоит в том, чтобы описать некоторые критерии, позволяющие принять определенное решение относи­ тельно дисперсии некоторого продукта (или переменной). В соот-

Таблица 3.6.1

Сравнение д в у х продуктов (или переменных) по и х дисперсиям [8]

Гипотеза

0-2 = 0g

О 2 > 0 §

0 - 2 < 0 §

а 2 - о 2 M

Используемый критерий

 

Число степеней

 

свободы

 

 

 

 

 

* а - 2 ^

 

 

2о<*2-^—

 

V = n— 1

Xl -

œ/2

 

X œ /2

 

 

 

 

 

 

 

 

Ѵ =

и — 1

 

 

 

Х а

 

 

 

s 2

2

V

> oj

 

V = w — 1

 

Xl

-

ce

 

 

 

 

î

 

 

4

ѴІ =

Л А — 1

 

 

 

<

<

 

 

 

v 2 =

n B — 1

^ і - а / г ^ В - 1 ' "A - l )

4

 

 

< F i - a / 2 ( " A - l . ^ - 1 )

 

 

 

0 2 > а 2 2 )

- ^ - > ^ ! _ a (Vi,V2 )

V l = n A — 1

 

S B

 

V 2 = W B 1

1) Альтернативная гипотеза

Ф а'

 

 

2

'

 

2) Альтернативная гипотеза

= о"

 

 

Решение

 

 

 

Замечания

 

Е с л и

неравенства с п р а ­

Двусторонний

 

крите­

ведливы,

 

гипотеза

рий

X2

 

 

 

п р и н и м а е т с я

 

 

 

 

 

 

 

Если

проверяемое

не­

Односторонний

 

крите ­

равенство

справедли ­

рий

X2

 

 

 

во,

гипотеза

прини ­

 

 

 

 

 

мается

 

 

 

 

 

 

 

 

Е с л и

проверяемое

не­

Односторонний

 

крите ­

равенство

справедли ­

рий

X2

 

 

 

во,

гипотеза

п р и н и ­

 

 

 

 

 

мается

 

 

 

 

 

 

 

 

Е с л и

неравенства

спра ­

Двусторонний

критерий

ведливы,

 

гипотеза

F.

Заметим,

что

принимается

 

 

ше

_ а /

всегда мень­

 

 

 

 

 

единицы,

следова­

 

 

 

 

 

тельно,

н у ж н о

прове­

 

 

 

 

 

рить только

ограниче­

 

 

 

 

 

ние

сверху

 

 

Е с л и

неравенство

спра ­

Односторонний

 

крите ­

ведливо,

 

гипотеза

рий

F

 

 

 

п р и н и м а е т с я

 

 

 

 

 

 

 

Статистический анализ

и его применения

149

ветствии с предыдущим разделом,

используя %2 -распределение,

уже описанное в разд. 2.3.2, можно проверить, отличается ли дисперсия по ансамблю нового продукта (или переменной) от стандартной дисперсии по ансамблю случайной переменной и какая из них больше. Для двух продуктов (или переменных) А и

В с

помощью .F-распределения отношения

дисперсий,

рассмот­

ренного в разд. 2.4.3,

можно проверить,

отличается

ли

диспер­

сия

по ансамблю А

от дисперсии В

и

превышает

ли ее.

В табл. 3.6.1 нулевым индексом обозначена стандартная

дисперсия,

тогда как у дисперсии, подлежащей проверке, индекс

отсутствует.

Эти критерии основаны на предположении, что наблюдения случай­ ны и распределены по нормальному закону. Решение принимается на основе критерия, приведенного во втором столбце табл. 3.6.1. Кривые оперативных характеристик и таблицы для определения объема выборки приведены в [8].

Для иллюстрации того, как формулируются критерии, рас­ смотрим критерий F из четвертой строки табл. 3.6.1. Выдвинем гипотезу, что а\ = а\, т. е. о\Іа\ = 1, и используем отношение выборочных дисперсий, чтобы проверить, является ли величина C T J / O J большей или меньшей единицы. Если гипотеза верна, то область принятия гипотезы для симметричного случая определяет­ ся вероятностным соотношением

Р {/"а/2 ( Ѵ І , Ѵ 2 ) < | - < Л - а 7 2 К

Ѵ

8 ) } = 1 — а .

 

Так как Fa/2 (vt , v2 ) = ilFi-a/z (v2 , vt ) <

1, левая часть

нера­

венства в аргументе всегда удовлетворяется,

и необходимо

только

проверить, действительно ли s\ls^ ^ -Fi-«/2-

Пример 3.6.1. Проверка гипотезы для дисперсии

Спроектированы и введены в действие две одинаковые опытные установки для данного процесса. Ниже приведены первые десять партий полученного продукта на каждой из установок

 

Установка А (кг)

Установка В (кг)

 

97,8

97,2

 

98,9

100,5

 

101,2

98,2

 

98,8

98,3

 

102,0

97,5

 

99,0

99,9

 

99,1

97,9

 

100,8

96,8

 

100,9

97,4

 

100,5

97,2

X

99,9

98,1

s\

1,69

1,44

150 Глава 3

Являются ли дисперсии продуктов, полученных на двух установ­ ках, значимо отличными друг от друга?

Решение

 

 

 

 

Гипотеза Н0 состоит в том, что аА

= ав.

Дл я каждой

установ­

ки число степеней свободы равно 9. Дл я проверки

гипотезы,

указанной в четвертой

строке табл. 3.6.1, составим отношение

дисперсий

 

 

 

 

Из табл. В.4 приложения

В для а =

0,05

находим FQ,g.^ (9, 9) =

= 4,03; следовательно, гипотеза принимается и разница диспер­ сий для двух установок незначима.

Пример 3.6.2. Комбинированные критерии для дисперсии и сред­ него

В каталитическом реакторе распределение выходов продукта при использовании катализаторов А и В характеризуется сле­ дующими данными:

Катализатор А

Катализатор В

Х А = 1 , 2 1 9

Z B

= 1,179

4 = 0 , 2 0 8

s |

=0,19 3

s A

= 0 , 4 5 6

sB

=0,43 9

n A

= 1 6

п в

= 1 5

В качестве первой гипотезы примем, что cri = (Ув- Чтобы при­ менить критерий из четвертой строки табл. 3.6.1, вычислим отно­ шение дисперсий

 

 

 

SA

0,2080 •=1,08.

 

 

 

 

 

 

 

0,1930

 

 

 

 

 

 

Из табл. В.4 приложения В для а

=

0,05, ѵ А

= пА — 1 =

15

и

ѵ в = пв

— 1 =

14 находим значение Fi-a/2

(15, 14) =

2,95.

Таким образом, гипотеза принимается и можно

считать,

что

аА

 

отличается значимо от

ов.

 

 

 

 

 

 

Теперь

можно

объединить выборочные дисперсии:

 

 

 

Sriр ~

(nA—l)sA+(nB~i)s%

15.0,208+14-0,193

0,201,

 

 

n A - l

+ n B - l

~~

1 5 + 1 4

 

 

Разность между выборочными средними

 

 

 

 

 

 

D = 1,219

— 1,179

=

0,040,

 

 

 

а

из соотношения

(3.5.2)

 

 

 

 

 

 

 

Ѵ аг{2>>*4

(ігГ+^г) =0,201

+

=0,026.

 

 

Статистический анализ и его применения 151

Так

как о\

«

С У ^ ,

М О Ж Н О

использовать

критерий,

указанный

в табл.

3.5.2,

для

проверки гипотезы^,р,Л ^=^р,в .

 

 

 

ХА XB\>ti-aßSP

(

"i^nT

) 1 / 2 '

Ѵ = И А Ч - Л В

—2,

 

0,040> 2,045-0,201 ( - ^ ) 1 7 2 ,

ѵ = 29,

 

 

 

0,040 >

0,145.

 

 

 

 

 

Так как 0,040 <

0,145, гипотеза цА

Ф ц в

отвергается

и можно

заключить, что

А

=

ц в .

 

 

 

 

 

Критерий

F

применяется

при

сравнении^двух

дисперсий.

Для обнаружения разницы двух и большего числа дисперсий широко используется критерий Бартлетта. Бартлетт предложил критерий проверки однородности (гомогенности) двух и большего числа дисперсий, заключающийся в сравнении логарифма средней дисперсии с суммой логарифмов отдельных дисперсий. Формулы, необходимые для применения этого критерия, основаны на гипо­

тезе

Н0\

о\

= а\

= . . . = On =

о 2

и предположении, что изме­

ряемые переменные распределены по нормальному закону.

Кри­

тические пределы такие же, что и для критерия F, за тем исключе­

нием, что здесь используется п выборок. Если проверяемая

гипо­

теза

правильна,

то объединенная

оценка

 

 

 

 

 

 

 

 

2 M

 

 

 

2 ( p i - l ) s î

(3.6.1)

 

 

 

 

і =n

 

n

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=i

 

t=i

 

 

 

 

 

 

(где

pi—число

повторений

в

выборке)

распределена

как s2

со

средним

значением

о 2

и

ѵ степенями

свободы,

где

ѵ =

 

71

 

 

 

 

 

 

 

 

 

 

 

 

= S ѵі-

Бартлетт показал,

что

величина

 

 

 

 

і=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А = - 4 - J

 

V, In 4 -

 

 

(3-6-2)

где

 

 

 

 

 

 

і=1

 

 

 

 

 

 

 

 

 

 

 

(2 ѴІ

 

 

 

 

 

 

 

І с

4 +

3 ( п —1)

п

) '

 

 

 

 

 

 

 

 

 

 

і = 1

 

i2=l

ѵ'

 

 

Соседние файлы в папке книги из ГПНТБ