Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
27
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

240

Глава

4

 

 

 

4.3. О Ц Е Н И В А Н И Е П Р И П О С Т О Я Н Н О Й Д И С П Е Р С И И

 

 

О Ш И Б О К

 

 

 

Эмпирическую модель, коэффициенты которой будут в даль­

нейшем оцениваться,

запишем в виде

 

 

 

a не как

Л = ßo +

ßi

(x - x ) ,

 

(4.3.1)

Л = ß;

+

ß t x ,

 

(4.3.2)

 

 

поскольку, во-первых, оценки b0

и

ôt

параметров ß 0

и ßi

можно

получить, не решая

совместные

системы связанных

уравнений,

что приходится делать в случае,

если

линейная модель записана

в форме (4.3.2), и, во-вторых, оценки ß 0

и ß 4 статистически

незави­

симы, что несправедливо для оценок ß'0 и ß t . Модели с несколькими независимыми переменными в форме (4.3.1) дают лучше обуслов­ ленные матрицы (гл. 5). Итак, ищутся несмещенные оценки пара­

метров

ß 0 и

ßt,

обладающие

наименьшей дисперсией.

Предпола­

гается,

что

ay. = const.

 

 

4.3.1. Оценки,

получаемые

по методу наименьших

квадратов

Метод наименьших квадратов Лежандра состоит в том, чтобы минимизировать сумму квадратов отклонений по оси у на фиг. 4.2.2. В развитие этого метода Гаусс и Лаплас предложили минимизи­ ровать сумму квадратов взвешенных отклонений (рассматривается в разд. 4.4). Здесь будет минимизироваться величина

Ф = 2 <УІ-І\І)*РІ=

S Pi [Yi-fo-Mxt-x)]a,

(4.3.3)

i=l

 

i=l

 

где pi — число

повторных

измерений зависимой

переменной при

данном значении xt. Д л я этого необходимо приравнять нулю част­ ные производные от ф по ß 0 и ß i . (Нетрудно показать, рассматри­ вая вторые производные, что это приводит именно к минимуму ф,

а не к

максимуму.)

 

 

 

 

п

 

 

дф

 

д{^Рі

[ѴІ-%-МХІ-Щ

 

_

і

 

 

 

 

 

n

 

 

 

= - 2 У l ^ i - ß o - ß i ( * * - * ) ] = 0 ,

 

 

 

 

І=І

(4.3.4)

дф

_

i = i

_

 

ößi -

 

oßi

_

 

 

 

 

n

 

= - 2 2 Pi [Yt - ßo - ßi (xt - x)} (xt — x) = 0.

Линейные

модели с

одной

переменной

241

Приводя подобные члены, получим нормальные

уравнения,

в ко­

торых параметры модели ß 0 и ßj заменены их

оценками:

 

п

 

п

п

 

 

 

^іРіУі

= Ь0 ^ І Р І +

ЬІ 2

Pi(xi-x),

 

(4.3.5а)

і—і

 

і=1

i=l

 

 

 

n

 

n

 

n

 

 

2 PiYi(xi — x) = b0

2 Pi (ХІ—Х)^ЬІ

2 РІ(ХІ-Х)2.

(4.3.56)

i=l

i=l

 

i= l

 

 

Заметим, что

 

n

 

 

 

 

 

 

 

 

 

 

 

2Pi {xi—

x) =

0.

 

 

i=l

Следовательно, как отмечалось выше, уравнение (4.3.5а) можно разрешить относительно Ь 0 отдельно от уравнения (4.3.56), которое также просто разрешается относительно bt:

п

 

 

 

 

2 Р?І

 

 

 

 

 

 

ß 0 ^ f c 0 =

i 4

= У ,

 

 

(4.3.6)

 

 

 

 

і=1

 

 

 

 

 

 

 

 

TI

 

 

 

 

 

 

 

 

2 Рі^ г (^г —

х)

 

 

 

 

 

^ = ^ = 2=1

— .

 

(4.3.7)

 

4.3.2. Максимально

2

ж)2

 

оценки

 

 

правдоподобные

 

Точно

такие

же

оценки параметров ß 0

и ß t

можно

получить

 

 

 

 

і=1

 

 

 

 

методом максимального правдоподобия, если к четырем первым

предположениям разд. 4.2 добавить пятое

предположение.

Построим функцию

правдоподобия, рассмотренную в разд. 3.2.1,

основываясь на

плотности распределения

вероятности

 

Р(у\х;

ß0 , ßi, ° f r f ) = y ^

 

е х р [ — Щ Г ^ І — л О ' / ц ] .

£(ßo, ßi, ° y j y ,

ж) =

L =

 

 

 

 

 

 

 

- П ^ Г « Ч . [ - 4 : ( ^ - І О ' Р . ] .

( « . в )

г =і

x i

1

242

Глава 4

В выражении (4.3.8) переменными являются параметры, а значе­ ния Y я X заданы. Тогда

In

 

 

 

 

 

 

71

 

 

 

 

 

 

 

 

(iП=lР*)

 

 

L=

— n l n l / 2 i t — у In o2y. + i - I n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

S w { ^ - I ß o + ß i

to-*)]}2

 

 

 

 

 

 

 

2 = 1

2oV

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

Д л я

получения'максимально

правдоподобных"! оценок

потребуем

чтобы

д In L

_ tffln

L

d l n L

,

 

 

 

 

 

 

<?ßo

~ "

*ßi

~

<?(°"2v.) -

'

 

 

 

 

 

 

 

 

г

 

 

что дает три уравнения

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

S . { ^ ' - I ß o

+

 

M * i - £ ) ] } p i = 0 ,

(4.3.9а)

 

 

і = і

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

S

{ У і - № о +

^ і ( ^ - я ) ] } р і ( « і - * ) = 0,

(4.3.96)

 

j=i

 

 

 

 

 

 

 

 

 

S

p j { F , - [ p o +

& i ( « J - i ) l } ' - n â î r = 0 ,

(4.3.9B)

 

i = i

 

 

 

 

 

 

 

 

из которых первые два совпадают соответственно с уравнениями

(4.3.5а) и (4.3.56) и приводят к выражениям

(4.3.6) и (4.3.7) для

Ь0 и bj. Уравнение

(4.3.9в) дает смещенную

оценку о**.:

п

п

 

г=1

і=в

 

в чем можно будет^убедиться в дальнейшем.

4.3.3. Математические ожидания

и дисперсии оценок;

дисперсионный

анализ

Плотности распределений вероятности для Ъ0 и Ъі можно полу­ чить с помощью теоремы сложения для нормального распределения или теоремы разложения для распределения %2. Однако эти детали, которые можно найти^в курсах статистики, здесь опущены. Так как Ь0 и Ъх являются линейными комбинациями Yt, можно заклю­ чить, что любая из этих оценок распределена по нормальному закону. Прежде всего представляют интерес математические ожи­ дания и дисперсии Ь0 и bit так как эти характеристики необходимы для последующего анализа методов построения моделей.

Линейные модели с одной переменной 243

Математические ожидания Ь0 и bj соответственно равны (сум­

мирование ПРОИЗВОДИТСЯ ОТ І = 1 ДО П И 2.Рг ( ж і — ж) = 0)

2^ ~~YP~~^

2 Pi {xt — «)[ßo-r-ßi(*i — x)]

2Pi (^г — ^ ) 2

Отсюда видно, что bo и bt являются несмещенными оценками. Ана­

логично для дисперсий Ь0 и Ьі получаем

(здесь Oy. постоянна)

Var {bo} = % {(бо-ßo)2

} = Var {Ц^Щ

=

 

 

 

 

 

l

Z J P'

J

 

 

 

 

 

2pVar{Y\}

o^Pi _ o-y.

(4.3.10)

 

 

( S f t ) 1

_

(2«Г

 

 

Var

= g { ( 6 , - ß , ) 2 } = Var I ^

^ "

i f

j

=

 

=

2 Pi (ч - *)2 V a r ^ =

2 Pi to -

*)2V a -yJ ^

0yi

(4 3 11)

 

[2м*і-*)аГ

12P'(**-*)8]*

S ^ ^ - Ï ) 2 '

 

Частным случаем рассмотренной выше линейной модели явля­ ется прямая и = ßa;, проходящая через начало координат. Можно показать, что оценка углового коэффициента равна

 

n

 

 

 

2

ptfixi

 

а ее дисперсия

Ъ = ъ=Ч2p**.

(4-3-)

і = і

а 2

 

 

 

 

Ѵаг{Ь} = п

1 У;

(4.3.11а)

2 РІ*\

і=1

Теперь осталось найти лишь несмещенную оценку су , что

можно сделать с помощью следующей теоремы (теорема разложе­ ния для ^-распределения):

244 Глава 4

 

Если сумма

квадратов п переменных Wt,

W2,

• • -, Wn

пред­

ставлена в виде

к сумм квадратов Su

S2,- • -, Sh

соответственно

с ѵ і> ѵ 2 , • • ч vh

степенями свободы, то

 

 

 

 

 

 

 

х * = 2

=

5 I + 5 2 + . . . + 5 f c .

 

 

 

 

 

 

 

i=i

 

 

 

 

 

 

 

Кроме того,

чтобы

величины

»Sj, jS"2? • • •?

 

были статистически

независимы

и распределены

по закону %2 соответственно

с ѵ4 ,

ѵ 2 ,

. . ., vh

степенями

свободы,

необходимо

и достаточно,

чтобы

 

 

 

 

V i + ѵ 2 + - • • + ѵ й = п.

 

 

 

 

 

В конце главы приведен список литературы, где можно

найти

доказательство

этой теоремы.

 

 

 

 

 

 

 

Необходимое

разложение

в данном

случае

можно выполнить

следующим

образом. Если обе стороны

тождества

 

 

(Yij

- тц) =

и

-

Yi)

+ (Yt

-

Yt) +

(Yi -

Ці)

=

 

 

= (Yu - Yt) + (Yt - Yt) + (b0 - ß0 ) + (it - ß,) (a-i - я)

возвести в квадрат и просуммировать по і и то можно легко показать, что смешанные произведения обратятся в нуль или вслед­ ствие ограничений (4.3.4), налагаемых методом наименьших квад­ ратов, или из-за обращения в нуль суммы по /'. Например, смешан­ ное произведение

2 2

 

{Ytj-Yt)iXt-Yt)

І=І j=i

 

 

равно нулю, так как суммирование

по /' дает

S

(Yu~Yt)

= 0.

3 = 1

 

Смешанные произведения

типа

 

2 (Yt-Yt)

(ftt - ß O

i=l

равны нулю в силу второго уравнения (4.3.4). После отбрасывания смешанных произведений остаются следующие суммы квадратов:

2 2 (г«у-лОа = S 2( У * / - ^ ) а +

г=1 j=l

г=1 j= l

 

+ S

р £ (Fe — ^ ) 2 + ( & о — ß o ) 2 S p i +

( & i - ß i ) a S ^ t e - * ) 2 -

i= l

t=l

г=1

(4.3.12)

Линейные модели с одной переменной 245

Слева стоит полная сумма квадратов разностей между эксперимен­ тальными значениями и математическим ожиданием Y при данном x. Первый член справа является суммой квадратов отклонений внутри набора данных (сумма квадратов ошибок), второй член представляет собой сумму квадратов отклонений относительно эмпирической линии регрессии (остаточная сумма квадратов), третий член — сумма квадратов отклонений Ъ0 от ß 0 , а четвер­ тый— сумма квадратов отклонений Ь1 от ß j 1 ) .

Интерпретировать эти члены проще всего с помощью фиг. 4.2.2. Первый член правой части есть мера экспериментальной ошибки, полученной в каждом отдельном эксперименте, выполненном при различных значениях х; второй член служит мерой эффективности линейной модели для подгонки экспериментальных данных. Левая

часть

равенства (4.3.12)

является суммой

квадратов,

аналогич-

 

 

71

 

 

 

 

ной выражению (2.3.9) с

2 pt степенями свободы и распределенной

 

І=І

 

 

 

равен-

как оу. x2 - Можно показать, что каждый член правой части

 

 

 

п

 

 

 

ства (4.3.12) распределен по закону сгу.ѵ2 с

2 РІпі

п

—2,

1 и 1

 

 

1

І=І

 

 

 

степенями свободы соответственно.

 

 

 

 

На

сумму квадратов

ошибок наложено п связей, по

одной

на каждую величину Yt,

которая вычисляется. Остаточная

сумма

квадратов удовлетворяет двум ограничениям, по одному на каждое из выражений (4.3.3), а оставшиеся две степени свободы распреде­ ляются по одной между двумя последними суммами квадратов, так как каждая из них содержит по одной переменной, Ь0 или Ь4 . Можно также утверждать, что Ь0 является случайной величиной,

распределенной по нормальному закону относительно

ß 0 ,

&і —

случайная величина, нормально распределенная

относительно ß t ,

и что Ь0

и &! статистически независимы.

N

равенства

Если

оценивать о*у по второму члену правой части

(4.3.12),

который представляет собой взвешенную сумму

квад­

ратов остатков

 

 

 

 

71

 

(4.3.13)

 

^ = -j^2^Pi(Yi-Yi)',

 

і = 1

*) В отечественной литературе первый член называют суммой квадратов, связанной с дисперсией, характеризующей ошибку опыта, или суммой квад ­ ратов, связанной с «чистой» ошибкой. Второй член называют суммой, обус­ ловленной неадекватностью. Остаточной суммой квадратов у нас принято

пvt

называть сумму ^ 2

~ Yt)2.— Прим.

ред.

і = 1 і = 1

 

 

246 Глава 4

то легко показать, что s? будет

несмещенной оценкой

O y . , если

модель корректна,

ибо, согласно

разд. 2.3.2, Ш{%2 (для п

степеней

свободы)} = п.

Действительно,

 

 

п

 

 

 

g { l T ^ 2 ^ ^ - ^ ) 2 } = 1

^ 2

g { a M 2

( Д л я

п ~ 2 ст. СВ . )}=:

і=1

 

 

 

 

 

2

 

 

 

 

стУ-

% 2 ( Д л я

« — 2

ст. св.)} = о-уг

=

-^І2

(Тем самым доказывается, что максимально правдоподобная оцен­

ка cry. является смещенной.) Если же линейная модель не коррект­

на, то математическое ожидание s2, не равно GY.

, т. е. s2, дает сме­

щенную оценку ( J Y . .

 

 

Величина

 

 

п ѴІ

_

 

s ! = ± z L b !

 

(4.3.14)

S t=l

тоже является несмещенной оценкой а у.; величина si служит мерой

рассеяния, вызванного экспериментальной ошибкой, тогда как выражение (4.3.13) характеризует неточность подгонки (неадек­

ватность). Следовательно, прежде чем принять какое-либо

решение

по

поводу модели, исследователь

должен проверить

гипотезу

о том, что линейная модель T ] = ß 0

+

ß1 (a; — х) удовлетворитель­

но

описывает экспериментальные

данные, для чего нужно соста­

вить отношение дисперсий s£/s2 (разд. 3.6). Если

s2

d r > ^ i - a ,

где F i - a берется из соответствующей таблицы, гипотезу о том, что линейная модель адекватна, следует отвергнуть. Тогда необхо­

димо выбрать другую

модель.

Если

вычисленное

отношение дисперсий меньше, чем Fi-a,

гипотеза

о том, что

линейная модель адекватна, принимается

(модель правдоподобна, но не обязательно корректна). В этом случае дисперсии s2 и si, являющиеся оценками величины Oy.,

п

можно объединить, чтобы получить лучшую оценку оу. с 2 РІ 2

степенями свободы. При таком объединении каждая из дисперсий входит с весом, пропорциональным соответствующему числу сте-

s! = Varlbo} i =2 1 Pj

 

 

Линейные

модели

с

одной

переменной

 

247

пеней

свободы,

как в

формуле

(2.4.12):

 

 

 

«У.- =

«

 

 

 

=

«

(4.3.15)

 

( S

P i - n ) + ( n - 2 )

 

 

 

 

 

 

 

i=i

 

 

 

 

1=1

 

 

 

Конечно, если повторные измерения Ytj

при

заданном xt

не

про­

изводились, то

дисперсию С у

нужно оценивать лишь по s?,

в ре­

зультате чего величина « у

становится непригодной в качестве оцен­

ки, если модель неправильна. Без повторных данных /^-критерий не может быть применен для проверки гипотезы линейности, но данные можно нанести на график и исследовать визуально. Про­ верка гипотезы ßj = 0 может быть осуществлена, что будет кратко показано.

Таблица

4.3.1

Распределение вариаций относительно модели ii = ßo + ßi(a '—<ю)

Источник

 

Число

 

Сумма квадратов

степеней

Средний квадрат

рассеяния

 

 

свободы

 

1.

Отклонение

bo

(bo - ßo) 2

S

p i

 

 

от ßo

 

 

 

 

 

i = 1

 

 

 

 

 

 

 

 

 

n

 

 

2.

Отклонение

Ьі

 

 

 

i = l

 

 

 

от ßi

 

 

( b i - ß D

2

P j ( * j - * )

2

 

 

 

 

 

2

 

3.

Отклонения

 

 

 

 

 

 

n — 2

 

относительно

 

i = 1

 

 

 

 

 

линии

регрес­

 

 

 

 

 

сии

 

 

 

 

 

 

 

 

 

 

 

 

n

Pi

 

 

 

4.

Отклонения

 

i =

1 ; = 1

 

i = 1

 

внутри

серий

 

 

(ошибка

экспе­

 

 

 

 

 

 

 

римента)

 

 

 

 

 

 

 

 

5.

Общий,

отно­

 

 

 

 

 

n

 

 

 

 

 

S p,

 

сительно

мате­

i =

1 ; =

1

 

 

 

i = 1

 

матических

 

 

 

 

 

 

 

ожиданий г|£

 

 

 

 

 

 

 

 

= Var{bi>

2

P* ( * i - * ) 2

 

 

i =

1

„2

1

 

 

 

n - 2 . .

 

 

i

= 1

 

 

n

Pi

 

2 i S= 1 .j2= 1 C 7 w - V f

i = l

В табл. 4.3.1 приведены различные суммы квадратов и соответ­ ствующие степени свободы, обычно используемые в так называемом дисперсионном анализе, основанном на теореме разложения для ^-распределения и F-критерии для проверки отношения диспер-

248 Глава 4

сий. Суммы квадратов, разделенные на соответствующие числа сте­ пеней свободы, называются средними квадратами. Каждую диспер­ сию из табл. 4.3.1 можно использовать в качестве оценки величины аУі, но в силу того, что Ѵаг{Ь0 } и Ѵаг {£>!}, как правило, неизве­ стны, для оценки а У і используется объединенная оценка sf'i- В свою

очередь оценки дисперсий коэффициентов

Ъ0 и Ьі можно получить

с помощью Sy;,

подставляя последнюю величину вместо Оуг

в выра­

жения (4.3.10) и

(4.3.11).

 

 

 

 

 

 

 

 

Если расчеты выполняются вручную, могут оказаться полез­

ными следующие

тождества:

 

 

 

 

 

 

 

 

2 Pi{fi-YY

= b\ S Р І ( Х І - Х

) \

 

 

 

 

i = l

 

 

j = l

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

; 2 > ( Г І - ? , ) - = 2 Р І І Т

(ÂPiYi)2

\D Pi

 

 

(Y

i-Y)]2

i = l

 

i = l

 

2 pt

2

pi

 

(xi—xf

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 Pt (xi — x) (Yi

— Y)

= S Pt [xi — x)

Yt.

 

 

i =l

 

 

 

 

i = l

 

 

 

 

 

Дисперсионный анализ, несколько отличающийся от предыду­

щего, можно осуществить, разлагая (Хц

Y) вместо

(Yа

— т]г ),

где Y = ^YijlUpi,

Член Ytj

Y

можно представить

следующим

образом:

 

 

 

 

 

 

 

 

 

 

(Yu -

Y)

= ( У „ -

У,)

+

(У, -

У,) ч-

(У,

-

У).

 

Как и раньше, обе части этого равенства можно возвести в квад­ рат и просуммировать по і и /. Разложение суммы квадратов будет аналогично описанному выше. Результаты представлены в табл. 4.3.2. Суммы квадратов во второй и третьей строках этой таблицы такие же, как и в табл. 4.3.1. Сумме квадратов в четвертой строке соответствует общее число степеней свободы 2.Рг минус 1, причем единица появляется в силу ограничения, наложенного при вычис­ лении У. Как следствие сумма квадратов в первой строке имеет только одну степень свободы.

Сначала можно проверить гипотезу о линейности модели, сос­ тавляя отношение дисперсий sf-fsl и применяя ^-критерий, как объяснялось выше. Если отношение дисперсий не является значи­ мым, линейная форма модели принимается. Затем можно прове­ рить гипотезу, что ßi == 0, составляя отношение sysYi- Если это отношение больше, чем значение Fy-a, из таблиц для некоторого выбранного а, гипотеза ßj = 0 отвергается. На фиг. 4.3.1, а пока-

 

 

 

 

Линейные

модели

с одной

переменной

249

 

 

 

 

 

 

 

 

 

Таблица 4.3.2

 

 

Распределение вариаций относительно среднего

Y

Источник

 

 

 

 

Число

 

 

 

Сумма квадратов

степеней

Средний квадрат

рассеяния

 

 

 

 

 

 

 

 

свободы

 

 

1. Отклонения

 

 

у

2

 

 

 

между значени­

2 Р;(Ѵ->

 

i = 1

ями на

линии

і =

1

 

 

 

регрессии

и об­

 

 

 

 

 

 

 

щим

средним

 

 

 

 

 

 

 

(обусловленные

 

 

 

 

 

 

 

регрессией)

 

 

 

 

 

 

 

2. Отклонения

2

P i

^ i -

Y ^

n — 2

2

 

относительно

i = 1

 

 

 

i = l

 

линии

регрес­

 

 

 

n - 2

сии

 

 

 

 

 

 

 

 

 

 

 

n

Pi

 

 

та

2 2

 

 

 

 

 

 

 

 

3. Отклонения

 

 

(Yu~ro2

2

« i = 1 J = 1

внутри серий

2

S

 

2 T 1

 

 

 

i = U = l

 

_

i = l

 

4. Общий

 

 

n

Pi

 

n

i

= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

i = 1

 

 

 

 

 

2

2 ( r u - r > *

 

 

 

 

 

i = l j = l

 

 

 

 

 

зана ситуация, когда экспериментальные данные гораздо лучшеаппроксимируются оценкой линии регрессии, чем горизонтальной прямой, тогда как для данных на фиг. 4.3.1, б горизонтальная прямая дает столь же хорошую подгонку. Для проверки гипоте­

зы о том, что ßi =

0 или любому другому значению, можно также

применить критерий t, основанный на соотношении

(4.3.20), за­

писанном ниже.

 

 

 

 

 

Еще одну

весьма полезную

форму

дисперсионного анализа

можно получить, разлагая (¥ц

— 0) следующим образом:

(Yij

-

0)

= (Yu - Yt)

+

(Yt -

Yd + (Yt -

0).

Снова выполняя те же действия, получим следующее

разложение

для суммы

квадратов:

 

 

 

 

2 2(^;—0)2=2 2 ( Y U - Y t r

+

 

 

і=1 3=1

 

 

î = l 3=1

 

 

 

 

 

 

 

+

^pi{Yi-Yi)z+

?,pi(Yt-0)K

 

 

 

 

І=І

i=i

 

Первые два члена справа от знака равенства такие же, как в треть­ ей и второй строках табл. 4.3.2. Последний член, представляющий

Соседние файлы в папке книги из ГПНТБ