Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
27
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

112

 

 

 

Глава

2

 

 

Kenney J. F . , Keeping E . S., Mathematics of Statistics, Van Nostrand,

N . Y . , 1951.

 

 

 

 

 

Mandel J., The Statistical Analysis of

Experimental Data, W i l e y , N . Y . ,

1964.

 

 

 

 

 

 

 

Mosteller

F . ,

Rourke R. E . K . , Thomas

G. В . , Probability and Statistics,

Addison Wesley,

Reading, Mass., 1961; есть русский

перевод: Мостеллер Ф . ,

Р у р к е

Р . , Томас

Д ж . , Вероятность, изд-во «Мир»,

1969.

Wallis W . A . , Roberts H . V . , Statistics: A New Approach, Free Press,

Glencoe,

111., 1956.

 

 

 

W i l k s S.

S.,

Mathematical Statistics,

W i l e y , N . Y . , 1962; есть русский

перевод:

У и л к с

С , Математическая статистика, изд-во «Наука», 1967.

Wine R. L . , Statistics for Scientists

and Engineers, Prentice-Hall, Engle-

wood

Cliffs,

N . J . , 1964.

 

 

 

Глава 3

СТАТИСТИЧЕСКИЙ А Н А Л И З И ЕГО П Р И М Е Н Е Н И Я

Основная

цель любого

экспериментирования состоит в том,

чтобы получить

некоторые

заключения об ансамбле по выборке

из этого ансамбля. Такого

рода

выводы, широко

используемые

при анализе

процессов, можно отнести к трем различным типам,

а именно: 1) оценивание параметров,

2) получение интервальных

оценок и 3)

проверка

гипотез.

Все

они описаны

в этой главе

и используются

как

здесь,

так

и в

последующих

главах.

3.1. В В Е Д Е Н И Е

При получении наилучшей из возможных оценок одного или нескольких параметров распределения вероятности или предпола­ гаемой модели процесса возникает так называемая задача оцени­ вания параметров. Этими параметрами могут быть коэффициенты, определяющие или описывающие распределение вероятности слу­ чайной величины, такие, как среднее по ансамблю и дисперсия в случае нормального распределения вероятности, или коэффи­ циенты в эмпирической модели процесса. Оценивание некоторого отдельного значения параметра дает точечную оценку. Рассмотрим, например, плотность распределения вероятности одной случайной величины X некоторой известной математической формы р (х, Ѳ), содержащую один неизвестный параметр Ѳ. Случайная величина представлена случайной выборкой и х2, • . -, хп). На основе собранных экспериментальных данных, вычисляя некоторую ста­ тистику, например выборочное среднее X, можно получить оценку значения Ѳ. Говорят, что X = \іх, где значок Л означает оценку стоящей под ним величины.

Оценки второго типа, интервальные оценки, получаются при оценивании величины интервала, который с заданной вероят­

ностью включает

параметр

ансамбля

Ясно,

что оценка

пара-

*) П р а в и л ь н е е было бы говорить, что доверительный интервал

накрывает,

а не включает

с заданной вероятностью теоретический параметр . Объяснение

обстоятельств,

связанных с

такой трактовкой,

приводится

в

книге

на стр . 124.—

Прим.

ред.

 

 

 

 

 

114

Глава

3

 

метра представляет собой

просто

одну полезную статистику;

интервальная оценка несколько более информативна.

 

Интервальное оценивание

тесно

связано с проверкой

гипотез.

При проверке гипотез предполагается, что одна или несколько математических функций описывают некоторые особенности экспе­ риментальных данных. Эти функции могут быть подобны по форме и отличаться друг от друга лишь значениями параметров или же могут различаться по форме. Итак, выдвигаются некоторые гипотезы, устанавливаются определенного типа критерии, соби­ раются данные, проводится анализ и принимается некоторое решение. Например, для заданной функции р (х, Ѳ) и выбранных некоторых критериев после получения выборки и х2, . . ., хп), содержащей п наблюдений, требуется принять или отвергнуть

гипотезу

о том, что параметр Ѳ равен некоторому значению Qt

или что

Ѳ больше, чем Ѳ2 , или даже что плотность распределения

р (х, Ѳ) имеет предполагаемую математическую форму. В гл. 4 и 5

рассмотрена задача

проверки гипотез в связи с эмпирическими

моделями

процессов.

 

 

 

Чтобы

получить

«хорошие» оценки,

необходимо стремиться

к

тому, чтобы они

были по возможности:

1) несмещенными,

2)

состоятельными,

3) эффективными и

4)

достаточными.

Н е с м е щ е н н а я о ц е н к а . Говорят, что оценка Ѳ пара­ метра Ѳ является несмещенной, если ее математическое ожидание % {Ѳ} равно значению параметра ансамбля Ѳ. Например, наиболее широко используемой оценкой среднего по ансамблю является выборочное среднее X, которое представляет собой несмещенную оценку Цх- С другой стороны, как показано в разд. 2.4, выбороч­ ная дисперсия

дает смещенную оценку а2х в отличие от выражения

sx^ZiXi-Xfnu

С о с т о я т е л ь н а я о ц е н к а . Оценка называется состоя­ тельной, если по мере увеличения объема выборки она все ближе приближается к значению параметра ансамбля, т. е. если % {(Ѳ — Ѳ)} стремится к нулю, когда объем выборки п или время регистрации tf стремится к бесконечности. Точнее, вероятность того, что оценки сходятся к истинной величине, должна стремить­ ся к единице при неограниченном возрастании объема выборки:

Р { Ѳ ^ - Ѳ } - > 1 при п - > о о .

Э ф ф е к т и в н а я о ц е н к а . В некоторых несущественных для данного рассмотрения случаях используются несостоятельные

Статистический

анализ и его

применения

115

оценки, но гораздо чаще для данного параметра можно найти несколько состоятельных оценок. Тогда возникает вопрос, какой из них следует пользоваться. Сравнивая дисперсии оценок, можно выбрать наиболее эффективную оценку в том смысле, что ее дис­ персия минимальна [1]. Например, среднее значение и медиана для п наблюдений случайной величины, распределенной по нор­ мальному закону, имеют математическое ожидание и, и дисперсии соответственно (1/гі) а 2 и (п/2п) а 2 . Таким образом, дисперсия среднего меньше, чем дисперсия медианы, и тем самым первая величина более эффективна. Критерии несмещенности и мини­ мальной дисперсии нельзя рассматривать раздельно, ибо слегка смещенная оценка с малой дисперсией может оказаться предпочти­ тельней, чем несмещенная оценка с большой дисперсией.

Д о с т а т о ч н а

я о ц е н к а . Если Ѳ представляет собой

достаточную оценку

параметра Ѳ, то не существует другой оценки

этого параметра, которую можно получить по выборке из некото­ рой генеральной совокупности и которая дала бы дополнительную информацию о нем. Фишер [2] показал, что количество измеримой информации, содержащееся в некоторой оценке, равно обратной величине от ее дисперсии; таким образом, понятие достаточности эквивалентно требованию минимальной дисперсии. Достаточная оценка с необходимостью должна быть эффективной и, следова­ тельно, также и состоятельной. Если допустить, что достаточная оценка существует, то метод максимального правдоподобия, описанный в следующем разделе, позволяет ее найти. Оказывается,

что

величины X

и s\

являются

достаточными

оценками параме­

тров

цх и

а\

некоторого нормального

распределения.

Теперь

перейдем

к

методам

оценивания

параметров.

 

 

3.2. М Е Т О Д Ы

О Ц Е Н И В А Н И Я

П А Р А М Е Т Р О В

Существует много различных методов оценивания параметров,

но не все из них можно

эффективно использовать применительно

к любой заданной задаче. Здесь будут рассмотрены лишь три метода:

1.

Метод максимального правдоподобия (используется в гл. 4,

5, 8

и 9).

 

 

2.

Метод моментов

(используется

в гл. 9).

3. Оценивание по Байесу (используется в гл. 8 и 9).

 

8.2.1. Метод

максимального

правдоподобия

Широко известной и весьма желательной процедурой оцени­ вания (если ее удается провести) является метод максимального правдоподобия, предложенный Фишером [3]. Этот метод асимпто-

116

Глава 3

тически приводит к оценкам, обладающим максимальной эффек­ тивностью, но не обязательно несмещенным. Достоинством метода максимального правдоподобия является то, что при определенных условиях (и не слишком строгих) оценки параметров имеют нор­ мальное распределение в случае выборок большого объема. В этом разделе метод максимального правдоподобия применяется для оценивания параметров плотностей распределения вероятности. В гл. 4 и 5 он используется для оценивания коэффициентов Билинейных эмпирических моделях процесса.

Предположим,

что р (х;

Ѳ1 ?

Ѳ

2 ,

. . .)

— плотность распределе­

ния

вероятности

случайной

величины

X,

которая содержит один

или

несколько параметров

ѲІ 5

Ѳ2 ,

 

. . .

и форма которой известна.

Предположим также, что значения параметров Ѳ1 ? Ѳ2 , . . . неизве­ стны. Каким образом можно найти наиболее подходящие значе­

ния, т. е. оценки параметров Ѳі, Ѳ2 ,

. . .? Один из способов состоит

в том, чтобы получить случайную

выборку

значений

случайной

величины X, {ХІ, х2, . • ., хп}, и

выбрать

значения

параметров

Ѳ4, Ѳ2, . . ., теперь рассматриваемых как случайные переменные,

максимизирующие функцию

правдоподобия L І 5

Ѳ2 , . . . | хи

х2, . . .,

хп), которая описана в приложении А в связи с теоремой

Байеса.

Такие оценки Qt,

Ѳ2 , . . . называются

максимально

правдоподобными оценками. По существу в этом методе выби­

раются

такие значения

Ѳ1 } Ѳ2 , . . .,

которые по

меньшей

мере

с той

же вероятностью

генерируют

наблюдаемую

выборку,

как

и любой другой набор значений параметров при условии, что плотность распределения вероятности случайной величины X определяется с помощью плотности распределения р (x | Ѳ4, Ѳ2, . . .) *). При получении максимально правдоподобных оценок

предполагается, что вид функции р (x; Qu

Ѳ2 , . . .) задан

(нужно

определить лишь значения Ѳг) и что все

возможные значения Ѳ;

до экспериментирования равновероятны.

 

 

Функция правдоподобия для параметров при одном заданном

наблюдении является просто плотностью

распределения

вероят­

ности, в которой наблюдение рассматривается как некоторое фиксированное число, а параметры — как переменные:

L І 5 Ѳ2 , . . . I XU = p fa; Ѳі, Ѳ2 , . . . ),

где строчной буквой х с числовым индексом обозначено значение соответствующего наблюдения, входящее в плотность распре-

*)

Выражение p (x

\ Ѳ ь

Ѳ2 , • • •)

в разд . 2.1 называлось условной плот­

ностью

распределения

вероятности. В е р т и к а л ь н а я

черта читается

«при за­

данных». Е с л и значения Ѳ фиксированы, то p

(x

| Ѳ) обозначает

плотность

распределения вероятности величины

X п р и

данном значении Ѳ. С другой

стороны, р(х

I Ѳ) означает, что событие х произошло

и может

рассматриваться

к а к данное

(фиксированное)

и что

величина

Ѳ я в л я е т с я

переменной вели ­

чиной,

зависящей от наблюденного значения

X.

 

 

 

 

Статистический

анализ

и его

применения

 

 

117

деления

вероятности.

Функция

правдоподобия

для

парамет­

ров, построенная по

нескольким

наблюдениям,

является

про­

изведением индивидуальных

функций,

если

наблюдения

неза­

висимы:

 

 

 

 

 

 

 

 

 

 

. . . I Xi, x2,

 

п

 

 

1 Xi)

 

 

L (Ѳі, Ѳ2 ,

. . ., xn)

=

[j L (Ѳи

Ѳ2 ,

. . •

=

 

 

 

 

І = І

 

 

 

 

 

= p (xu- Ѳц Ѳ2 , . . .) p (xz; Ѳи

Ѳ2 , . . . ) . . . p (хп; Ѳи

Ѳ2 , . . . ) .

(3.2.1)

При выборе в качестве оценок параметров, Ѳг значений, ко­ торые максимизируют L при данных значениях (Хі, х2, • • •> хп), оказывается более удобным работать с In L , а не с самой функ­ цией L :

In L = In p (ѲІ 7 Ѳ2 , . . .) + In p (x2; Qu Ѳ2 , . . . ) + . . . =

= S In p (xt; Qu Ѳ2 , . . .).

(3.2.2)

г=1

Величину In L можно максимизировать относительно вектора Ѳ, приравнивая нулю частные производные от In L по каждому из параметров:

n

д I n L

д

2

\пр{хь;

Ѳ ь

Ѳ2 , . . . )

 

 

i—i

 

 

 

О,

 

 

 

 

 

 

 

д

2

1пр(хг;

Ѳ ь

Ѳ2 , . . . )

 

^

= —

 

ж

 

= о

< 3 - 2 - 3 )

Решение уравнений (3.2.3) дает искомые оценки Ѳ\, Ѳ2 , . . . .

(Часто при получении Ѳ вместо аналитического решения при­ ходится ограничиваться итерационным.) Выполнив эти выкладки можно показать, что при довольно слабых условиях при стремле­ нии п к бесконечности максимально правдоподобные оценки обла­ дают желаемыми асимптотическими свойствами:

1) l i m g {6,} = ѲГ, n-юо

2) величина ]/~п г Qt) распределена по нормальному закону;

3) оценки параметров совместно эффективны.

118

Глава 3

Максимально правдоподобные оценки не обязательно должны быть несмещенными; например, максимально правдоподобная оцен­ ка дисперсии случайной величины с нормальным распределением оказывается смещенной, как показано в примере 3.2.1. Однако максимально правдоподобные оценки являются эффективными и, следовательно, состоятельными. Более того, если можно полу­ чить достаточную оценку, то метод максимального правдоподобия позволяет ее получить. Наконец, если Ѳ является максимально

правдоподобной оценкой Ѳ, то / (Ѳ) будет максимально правдопо­ добной оценкой функции / (Ѳ).

Пример 3.2.1. Оценивание параметров плотности нормального

распределения вероятности методом максималь­ ного правдоподобия

Найдем максимально правдоподобные оценки Qi и Ѳ3 для плотности нормального распределения вероятности

 

Р і х ;

ѳ " Ѳ 2 ) = ігЫ е

х р

Г - у ( ^ ) 2 ] -

Решение

 

 

 

 

 

 

Прежде всего образуем функцию правдоподобия для выборки

і:

х2, • • -, хп}

из

измерений

случайной

величины X:

 

 

 

п

 

 

 

L

(Ѳь Ѳ2 1 xi, x2,

•. •,

Xn) = L = Д

p

(xi; Ѳ І , e2 )

=

 

 

 

i=l

 

 

 

 

 

 

 

 

n

 

и для удобства прологарифмируем обе части равенства (а):

n

 

 

In L = - n In (Ѳ2 ѴЩ - 1 2 (

2

(б)

і = 1

 

 

Затем получим максимально правдоподобные оценки, приравни­

вая нулю частные производные

от

In L :

 

4 - у,

(Х1-вл

= о.

(в)

Статистический

анализ и его

применения

119

і=1

 

 

 

 

 

 

 

 

 

 

Tl

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i =i

 

 

 

 

 

Следовательно,

максимально

правдоподобные

оценки

9j

и Ѳ2

равны

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

M.

 

'

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

М42<«.-х>"Г-Г"-^4Г

 

 

 

 

 

 

 

i=l

 

 

 

 

 

 

 

оо) эффективными

Итак, 6j и Ѳ2

являются асимптотически (при n

 

оценками х

и ох',

при

этом

Ѳ2

является

смещенной

оценкой,

ибо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

7 1 - 1 .

 

} * а х

 

 

 

 

 

 

 

 

 

{ [ ^ * ] 1 / 2

 

 

 

 

•Однако

— несмещенная

оценка,

так

как

% { Ѳ і }

=

% {X}

= Цх-

Заметим,

что оценки

9 t

и

Ѳ2

независимы.

 

 

 

 

 

 

 

5.2.5.

Метод

 

моментов

 

 

 

 

Методом

моментов

называется

один

из

наиболее

старых

методов

оценивания

параметров,

развитый

Карлом

Пирсоном.

При исследовании с помощью этого метода плотности распределе­ ния вероятности, содержащей п параметров (Ѳ^ Ѳ2 , . . ., Ѳп ),

вычисляются

первые

п моментов

случайной

переменной X:

 

оо

 

 

 

 

 

 

 

И* =

2 Х

(х>

Ѳі>

• • •>

Ѳп )

( д и с к р е т н о е

распределение)

ИЛИ

— оо

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Иг =

j ххр

(х;

Ѳ І , . . .,

Ѳ П )

dx

(непрерывное распределение),

 

— оо

 

 

 

 

 

 

 

которые затем приравниваются выборочным моментам, получен­

ным из экспериментальных данных. После этого можно найти ліетодзначениймаксимальногѲ (возможныправдоподобиянекоторые осложнения)метод моментов.В отличивсегднеота

120 Глава 3

приводит к эффективным оценкам, но всегда обеспечивает состоя­ тельные оценки.

В качестве примера применения метода моментов можно вос­ пользоваться табл. 2.3.1, из которой видно, что первый момент случайной величины с биномиальным законом распределения равен ?гѲ; кроме того, в разд. 2.3 было показано, что первый

момент для нормального распределения равен

цх, а второй цен­

тральный момент равен а\- Приравнивая эти моменты величины

X

соответствующим выборочным моментам, получим для оценок

Ѳ,

М-х и

dx следующие

выражения:

 

 

.

у. ЩХІ

-

или

1 _

распределение),

nQ—==^

 

Ѳ = — X (биномиальное

 

S » *

 

 

 

 

 

 

Hoc — —=j

= A

,

(нормальное

распределение).

 

s » *

Обычно получение оценок сопряжено с большими трудностями.

Пример 3.2.2. Метод моментов

 

В некотором

эксперименте

наблюдаемые исходы относятся

к одной из двух

совокупностей,

но ни до проведения эксперимен­

та, ни после не было известно, какую из совокупностей следует

выбрать. Плотности

распределения вероятности для двух сово­

купностей

 

и

В)

имеют

следующий вид:

 

 

^

 

1

- 4

<»-«)•

Р

А

=

^)Ще

 

(—оо < г / < о о ) ,

 

 

 

 

I

_ І

(J/-ß)2

Р

в

^

=

^\Щв

 

( —оо < г / < оо).

Обозначим через со вероятность

надлежит совокупности А.

Тогда

ности величины Yt (і =

1, . .

того, что некоторый исход при­ плотность распределения вероят­

., п) имеет вид

Р (Уі) = ®РA ІУІ) + (1 — со) рв (уі)

( - о о < У і < оо).

По выборке из п наблюдений требуется найти оценки параме­ тров ОС, ß И (О.

Статистический

анализ и его

применения

121

Решение

При использовании метода максимального правдоподобия потребовалось бы максимизировать выражение

n

П РІУІ' а ' ß» ®) i = l

относительно трех параметров, однако в результате получились бы трансцендентные уравнения, фактически не разрешимые. К сча­ стью, оценки в этой задаче можно найти методом моментов. Используя определение математического ожидания, можно пока­ зать, что

g {У} =

соа +

(1 -

 

о)

ß,

 

 

(a)

g

2 }

=

(о (1 +

а 2 )

+

(1 -

и) (1 +

ß2 ),

(б)

g

{Y3}

=

к» (За

+ а

3 )

+

(1 -

<о) (3ß

+ ß 3 ) .

(в)

(Заметим, что для оценивания трех параметров требуется три момента.)

Пусть выборочные моменты вычисляются по формулам

1

П ' 4

n

i a

n

Теперь, приравнивая выборочные моменты их математическим ожиданиям, получим уравнения

 

 

 

 

 

 

и — ß)

= ai

 

ß,

 

 

 

(г)

 

 

 

 

ш (1 -

о)

-

ß)2

=

а 2 -

1,

 

 

(д)

 

 

 

о

(1

-

о)

(1

-

2(a) (а

 

-

ß) 3

=

а3.

 

(е)

Напомним, что

 

g {У2

-

(g {У})2 }

 

=

g {У2 }

-

(g {У})2 .

Из уравнения

 

(г)

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(o =

 

 

 

 

 

fcß.

 

(ж)

Подставляя выражение (ж) в уравнения

(д) и

(е) и

обозначая

и = ах ß, у =

а

— бц, преобразуем

уравнения

(д) и

(е) к сле­

дующему

виду:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

иѵ =

а 2

1>

 

 

 

 

(3 )

 

 

 

 

 

 

 

( у w) =

 

а3.

 

 

 

 

(и)

Решив

эти

уравнения, получим

оценки

 

 

 

 

 

°

=

Й 1

+

2 (о, - 1 )

t g a

 

+

 

+

4

I ) 8

] .

(к)

 

P =

= g

i +

2 ( a 2 - l )

fa

 

У ^

+

^ а д

l ) 8

] ,

(л)

Соседние файлы в папке книги из ГПНТБ