Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
27
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

Уравнение

(1)- i - = a + ßz

(2)2/ = a + ß- 1

(3)- ^ - = a + ßz,

 

и л и

у — a + ßx '

 

1

 

 

а

, о

и л и — =

 

 

f-ß

 

У

 

X

 

(За)

у =

 

a-\-ßx

+ 7

'Л)

 

у = ах^

 

(4а)

у = axh

 

(46)у = у.іО<ж&

(5) f/ = a ß x (эквивалент­ ные формы: у = ау&х;

Преобразования к линейному виду функций

одной переменной

 

 

Координаты прямой

 

 

 

 

 

.

ось у

 

Уравнение прямой

 

Замечания

 

ОСЬ X

 

 

 

 

 

 

 

У

 

-î— =

а 4- ßx

Асимптоты: я =

, у = 0

 

 

 

У

 

 

ß

 

 

У

 

y = a + ß 1

Асимптоты: ж = 0, у —а.

 

 

 

 

 

X

 

 

 

 

X

 

X

Асимптоты: ж =

,

 

 

У

 

У

 

 

 

 

 

Р

 

 

 

 

 

 

 

 

 

J _

 

ß +

 

 

 

 

2/

 

 

 

 

 

 

ж — #1 =

 

 

а

 

У — Уі

где

« + ß a : i +

Асимптоты: х= —

Та ж е

 

У — Уі

 

к р и в а я , что в (3),тсдвинутая

вверх ил и вниз

(ж і>

j/i) л ю б а я

(a-f-Вжі) -г

точка

на экспери­

на расстояние у

 

 

ментальной к р и ­

а

 

 

 

 

вой

l o g ;

l o g y

log X

log (у - у)

log ж

log (log у — log у)

 

logy

log г/ = log а + ß log X

log у) - logos +

ß log X

log (log у — log Y) =

= log a - f ß log X log г/ = log a 4- + ж log ß

Ес л и ß > 0, к р и в а я имеет вид параболы и про­ ходит через начало координат п точку (1, а).

Если

ß < 0 , к р и в а я

я в л я е т с я гиперболой

с

осями

координат

в

качестве асимптот

и

проходит

через точку

(1, а)

Сначала

аппроксимируют

у по формуле у —

= (УіУг — УІ) I (Уі + У2— 3 ). г Д е Уз = 0"=з +У,

х$=~Ѵхіхгі а ь уі), (х2, ^ — эксперимен­ тальные точки

После логарифмирования исходного уравнения поступают ка к в п. (4а)

К р и в а я проходит через точку (0, а )

у = а-10^)

Линейные

модели с одной

переменной

233

ибо после преобразования к новой зависимой переменной будет добавляться уже не e, а некоторая сложная функция ошибки. Например, если в модели, описываемой уравнением (4) табл. 4.1.1, наблюдаемая зависимая переменная имеет вид

Y

= ах& + е,

 

(4.1.1)

то это уравнение не эквивалентно

уравнению

 

lg У =

lg а +

ß \gx

+ e,

(4.1.2)

так как логарифм правой части равенства (4.1.1) не равен правой части равенства (4.1.2). В некоторых случаях реальная ситуация может описываться уравнением (4.1.1), и тогда необходимо нелиней­ ное оценивание коэффициентов а и ß. В других случаях в зависимо­ сти от деталей эксперимента более корректным оказывается урав­ нение (4.1.2). Еще раз этот вопрос будет обсуждаться в разд. 6.5 после рассмотрения нелинейных моделей. В этой главе достаточно предположить, что исследуемая функция линейна по параметрам.

Пример 4.1.1. Определение формы функциональной зависимости

Числа в первых двух

столбцах табл. П.4.1.1 представляют

серию

измерений зависимой переменной Y

при соответствующих

 

 

 

 

 

Таблица

ПЛ.1.1

X

Y

lg Y

Д Y

Д2У

x/Y

Д (x/Y)

1

62,1

1,79246

 

 

0,01610

 

 

2

87,2

1,93962

25,1

 

0,02293

0,00683

3

109,5

2,03941

22,3

—2,8

0,02739

0,00446

4

127,3

2,10483

17,8

—4,5

0,03142

0,00403

5

134,7

2,12937

7,4

—10,4

0,03712

0,00570

6

136,2

2,13386

1,5

—5,9

0,04405

0,00693

7

134,9

2,13001

—1,3

- 2 , 8

0,05189

0,00784

(кодированных)

значениях

независимой переменной. х.

Требует­

ся найти подходящее функциональное выражение для зависимости

Y от x.

Решение

 

 

 

Следует

вычислить

некоторые разности и отношения, часть

из которых приведена в табл. П.4.1.1.

ц — ожидаемое

Затем можно испытывать различные модели;

значение Y

при данном

х.

 

М о д е л ь n = а + ßx. Неудовлетворительна,

так как отно­

шение AY/Ax

не является постоянным.

 

234

 

 

 

 

 

Глава

4

 

 

 

 

 

 

 

 

М о д е л ь

т] =

aß* .

Преобразуется

к

виду

lg г\

=

lg a

+

+

X lg ß. Неудовлетворительна, так

как

не постоянно

отношение

Д lg

Y/Ах.

 

ах®.

 

 

 

 

 

 

lg r\ =

 

 

 

М о д е л ь

т] =

 

Преобразуется

к

виду

lg a

+

+

ß lg X. Неудовлетворительна, так

как

отношение

A lg 17A lg х

не

постоянно.

 

 

ßa; + ух2.

 

 

 

 

 

 

 

 

 

М о д е л ь

r ) = a

+

Неудовлетворительна,

так

как

не

постоянно

отношение

 

A2Y!Ax2.

 

 

 

 

 

 

 

 

М о д е л ь

т ) = ж / ( а

+

ßx). Эта

модель

эквивалентна

модели

хіц

=

a -f- $х.

Так как

отношение

A (xlY)l

Ах (Ах

= 1)

прибли­

зительно постоянно, эту модель можно использовать для подгонки экспериментальных данных. Она обеспечивает лучшую подгонку,

чем все предыдущие модели,

но нельзя утверждать, что это наи­

лучшая из всех возможных моделей.

4.2. О Ц Е Н И В А Н И Е

П А Р А М Е Т Р О В М Е Т О Д О М

Н А И М Е Н Ь Ш И Х К В А Д Р А Т О В

После того как выбрана функциональная форма эмпирической модели, можно должным образом спланировать эксперимент (об­ суждается в гл. 8) для сбора опытных данных и затем оценить пара­ метры модели. Метод оценивания, который используется в этой главе, называется линейным оцениванием или регрессионным ана­ лизом. Исследователь стремится получить в некотором смысле наилучшие оценки параметров модели, и нередко критерий опти­ мальности зависит от характера модели. Сначала будет кратко рассмотрено оценивание параметров линейной (по параметрам) модели в случае, когда плотность распределения вероятности и ее параметры известны, а затем подробно описан метод получения оценок при неизвестной плотности распределения вероятности.

Оптимальную оценку, за исключением некоторых специальных случаев, получить весьма трудно. Если требуется вычислить пара­ метры модели при заданной связи Y = / (X), где Y ж X — случай­ ные величины, и известна совместная плотность распределения вероятности р (х, у), наиболее подходящим критерием оптималь­ ности является оценка минимального среднего значения квадрата отклонения

ОООО

Ш {[Y — / (Х)12} = j j [у - / (х)}2 р (X, у) dx dy.

(4.2.1)

—оо оо

Функция / (X), реализующая минимум математического ожидания (4.2.1), является условным математическим ожиданием величины Y при заданном значении X, т. е. / (X) = % {Y \ X}, что можно доказать, подставляя соотношение р (х, у) = р (у \ х) р (х) в пра-

Линейные модели с одной переменной 235

вую часть равенства (4.2.1), что дает M i n g {[Y — / (X)]2} =

-{-оо -[-со

Min j

[ Ç [г/ - / (x)]2 р (г/ I x) dy~] р (x) dx.

- О О

— 0 0

Интеграл в квадратных скобках представляет собой момент второго порядка от условной плотности распределения р (у | х),

который

будет

минимален

 

для

 

каждого

х,

если

/ (х) =

оо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= j УР ІУ \ x) dy

=

Ш {Y

\ х).

Функция

/ (х) =

g {Y | х)

назы-

— оо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вается кривой

регрессии.

 

 

 

 

 

 

 

 

 

 

Для частного случая, когда / (X)

= ß 0 + ßiX, можно

найти

значения двух постоянных ß 0

 

и ß 4 ,

которые минимизируют выра­

жение (4.2.1), если известна функция р (х, у):

 

 

 

Min g {IY

-

0 +

ß4 X)]2 }

=

 

 

 

 

 

 

 

 

 

 

 

Min

j

j

ІУ -

ßo -

ßi*)2

p (x,

y) dx dy.

(4.2.2)

Дифференцирование

g {{Y

— (ß 0

+

ßiX)]2 } по ß 0

и приравнивание

результата нулю дает

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

{ - 2

[У -

 

ß 0

-

ß,X]} = О,

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g {Y}

=

ß 0

+

ßig {X},

 

 

 

 

 

 

 

 

Mr =

ßo +

ßiM-Jc-

 

 

 

(4.2.3)

Подставляя значение ß 0 из уравнения (4.2.3) в соотношение (4.2.2), дифференцируя по ßj и приравнивая результат нулю, получаем

д% {[(y - u . yj - ßj (Х - (х^)р}

g {(Y - ѵу) (X -

ііх)} = ß t g {(X -

^ ) 2 }

или

 

 

ßi =

^ F -

(4-2.4)

Определив значение ßj, можно вычислить из уравнения (4.2.3)

и ß0 -

Теперь допустим, что плотность распределения вероятности р (х, у) неизвестна. Взамен предполагается получить некоторые экс­ периментальные данные и на их основе найти наилучшие оценки параметров некоторой линейной модели. Трудность получения оце­ нок параметров и сложность вычислений существенно зависят от

236

Глава 4

того, является ли случайной величиной лишь одна зависимая переменная или обе переменные, как зависимая, так и независимая. Последний случай, изображенный на фиг. 4.2.16, будет обсуждать­ ся в разд. 4.5.

Ф и г . 4.2.1а.

Изображение

линей­

ной модели,

когда

случайной ве­

личиной я в л я е т с я

одна

зависи­

мая

переменная .

 

х- — значения,

выбранные

экспери­

ментатором;

— геометрическое

место точек математических ожиданий переменной Y а именно т|^ = ß0 + + ß, (xt x).

Сначала рассмотрим более простую ситуацию, когда лишь зависимая переменная является случайной величиной, как пока­ зано на фиг. 4.2.1а. В частности, пусть модель имеет вид

УІ = ßo + ßi (ХІ - x) + ги

(4.2.5)

где У, выборочное среднее по серии повторных измерений зави­ симой переменной Y при заданном значении x, х{; е, — ненаблю-

Р(х,у) I

Ф n г. 4.2.16. Изображение линейной модели, когда обе переменные я в л я ю т с я случайными величинами.

даемая (скрытая) случайная ошибка, представляющая собой раз­

ность 8г - = YI

% {Yi I ж}, имеющую

известное распределение

(обычно нормальное) с математическим

ожиданием, равным нулю,

и дисперсией

аЕ2.. Кроме того, предполагается, что при измере-

Линейные

модели с одной

переменной

237

ниях, используемых для

вычисления Yu

ненаблюдаемые

ошибки

не зависят от х и е, т. е.

от предшествующих ошибок.

Сначала

предположим, что о|. — постоянная, не зависящая от х (разд. 4.3),

а затем (разд. 4.4) рассмотрим случай, когда

о|. изменяется с из­

менением x. Другой способ описания той же самой модели

связан

с предположением, что

 

 

 

 

 

 

 

 

 

 

 

g

(У,

I x,)

=

т), = ß 0

+

ßi

(xt

- x),

 

(4.2/

)

т. е. что математическое

ожидание Yt

при заданном xt

равно ß 0

+

4-

ß4 (xt

— x).

 

 

 

 

 

 

 

 

 

 

-

 

Итак, в основе процедуры оценивания параметров лежат четыре

главных

предположения:

 

 

 

 

 

 

 

 

 

 

1. Математическое ожидание величины Yt

при заданном

зна­

чении Х і

является линейной

(по параметрам)

функцией.

 

 

 

2. Значения х,

выбранные для проведения эксперимента, не яв­

ляются

случайными

величинами.

 

 

 

 

 

 

 

\

3. Дисперсия

al.

величины гг равна

дисперсии а\

величины

 

 

1

 

 

 

 

 

 

х1).

і

 

 

и может быть постоянной или зависеть от

 

 

 

 

4. Различные

измерения

величины

Y

взаимно

независимы,

или, что то же самое, статистически независимы ошибки е,- 2 ) . Метод наименьших квадратов, основанный только на этих

предположениях,

дает несмещенные оценки

Ь0 и bt

3 ) параметров

ßo и ß l t причем,

согласно теореме Маркова,

такие

оценки имеют

наименьшие дисперсии по сравнению со всеми возможными несме­

щенными линейными оценками. Методом

наименьших

квадратов

называется процедура получения оценок Ь0

и Ьи основанная на ми­

нимизации суммы квадратов отклонений

наблюдаемых

значений

п

 

Yj от их математических ожиданий r\t, т. е. 2

{Yi—чг)2-

г=1

 

В некотором смысле метод наименьших квадратов

представляет

собой просто некоторый способ решения переопределенной систе-

*)

Дисперсия

выборочного

среднего

ai?

связана с дисперсией

единич-

ного

наблюдения

а у

соотношением

 

і

 

 

 

 

 

 

 

 

 

 

где РІ

— число повторных измерений зависимой переменной.— Прим.

ред.

2 ) Здесь достаточно сделать более слабое предполоя^ение о некоррели ­

рованности

величин

У; или et.

Если наблюдения

подчинены нормальному

з а к о н у распределения, то из некоррелированности

вытекает

т а к ж е и

неза­

висимость.— Прим-

 

ред.

 

 

 

 

 

 

 

3 )

Х о т я оценки параметров

ß 0 и ß l t

ß 0

= Ъ0 и

ß, = bt

сами

я в л я ю т с я

случайными

величинами,

для их

обозначения

принято использовать

строчные

латинские

буквы .

 

 

 

 

 

 

 

 

 

236

Глава 4

того, является ли случайной величиной лишь одна зависимая переменная или обе переменные, как зависимая, так и независимая. Последний случай, изображенный на фиг. 4.2.16, будет обсуждать­ ся в разд. 4.5.

Ф и г . 4.2.1а.

Изображение

линей­

ной модели,

когда

случайной ве­

личиной я в л я е т с я

одна

зависи­

мая

переменная .

 

— значения,

выбранные

экспери­

ментатором;

 

геометрическое

место точек математических ожидании переменной Y; , а именно ri- = pe

+ ßi (xt — x).

Сначала рассмотрим более простую ситуацию, когда лишь зависимая переменная является случайной величиной, как пока­ зано на фиг. 4.2.1а. В частности, пусть модель имеет вид

Yt = ß 0 + ßi fa - x) + . 8 » ,

(4.2.5)

где Yi — выборочное среднее по серии повторных измерений зави­ симой переменной Y при заданном значении x, xt; ег — ненаблю-

Ф и г. 4.2.16. Изображение линейной модели, когда обе переменные я в л я ю т с я случайными величинами.

даемая (скрытая) случайная ошибка, представляющая собой раз­

ность ег- = YІ

— % {Yі I х}, имеющую

известное распределение

(обычно нормальное) с математическим

ожиданием, равным нулю,

и дисперсией

о Е 2 . Кроме того, предполагается, что при измере-

 

 

Линейные

модели

с одной

переменной

 

 

 

237

ниях,

используемых для вычисления Yt,

ненаблюдаемые

ошибки

не

зависят от х и е, т. е. от предшествующих

ошибок.

Сначала

предположим, что а|. постоянная,

не зависящая от х (разд. 4.3),

а

затем (разд. 4.4) рассмотрим случай,

когда а|. изменяется с из­

менением x. Другой способ

описания той же самой модели

связан

с предположением, что

 

 

 

 

 

 

 

 

 

 

 

 

 

% {У,

I xt)

=

Г)І = ß 0

+

ß,

(xt -

x),

 

 

(4.2.' )

т. е. что математическое ожидание Yt

при заданном xt

равно ß 0 +

- f

ßi

(я* — x).

 

 

 

 

 

 

 

 

 

 

 

—\

 

Итак, в основе процедуры оценивания параметров лежат четыре |

главных предположения:

 

 

 

 

 

 

 

 

 

 

 

 

1. Математическое ожидание величины У, при

заданном

зна­

чении

ХІ является линейной (по параметрам)

функцией.

 

 

 

2.

Значения х, выбранные для проведения эксперимента, не яв­

ляются случайными

величинами.

 

 

 

 

 

 

 

 

 

3.

Дисперсия а%. величины

ег равна

дисперсии

а% величины

YІ

 

1

 

 

 

 

 

 

 

х1).

 

і

 

 

и может быть постоянной или зависеть от

 

 

 

 

 

4. Различные измерения величины У взаимно

независимы,

или,

что то же самое, статистически независимы

ошибки

е, 2 ) .

 

Метод наименьших квадратов, основанный только на этих

предположениях, дает несмещенные оценки Ь0 и 64

3 )

параметров

ßo

и ß 4 , причем, согласно

теореме Маркова, такие

оценки

имеют

наименьшие дисперсии по сравнению со всеми возможными несме­

щенными линейными оценками. Методом

наименьших

квадратов

называется процедура получения оценок Ъ0

и Ьи основанная на ми­

нимизации

суммы квадратов отклонений

наблюдаемых

значений

 

 

п

 

 

Yt от их

математических ожиданий т]г , т. е. 2 Wi

— ЛІ)2 -

 

 

і=1

 

 

В некотором смысле метод наименьших квадратов

представляет

собой просто некоторый способ решения

переопределенной

систе-

1 ) Дисперсия выборочного среднего Oy

связана с дисперсией

 

единич­

ного

наблюдения Oy

 

соотношением

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о Y •

 

 

 

 

 

 

 

 

 

 

 

 

0 2 -

= — —

,

 

 

 

 

 

 

 

 

 

 

 

 

Yi

 

Pi

 

 

 

 

 

 

 

 

г Де РІ

— число повторных измерений

зависимой переменной.— Прим.

ред.

2 ) Здесь достаточно сделать более слабое предположение о некоррели ­

рованности

величин

Yt

или е;. Если

наблюдения

подчинены нормальному

з а к о н у распределения, то из некоррелированности

вытекает

т а к ж е

и

неза­

висимость.— Прим.

ред.

 

 

 

 

 

 

 

 

 

 

 

3 )

Х о т я

оценки

параметров

ß 0

и

ß t ,

ß 0

=

b0 и

ß t = Ъі

сами

я в л я ю т с я

случайными

величинами,

для их

обозначения

принято использовать

строчные

латинские буквы .

238

 

Глава

4

 

мы уравнений в пространстве параметров

ß 0 и ß t , если считать,

что каждая пара данных образует уравнение. Например,

16,08

-

ß 0

+

l,80ßi =

0,

16,32 -

ß 0

+

2,100! =

0,

16,77

-

ß 0

+

2,40ßj =

0.

Разность между суммой

квадратов левых

частей этих уравнений

и нулем минимизируется, чтобы получить наилучшие оценки для

ßo,

ßi H l .

 

 

 

 

На фиг. 4.2.2

представлены

оценка

линии регрессии, задавае­

мая

уравнением

Y = bQ + bt

(x — x),

истинная модель п =

= ßo + ßi [x — x), & также некоторые величины, введенные ранее.

Одно измерение

 

 

x

er

 

 

 

 

Ф и г .

4.2.2. Соотношения между

экспериментальными

данными,

средними

 

значениями и теоретической

линейной моделью и ее оценкой.

Ytj

обозначает одно /-е,

1 ^

j^CPi,

измерение или наблюдение

зависимой переменной Y при x = xt;

У,- представляет собой выбо­

рочное

среднее по измерениям

при x = xt,

1 ^

і ^ п.

 

Чтобы оценить доверительную

область

для переменных ß 0

и ß 4 и применить статистические критерии,

необходимо

принять

пятое

предположение:

 

 

 

 

 

 

5. Условное распределение вероятности Yt при заданном зна­ чении xt нормально относительно математического ожидания г|г =

= t{Yi \xt).

Практически экспериментальные данные могут не удовлетво­ рять этим пяти требованиям. Отклонения от этих предположений

Линейные модели с одной переменной 239

обычно состоят в следующем:

1. Интервал изменений независимой переменной х слишком мал, так что изменение зависимой переменной по порядку величи­ ны равно ошибке при ее измерении. В качестве крайнего примера укажем, что стократное повторение измерений при одном и том же значении х дает для получения оценки не 100 различных значений, а лишь одно значение У,. Так как число экспериментальных точек должно быть по крайней мере равно числу параметров модели, чтобы можно было произвести их оценивание, изменение незави­ симой переменной в небольшом интервале представляет собой неэффективный эксперимент. Для модели с несколькими незави-, симыми переменными исследователь обнаружит, что, если некото-J рые важные независимые переменные процесса поддерживать при­ близительно постоянными, регрессионный анализ приведет к заключению, что они являются несущественными переменными.

Более того, независимые

переменные,

которые не регулируются,

а просто присутствуют,

по-видимому,

должны вести себя как

случайные величины. Суть экспериментирования состоит в том, чтобы определенным образом менять, насколько это возможно, экспериментальные условия (независимые переменные) и тем самым позволить зависимой переменной быть случайной величиной.

2. Ошибки при измерениях зависимой переменной не являются независимыми. Измерения характеристик процесса могут содер­ жать сериальную корреляцию ошибок, которая, возможно, меняет­ ся с течением времени. Так как любой производственный процесс подвержен влиянию независимых переменных, недоступных кон­ тролю со стороны экспериментатора, таких, как износ установки, образование накипи в теплообменнике, изменения в составе сырья, разные метеорологические условия, перемены персонала и т. п., то четыре вышеупомянутых предположения могут оказаться нереальными. Иногда неконтролируемые переменные такого типа называют скрытыми переменными.

Итак, вся совокупность разрозненных экспериментальных дан­ ных о некотором процессе должна быть тщательно проанализиро­ вана. Наилучшая методика эксперимента должна предусматри­ вать возможность преднамеренных изменений всех контролируе­ мых переменных, как описано в гл. 8. Исследователь, прежде чем применять для оценивания метод наименьших квадратов, должен быть по возможности уверен в том, что имеет всю доступную ин­

формацию об используемом интервале изменений х

по

сравнению

с полным интервалом изменений, о величине

ошибок в

зависимых

и независимых

переменных, о роли возможных посторонних фак­

торов.

Более

общая методика

получения

оценок

описывается

в разд. 4.5, 4.6

и 5.4. Вопросы правильного

планирования экспе­

римента

впервые обсуждаются

в- гл. 8.

 

 

 

Соседние файлы в папке книги из ГПНТБ