Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
21
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

 

 

 

 

 

 

 

 

 

 

99,73%

/

/

 

l

u

i

1

I

 

1

1

1

 

 

 

 

1

 

\

 

1

 

 

 

l

1 i

t

1

/

<

 

 

 

 

 

 

 

 

 

/

1

 

 

 

 

 

 

 

 

 

/

1

 

 

 

\

1

 

I

 

\

/

J

 

 

 

1

 

1

 

\

 

 

 

 

 

 

 

\

 

\

 

 

 

 

 

>.

1

 

1

 

\

/

/

 

 

 

\

1

 

1

 

\

 

 

 

\

1

 

1

 

1

/

/

 

 

 

 

 

 

 

 

\

1

 

I

 

\

.

1

 

 

 

 

 

;

1

 

 

 

 

Y

 

'

 

'

;

1

 

 

 

 

 

 

 

 

 

/

1

'

\

 

 

l

\

1

 

1

1

1

 

 

 

 

 

 

 

1

X

\ l

 

\

 

 

 

 

 

 

I

1

 

*

/J . /

I

/1

1

1

i / ,

o,

A

^ — i - = s — . J

 

 

 

 

 

 

^

- i

M x - 3<гх

д х - 2ffx

м х - ax

цх

ßx+

crx ßx+2<rx

ßx + 3<r.

Ф и г . 2.3.4. Сравнение нормальных распределений вероятности для нор ­ мированной случайной величины U и случайной величины X. Проценты характеризуют величину площади под к р и в о й в пределах, у к а з а н н ы х на оси х.

-3

-2

- 1

0

1 2

/формированная нормальная переменная к

Ф и г . 2.3.5. Нормальное

(гауссово)

распределение накопленной вероят ­

 

 

ности.

 

Распределения вероятности и выборочная статистика 63

а в других справочниках используется

 

 

 

 

и

 

 

 

 

 

G(u) = -%=-

[ e~t2dt.

(2.3.56)

 

 

 

У л

J

 

 

Полезное

соотношение

 

 

 

 

 

 

 

и

 

 

 

Р(и)=

(

-4=^e-<2dt

= 4r+ [ -4=e~t2dt

 

(2.3.6)

 

V '

J

У

2 ^ J - | / 2 я

v

'

 

 

- о о

V

0

 

 

нетрудно

получить,

учитывая симметрию графика

фиг.

2.3.5.

Пример 2.3.2. Среднее значение и дисперсия нормированной величины, распределенной по нормальному закону

Покажем, что среднее значение U равно 0, а дисперсия U равна 1.

Решение

оо оо

Ш{Щ= j

up(u)du^—±==

j

ue-^ßdu.

(a)

— оо

 

 

 

— оо

 

 

Пусть и2І2 = t. Тогда

и du

=

dt; t =

оо

при и

=

—оо. Следова­

тельно,

 

 

 

 

 

 

 

 

 

О

 

оо

 

 

 

g{J7} = -jL-[

j

e-*dt+

je-*d*] =

0.

(б)

^

 

оо

 

О

 

 

 

Такой же результат можно получить, замечая, что u — нечетная функция, а е~и2'2 — четная, так что интегрирование их произве­ дения в симметричных пределах дает нуль.

оо

V a r { £ / } = j

(и — 0)2p(u)du=

 

 

 

 

(в)

— оо

 

 

 

 

 

 

 

 

оо

 

 

ОО •

 

 

= -4=

Ç u2 e-"2 /2 d u =

_ 2

Г и ? е - « » / 2 da =

 

 

У

J

 

У 2 п

J

 

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

^ •

[ ^ ' А .

(г)

 

 

 

 

 

 

о

 

Так как

гамма-функция,

по

определению,

равна

 

 

 

1 (и) = j

*«-ie-« <ft

 

 

 

о

64

Глава 2

r ( 4 - ) = J £ ,

интеграл в соотношении (г) равен

так что

Если получено достаточно много экспериментальных данных, то, прежде чем предполагать, что они описываются нормальным распределением вероятности, желательно: 1) исследовать распреде­ ление их относительных частот, используя критерии согласия, как описано в разд. 3.7.7, 2) построить график накопленной суммы частот на нормальной вероятностной бумаге которая линеари­ зует график Р (х) благодаря использованию специальной шкалы, или 3) провести какие-либо другие проверки, описанные в гл. 3. Во многих случаях экспериментальные данные хорошо описывают­ ся нормальным распределением вероятности, однако часто это распределение удобно использовать для непрерывных случайных величин, не распределенных по нормальному закону, поскольку

1. Величину можно преобразовать таким образом, чтобы пре­

образованная

величина

имела нормальное распределение.

2. Распределение суммы

случайных величин, распределенных

не по нормальному закону, приближается к нормальному

распре­

делению при стремлении

к

бесконечности

объема

выборки.

3. Ошибка,

связанная

с

применением

статистических

крите­

риев, основанных на предположении о нормальном

распределении

экспериментальных данных, которые в действительности описы­ ваются другим симметричным распределением, оказывается малой.

Пример 2.3.3. Графическая проверка нормальности распределения экспериментальных данных2 )

В табл. П.2.3.3 приведены диаметры 200 частиц, задержан­ ных фильтром нефтепровода. Количество частиц, попавших в выбранные интервалы диаметров, определяет частоту появления частиц в каждом интервале. Группировка данных сглаживает случайные колебания, свойственные небольшому количеству дан-

х ) 'Применение специальным образом разграфленной бумаги, линеари ­

зующей

графики

нормального

и д р у г и х

распределений, рассматривается

в книге

[3] и

статье [4].

 

 

2 ) Данные

и

графики этого

примера

взяты из работы [5].

Распределения

вероятности

и выборочная

статистика

65

 

 

 

 

 

 

 

Таблица

Л.2.3.3

Распределение

200 частиц, задержанных фильтром

нефтепровода,

 

 

 

по их

размерам

 

 

 

 

Диаметр, мкм

Частота

Накоп­

Скачки

Среднее

m

Проценты

появления

ленная

значение

п + 1

 

частота

 

скачка m

 

Меньше Ѳ,30

 

2

2

1 - 2

 

1,5

1,5/200

0,75

0,31—0,40

 

33

35

3 - 3 5

 

19

19/200

9,50

0,41 - 0,5 0

 

67

102

36—102

 

69

69/200

34,50

0,51—1,00

 

5

107

103—107

 

105

105/200

52,50

1,01-2,00

 

63

170

108—170

 

139

139/200

69,50

2,01—4,00

 

5

175

171—175

 

173

173/200

86,50

4,01 - 6,0 0

 

11

186

176-186

 

181

181/200

90,50

6,01—8,01

 

1

187

187 •

 

187

187/200

93,50

8,01—10,00

 

11

198

188-198

 

193

193/200

96,50

10,01—20,00

 

1

199

199

 

199

199/200

99,50

ных, сохраняя основные, характерные черты собранного экспери­ ментального материала в целом. Выбор числа и величины интер­ валов группировки не должен приводить к большой потере информации о процессе. Обычно делают так, чтобы получилось от 10 до 20 одинаковых интервалов. В данном примере экспери­ ментальные данные группировались по интервалам разного раз­ мера (как это часто бывает на практике), что было связано со способом отбора частиц по размерам. Желательно получить некоторое представление о распределении частиц по размерам.

Д л я построения по экспериментальным данным графика преж­ де всего следует расположить интервалы группировки в порядке возрастания значений случайной величины X, как это сделано в первом столбце таблицы. Дл я каждого интервала указывается

частота появления и вычисляется накопленная

частота. Каждому

наблюдаемому

значению

х приписывается

скачок,

или ранг,

минимальное значение которого

равно 1. Если частота

появления

некоторого значения х больше 1, то каждому

значению

приписы­

вается определенный ранг

(т. е. трем наблюдениям приписывается

три последовательных скачка). Дл я каждого

значения

х вычис­

ляется среднее

значение

ранга

по формуле г )

 

 

 

 

 

"V

рангов

 

 

 

 

то =

— = -

^

.

 

 

 

 

 

наблюдаемая

частота п о я в л е н и я

 

 

г ) К а к видно

из табл. П . 2 . 3 . 3, среднее значение ранга равно

полусумме

его г р а н и ц . — Прим.

ред.

 

 

 

 

 

66

 

Глава

2

 

По

оси ординат

при построении

графика откладывается

величинах )

 

 

 

 

Р = —^—г

(п — полный объем выборки),

которая

представляет

собой зависимую

переменную.

Так

как график накопленной

вероятности определяет вероят­

ность того, что переменная «равна или меньше, чем», то значение зависимой переменной следует откладывать над верхней границей каждого интервала. График, построенный по данным табл. П . 2 . 3 . 3 , дает сильно асимметричное распределение, на что указывает большая кривизна кривой на фиг. П . 2 . 3 . 3а . Эта кривая, а также физические соображения, что все измеряемые диаметры должны быть положительными и достигать н у л я (размеры частиц не могут быть отрицательными), наводят на мысль построить график

на

логарифмически-нормальной

бумаге, что и сделано

на фиг.

П . 2 . 3 . 36 .

 

 

 

График на фиг. П . 2 . 3 . 36 при

значениях диаметра,

больших

0,5

мкм, представляет собой практически прямую линию, в точке

0,5

мкм он претерпевает внезапный излом и затем резко

спадает

до

нуля . Обычно это указывает

на существование каких-либо

физических причин, запрещающих значения ниже (или выше) определенного уровня . В данном случае такая интерпретация не представляется разумной, поскольку техническими причинами нельзя объяснить отсутствие частиц с диаметром меньше 0,3 мкм.

В дальнейшем выяснилось, что это было связано с пределом разрешающей способности микроскопа, использовавшегося при измерениях. Дополнительные исследования показали, что около

5% проверяемых частиц имели диаметр меньше 0

,1

мкм,

что

можно было

предсказать,

продолжая

сплошную

 

линию

на

фиг. П . 2 . 3 . 36

вплоть до 0,1

мкм. Можно

ожидать,

что частиц

с диаметром больше 50 мкм будет очень

мало (менее

одной

на

тысячу).

 

 

 

 

 

 

Многомерная плотность нормального распределения вероят­ ности (2.3.7) является простым обобщением одномерной плотности

распределения. Д л я компактности запишем ее в матричной форме (приложение Б) 2 )

 

 

р (х )

=

ке-ч^,

(2.3.7)

где положительное

число

 

 

 

 

,

(det f - i ) 1

/ 2

_

1

Согласно

работе

[6].

 

 

 

2 ) Оставшуюся часть разд . 2.3.1, если это необходимо, можно изучать

вместе с гл . 5.

где даны матричные

обозначения .

99,9

О

5

Ю

15

20

 

Диаметр

частиц,

мкм

 

Ф и г . П . 2 . 3 . 36 . График данных табл .

П . 2 . 3 . 3 о размерах частиц на л о г а ­

рифмически - нормальной

вероятностной бумаге .

68

Глава 2

определяемое из условия

называется нормировочным множителем, а

 

Gin

f = Соѵ {Хг Х,} =

— матрица размерности п х п,

l _ Ö n l

. . . Опп J

I f I — детерминант матрицы f.

Величины [X; и Оц — некоторые постоянные, \it является средним значением соответствующей переменной Xt, a сг^- — дисперсия или ковариация величин (Xt, Xj). (Заметим, что tfu =

Пример 2.3.4. Двумерная плотность нормального распределения

Запишем формулу для двумерной плотности нормального рас­ пределения вероятности, полагая в выражении (2.3.7) п = 2. Это распределение применяется при рассмотрении турбулентных полей скоростей, картографировании и плановых съемках, а также при построении эмпирических моделей.

(x — n f =

[(xi — ц 4 ) , (x2

| i 2 ) l i

 

* '—Г о н

cr1 2 " »

 

 

_°*21

G 22.

 

det î = I f Icriiez —a1 2 o-2 i = cr*o\— o2i2

(так как a 1 2 = a2 1 ),

p o2 2

— o"ia -î

 

 

d e t f

d e t f

 

 

Q=[(Xl V-l), (^2-^-1*2)1

z z £ s l

_ £ L

J

l > 2 — И г )

L

| f |

|f|

 

(Ді Hi) 2

°1 2 (жі — |ii) (ж2 — (i2 ) ai2 + (s2 Иг)2 в?

Распределения вероятности и выборочная статистика 69

Теперь пусть

так что

Р = Рі2

=

O-jO-jj

'

 

 

 

СХ12 =

0х02р,

 

 

 

 

 

 

 

 

а\а\ -

of2

-

ojajps

а\ (1 _ рЯ) '

 

 

 

ff^Kl-p2)

 

ffi<r2(l-pa)

'

 

 

 

о?

 

1

 

 

 

Тогда

I f I

° i ( l - P 2

) '

 

 

 

 

 

 

 

 

 

Ѵ~^—) ~2 р

1~5Г~) І -

^ - ) +

\ - 0

— )

 

 

 

1—р2

 

 

 

где

 

 

 

 

 

 

 

 

 

 

і = 1,

2.

 

 

Существуют таблицы

двумерного

нормального

распределе­

ния [7].

 

 

 

когда величины Хі

и Х2 стати­

Д л я важного частного случая,

стически независимы,

р =

0 и

 

 

 

 

 

 

 

2.3.2. Распределение

%2

Распределение %2 находит широкое теоретическое и практиче­

ское

применение;

некоторые

примеры

его применения будут

описаны в гл. 3

*), а

именно:

 

1)

проверка согласия экспериментальных наблюдений с пред­

полагаемыми распределениями

вероятности;

2)

получение доверительных интервалов для дисперсии и сред­

него

квадратического

отклонения;

 

3)проверка независимости переменных;

4)получение выборочного распределения для среднего квадра­

тического отклонения,

ковариации, относительного

отклонения

и т. д.

 

 

Пусть Хи Х2, . . ., Хѵ

— набор ѵ случайных величин, распре­

деленных по нормальному закону с соответствующими

параметра-

*) Методы использования ^ - р а с п р е д е л е н и я хорошо изложены в книге [8] .

70

 

 

Глава

2

 

 

ми {ці, оф, (u.2 , оф, .

. ., ([il,

al).

Если вычислить

квадраты норми­

рованных нормальных

величин

Ut

 

 

 

 

= (

^ ~ ^ ) \

 

(2.3.8)

а затем их сумму,

то

получится

новая

случайная величина х 2

(хи-квадрат):

 

 

 

 

 

 

 

 

 

 

 

 

V

V

 

 

 

 

 

і = 1

і = 1

1

Параметр ѵ в этом выражении называется числом степеней свободы величины %2. Распределение %2 зависит лишь от ѵ, так как величины Ut нормированы. Если имеется ѵ независимых

0,20

 

 

 

 

 

 

 

 

 

0,75

 

 

 

 

 

 

 

 

 

і< 010

I l

\

Ѵ= 8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,05

-

\

/\

 

 

 

 

 

 

О

 

 

 

 

\ 1

!

1

> ^ . ...

О

5

10

15

20

25

50

55

АО

Ф и г .

2.3.6. Плотность

распределения

вероятности

%2 .

наблюдений, то число степеней

свободы равно

ѵ; однако каждое

соотношение, связывающее ѵ наблюдений, уменьшает число сте­ пеней свободы на единицу.

Можно показать, что плотность

распределения

вероятности

 

для

X2

равна

 

 

 

 

 

 

 

 

 

 

 

 

 

Р (X1)

= 2 ѵ / 2 г ( ѵ / 2 ) ( х 2

) ( ѵ / 2 ) - Ѵ ^ 2

>

(0 <

X2

< оо);

(2.3.10)

график

этой

величины приведен на фиг. 2.3.6.

 

 

 

 

 

 

Представляют интерес некоторые

частные

случаи

распреде­

ления

х 2 ; 1) распределение

квадратного

корня

из

х 2

Д л я

ѵ =

2,

называемое

распределением

Рэлея,

2)

распределение

х 2

Д л я

V =

4 — распределение Максвелла

для

скоростей

молекул

и

3)

распределение величины 1^2x2 для ѵ >

30, которая

распределена

Распределения вероятности и выборочная статистика 71

приблизительно по нормальному закону с ц = ]^2ѵ — 1 и а 2 = 1.

Среднее значение у? равно

числу степеней свободы

£ { х 2 } = £ { 2 т)=

2

%{(Ui-0)*}

= i + i + . . . = v ,

і=1

i=l

 

 

так как дисперсия Ut равна 1, т. е. % {(Ü7* — О)2} = 1. Непо­ средственным интегрированием можно показать, что

Ѵаг 2} = 2ѵ.

Распределение накопленной вероятности %2 равно

*

ill)

-

Р { Х 2

< Х 2 } - 2 Ѵ / 2 і ! ( ѵ / 2 ) |

( f ) 2

" 1 е-*У* d {t).

(2.3.11)

Существуют

таблицы

как

для

Р

 

так

и

для

Р (х^/ѵ)

и Р { х 2 >

X*};

небольшая

часть

табл. В2 приложения

В

при­

ведена

здесь

в

виде

табл. 2.3.3. Числа в этой

таблице

представ-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица

2.3.3

 

 

 

 

 

 

Р а с п р е д е л е н ие 7 2

 

 

 

 

 

 

 

Число

 

Вероятность того, что значение х 2

меньше, чем указанное в таблице,

 

 

 

 

 

 

 

 

Р {X2

=S Х|}

 

 

 

 

 

 

 

степеней

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свободы

 

0,01

0,05

 

 

0,9

 

 

 

 

 

 

 

0,999

V

 

 

0,5

 

 

0,95

 

0,99

 

1

 

1,57-10-4

0,00395

0,455

2,706

 

3,841

 

6,635

 

10,827

10

 

2,558

 

3,940

9,342

15,987

18,307

 

23,209

 

29,588

ляют собой

верхний

предел

интеграла

в

формуле

(2.3.11)

для

V степеней

свободы.

Например,

для

Р {%2 ^

 

%*} =

0,95

или

Р {%2 >

%1) = 0,05

значения

%* равны

3,841

и

18,307

соответ­

ственно

для

ѵ = 1

и

V =

10

степеней

свободы.

 

 

 

 

2.4. В Ы Б О Р О Ч Н Ы Е

С Т А Т И С Т И К И

И

И Х Р А С П Р Е Д Е Л Е Н И Я

Распределение вероятности для переменной процесса обычно

неизвестно, так что соотношения разд. 2.2 нельзя

непосредственно

использовать

для

вычисления

среднего

значения,

 

дисперсии

и других характеристик ансамбля. В

то

же

время

получение

оценки

для

плотности распределения

вероятности

переменной

процесса, хотя и желательно, но оказывается весьма трудной

задачей, поэтому в большинстве случаев приходится

ограничи­

ваться

более простыми оценками среднего значения,

дисперсии

и т. д.

В этой книге будут описаны два основных метода оценива-

Соседние файлы в папке книги из ГПНТБ