Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория инженерного эксперимента

..pdf
Скачиваний:
18
Добавлен:
12.11.2023
Размер:
13.91 Mб
Скачать

объектов (например, линий на растрескавшихся поверх­ ностях, трещин при высыхании грязи на болоте и"т. д.). Какое из этих типичных распределений наиболее близко к распределению марсианских каналов?

Решение. Для вычисления критерия х2 необходимо знать фактические числа, а не проценты, поэтому построим таб­ лицу, содержащую в каждом случае по 158 объектов:

Число трещ ин, дорог или

Трещины

Ж елезные дороги

М арсианские

каналов, образую щ их

в пустыне

в ш тате Огайо

каналы

узлы

Сахара

 

 

1

37

2

13

3

82

17

31

4

31

75

68

5

6

22

27

6

1

14

13

7

0

9

5

8 и более

1

19

1

Всего

158

158

158

Очевидно, не имеет значения, сколько в действитель­ ности было узлов железных дорог или трещин в горных породах. Мы просто рассматриваем эти распределения как типичные, поэтому приведенная выше таблица составлена таким образом, чтобы число трещин и число железных дорог также равнялось 158. Теперь проверим гипотезу: «Распределение узлов марсианских каналов является ко­ нечной аппроксимацией распределения узлов, образу­ емых трещинами». Всего имеется четыре группы данных (так как случаи, когда число трещин, образующих узел, равно 5, 6 , 7 и 8 , необходимо собрать в одну группу, чтобы удовлетворялось требование о минимальном числе объектов, т. е. не меньшем пяти, необходимом для при­ менения критерия х2);

* _

( 1 3 - 3 7 ) *

( 3 1 — 82)2

(68 — 31)g

Л

37

82

31

После того как мы записали в таблицу три числа, чет­ вертое определяется однозначно, так как рассматривается постоянное число марсианских каналов. Таким образом.

имеются три степени свободы и вероятность того, что узлы трещин и узлы каналов имеют одно и то же распре­ деление, настолько мала, что ее не удается определить даже с помощью более обширных таблиц. Эта вероятность значительно меньше 0,1%. Поэтому с определенной уве­ ренностью можно утверждать, что эти распределения не являются одинаковыми.

Рассмотрим теперь другую гипотезу, согласно которой ожидаемое распределение дает сеть железных дорог в штате Огайо. Объединяя данные для узлов одной и трех дорог, имеем шесть членов и, следовательно, пять степе­

ней

свободы:

 

 

 

 

2

( 4 4 — 19)2

(68 — 75)2

 

(27 — 22)2

( 1 3 - 14)»

*

19

75

"1"

22

14

 

 

( 5 - 9 ) »

 

(1 — 19)2

55,2.

 

 

9

 

19

 

 

 

 

Из фиг. 8.1 видно, что распределение узлов марсиан­ ских каналов соответствует распределению узлов желез­ ных дорог в штате Огайо с вероятностью, значительно меньшей 0,001. Таким образом, имеются веские основания утверждать, что распределение марсианских каналов не соответствует ни одному из рассмотренных распределений и что эти группы данных не связаны друг с другом.

Доказали ли мы, что марсианские каналы действитель­ но не созданы искусственным путем? Конечно, нет. Един­ ственное, что мы сделали, это показали, что внешнее сход­ ство между сетью марсианских каналов и сетью железных дорог в штате Огайо (в обоих случаях максимальное число объектов, образующих узел, равно четырем) не существен­ но. Важную роль играет то обстоятельство, что наиболь­ шее число каналов в узле равно одному и трем, а распре­ деление железных дорог является совсем иным. Здесь наи­ большее число дорог, образующих узел, составляет семь, восемь и более. Трудно представить себе, чтобы эти раз­ личия были вызваны ошибками измерений или обманом зрения. По-видимому, мы поступили правильно, отклонив гипотезу о разумной жизни на Марсе, пока не будут по­ лучены более достоверные данные. Процесс исследования не завершается статистическим анализом данных. Стати­

стический анализ позволяет лишь получить общие или частично сформировавшиеся представления и впечатле­ ния, чтобы в дальнейшем сосредоточить на них внимание или полностью от них отказаться.

8.3. Критерий t Стьюдента

Критерий х2 применяется в том случае, когда рассмат­ риваются целые числа. Критерий t Стьюдента1 позволяет использовать проценты, дробные числа и т. п. Этот кри­ терий применяется для проверки гипотез различного рода, но мы рассмотрим гипотезу, которая находит наиболее ши­ рокое применение в инженерной практике: «Средние двух выборок относятся к одной и той же совокупности». Можно привести следующие примеры применения этой гипотезы: « 1 0резисторов из коробки А имеют среднее сопротивление, равное 12,4 ком, а 10 резисторов из коробки В имеют сред­ нее сопротивление 11,9 ком. В обеих коробках находятся резисторы с одинаковым номинальным сопротивлением». «Измерение расхода горючего на трассе протяженностью 1 0 0 км, производимое через каждый километр пути, по­ казало, что автомобиль Л потребляет в среднем 0 , 1 2 л/км,2 а автомобиль В — 0,128 л/км. Имеется ли различие в рас­ ходе горючего между автомобилями А и В?»

Когда проверяется различие между двумя средними,

формула для критерия t имеет вид

 

 

 

t = ----- ~а- = ? ь-

,

(8.3)

 

5сум 1/ла + 1 f a b

 

где Ха— среднее^для выборки Л,

равное (Xfll+X f l 2 +...

... + Хап)/па;

Х ь — среднее для выборки

В, равное

(Хы + Х Ь2 +

+ X bn)/nb; па — объем выборки Л; пр­

обьем выборки В; scyM— известное среднее квадратическое

1 С ть ю ден т — псевдоним

Г о с с е т а — хим ика,

р аботавш его

в одной из

пивоваренны х фирм В еликобритании,

который не

мог

печататься

п од собственны м

именем. Он почти

сам остоя тел ьн о

р а з­

работал статистику малых вы борок. П оск ольк у

в соврем енной

тех ­

нике чащ е

всего

исследую тся

небольш ие вы борки (м енее

30 эл ем ен ­

тов), то работы

С тью дента имеют бол ьш ое практическое

зн ач ен и е

Ф и г . 8.2. График, показывающий соотношение между значением критерия t и числом степеней свободы (пг + п2 — 2) для различных значений вероятности Р получения данного (или большего) значе* ния t, если обе группы данных относятся к одной и той же совокуп­

ности.

Числа у стрелок, изображенных пунктиром, обозначают асимптотические значения t (при бесконечном числе степеней свободы).

отклонение для обеих выборок, рассматриваемых совмест­ но, полученное по формуле

_ (

+ Щ

(8-4)

5сУм \ п а + пь— 21

 

которую можно сравнить с формулой (2.16).

Для данной гипотезы число степеней свободы равно (па 4- пь — 2). Зная число степеней свободы и /, с по­ мощью графика, изображенного на фиг. 8.2, находим вероятность появления данного (или большего) значения /, если оба эти средние значения относятся к одной и той же совокупности. Другими словами, вероятность, рав­ ная 0,05, означает, что полученное (или большее) значе­ ние / может появиться случайным образом лишь в одном случае из 20, если эти две выборки относятся к одной и той же генеральной совокупности. Вероятность 0,01 озна­ чает, что данное событие может появиться лишь в одном случае из 100. Для этих уровней значимости справедли­ во все сказанное при рассмотрении критерия х2Вероят­ ность 0,05 еще дает основания сомневаться в справедли­ вости гипотезы, а вероятность 0,01 убедительно показы­ вает, что эти две выборки действительно относятся к раз­ личным совокупностям. Вероятность 0,001 и меньше дает почти полную гарантию того, что сформулированная гипо­ теза не справедлива.

Пример 8.2. Из партии бетона, замешанной 25 мая, взяты восемь проб и подвергнуты испытаниям на сжатие. Получены следующие данные о прочности на сжатие: 305,6; 270,8; 298,0; 218,6; 273,3; 270,8; 229,4 и 265,8*кГ/см2. Из партии бетона, замешанной 4 июня, взя­ то 17'проб и после испытаний получены следующие ре­

зультаты: 298,0;

263,4;

288,2;

300,7;

327,9;

303,1;

278,2;

296,0; 316,3; 290,7; 318,0; 270,8; 305,6; 320,5; 293,2;

285,5;

316,3 кГ/смг. Насколько известно, состав бетона и методи­ ка испытаний не менялись. Определите, относятся ли эти две группы данных к одной и той же совокупности?

Решение. В этом случае применим критерий / . Д л я

первой выборки Хп =266,7 кГ/см*, а для второй Х} = = 298,1 кГ/см2. Составим таблицу результатов и по фор­ муле (8.4) вычислим среднее квадратическое отклонение для обеих выборок.

По формуле (8.4) находим ‘

s = ( 6 2 7 |r a - ^ 5 2 )V* SBB(45>97 )i/t= 7fo7 « î7,1 кГ/см\

Это среднее квадратическое отклонение для двух выборок, рассматриваемых совместно. Заметим, что для майского

Х т , кГ /с м 2

 

X j , к Г /с м 2

 

 

 

 

<x r x / ) 2 “ * /

305,6

1513,21

298,0

0,16

270,8

16,81

263,4

1225,00

298,0

979,69

288,2

104,04

218,6

2313,61

300,7

5,29

273,3

43,56

327,9

870,25

270,8

16,81

303,1

20,25

229,4

1391,29

278,2

408,04

265,8

0,81

296,0

5,76

 

 

316,3

320,41

 

6275,79=2xJ,

290,7

52,29

 

318,0

384,16

 

 

 

 

270,8

761,76

 

 

305,6

51,84

 

 

320,5*

488,41

 

 

293,2

27,04

 

 

285,5

166,41

 

 

316,3

320,41

5218,52=2

замеса характерен значительно больший разброс данных, чем для июньского. Находим t по формуле (8.3):

298,4 — 266,7 _

31,7 _ )п -

7,07 / 1 / 8 + 1/17

3,03

Число степеней свободы равно

(пт + п} — 2) = 23 . Те­

перь с помощью графика, изображенного на фиг. 8.2, определяем, что при данном значении t вероятность того, что обе эти выборки относятся к одной и той же совокуп­ ности, ничтожно мала. Таким образом, справедливость гипотезы, согласно которой обе партии бетона и методика исследований одинаковы, весьма сомнительна1.

1 Данные заимствованы из работы [4]. Эти две группы данных составляют часть результатов испытаний, проводившихся ежеднев­ но и рассматриваемых как единая генеральная совокупность. Одна­ ко данные, полученные в эти два дня, показывают, что контроль за качеством бетона был неудовлетворительным.

8.4. Дисперсионный анализ

Критерий t позволяет сравнивать'два средних значе­ ния. В некоторых случаях бывает более важно сравнить изменчивость, или «размах», двух или большего числа выборок данных. Например, можно вычислить дисперсию (т. е. квадрат среднего квадратического отклонения) для двух выборок проб бетона, рассмотренных в примере 8 .2 , не обращаясь к формуле (2.16). Для майского замеса по­ лучаем 6275,79/7 = 896,54, а для июньского 5218,52/16 = = 326,16. Существует ли менаду этими дисперсиями зна­ чимое различие? Ответ на этот вопрос может дать приме­ нение так называемого критерия F (обозначенного так по первой букве фамилии английского математика Фишера). Критерий F — это отношение двух дисперсий, вычислен­ ных или полученных различными способами. В рассма­ триваемом примере отношение дисперсии для первой пар­ тии к дисперсии для второй [партии составляет 896,54/326,16 = 2,75.

Вероятности получения любого данного значения F, если в действительности две дисперсии не являются раз­ личными, представлены в виде таблиц как функции числа степеней свободы для двух выборок данных, на основе которых вычисляется это отношение. В табл. 8.1 приво­ дятся ожидаемые значения критерия F в случае вероят­ ности, равной 5%. Выборка, взятая в мае, содержит во­ семь проб. Если взять семь значений, то восьмое оказы­ вается заданным, так как известно среднее значение; следовательно, для майской выборки число степеней сво­

боды

п равно 7, а для июньской — 16.

Заметим,

что

табл.

8 .

1 составлена при допущении, что ni относится к

выборке

данных, имеющей ббльшую

дисперсию.

Из

табл. 8.1 для пг = 7 и щ = 1 6 находим, что при F = 2,6 эти выборки принадлежат одной и той же совокупности с вероятностью 0,05. Поскольку полученное отношение дисперсий еще больше, имеются основания сомневаться в том, что эти две дисперсии соответствуют одной и той же совокупности. Отсюда делаем вывод, что прочность бетона не только колеблется в течение суток, но и средние суточные значения также изменяются.

17-168

Т абли ца 8 .1

Значения критерия F ’) при Р=0,05

п2

1

2

3

4

5

6

12

24

ОО

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

164

200

216

225

230

234»

235

249

254

2

18,5

19,2

19,2

19,3

19,3

19,3

19,4

19,5

19,5

3

10,1

9,6

9,3

9,1

9,0

8,9

8.7

8,6

8.5

4

7,7

6,9

6,6

6,4

6,3

6,2

5.9

5,8

5,6

5

6,6

5,8

5,4

5,2

5,1

5,0

4,7

4,5

4,4

6

6,0

5,1

4.8

4,5

4,4

4,3

4,0

3,8

3.7

8

5,3

4,5

4,1

3,8

3,7

3,6

3,3

3,1

2,9

10

5,0

4,1

3,7

3,5

3,3

3,2

2,9

2,7

2,5

12

4,8

3,9

3,5

3,3

3,1

3,0

2,7

2,5

2.3

16

4,5

3,6

3,2

з.о

2.9

2.7

2.4

2,2

2,0

20

4,4

3,5

3.1

2,9

2,7

2,6

2.3

2.1

1,8

30

4,2

3,3

2.9

2,7

2,5

2.4

2,1

1.9

1.6

60

4,0

3,2

2.8

2,5

2,4

2,3

1,9

1,7

1.4

0 0

3,8

3,0

2,6

2,4

2,2

2,1

1,8

1.5

1,0

1) f - s j / s j .

Дисперсионный анализ находит важное применение при планировании экспериментов по методу латинского квадрата, что было показано в гл. 6 . При этом учитывается влияние таких факторов, как рабочая смена, станок или рабочий, чтобы определить, оказывают ли они значимое влияние на производительность. При проведении экспе­ риментов могут рассматриваться антидетонирующие до­ бавки, скорости обработки, квалификация персонала, проводящего^испытания, и множество других параметров. В гл. 6 нас интересовало определение функциональной зависимости Y от X , а дисперсионный анализ обычно при­ меняется в экспериментах, где ставится более скромная цель, а именно когда необходимо определить, оказывает ли переменная X какое-либо влияние на переменную Y.

К сожалению, применение дисперсионного анализа в многофакторных экспериментах довольно'сложно и со­ пряжено с возможностями появления ошибок. Полное понимание принципов дисперсионного анализа важно да­ же в самых простых задачах. Недооценка недостатков это­ го метода может привести к неправильной оценке диспер­ сии или числа степеней свободы, необходимого для обра­ щения к таблице значений F. Поэтому читатели, которым

потребуется планировать эксперименты такого рода, должны тщательно изучить соответствующие пособия^по математической статистике либо, что еще лучше,'записать­ ся на курсы прикладной статистики.

8 . 5. Пуассоновское распределение

В промышленном производстве и экспериментальной работе возможно появление случайных событий, которые то следуют с большой частотой, то появляются совсем редко. Счет числа частиц космического излучения, до­ рожно-транспортные происшествия и выход из строя оборудования могут быть примерами таких событий. С другой стор оны, возможны и такие события, появление которых кажется случайным, но в действительности они следуют некоторой детерминированной схеме. Число ста­ тических импульсов, появляющихся на экране радиоло­ катора за час, может быть чисто случайным, но оно может вызываться движением транспорта в часы пик или рабо­ той местной телевизионной станции. Число ошибочных соединений за сутки на телефонах-автоматах центральной телефонной станции может иметь чисто случайное распре­ деление, но может зависеть от расписания движения пригородных поездов или даже схемы движения полицейского'патруля.

[Для проверки случайности появления группы событий или некоторого числа объектов эмпирическое распределе­ ние проверяется на соответствие пуассоновскому распре­ делению. Это Граспределение отличается "от нормального и выводится либо на основе допущений о случайных эф­ фектах 13], либо из другого, так называемого биномиаль­ ного 'распределения, которое здесь не рассматривается. Если эмпирическое распределение по форме очень близко к пуассоновскому, то можно предположить, что случайно появляющиеся большие числа не являются необычными, а представляют собой выборку из соответствующей совот купности, распределенной по пуассоновскому закону. Такой вывод избавляет нас от изучения интервалов или экспериментов, в которых появляются такие большие числа, в надежде найти некоторый особый перемежат ющийся эффект, вызывающий их. Нормальное рас*

пределение здесь не

подходит, так как в этих слу­

чаях мы часто имеем

дело с интервалами времени или

участками на стекле микроскопа, карте или графике, в которых содержится нулевое число событий или объектов, а для пуассоновского распределения нуль является ниж­ ним пределом. Нормальное распределение, рассмотрен­ ное в гл. 2 , является симметричным относительно сред­ него значения'и простирается от — оо до -foo. Пуассо­ новское распределение является асимметричным и описы­ вает вероятность появления случайных событий.

Пусть Р — общее число событий, объектов, неисправ­ ностей или происшествий, N — общее число рассматри­ ваемых интервалов времени или участков на стекле микро­ скопа, карте и т. д. (часть которых может ’содержать нулевое число событий или объектов). Тогда среднее число

событий'в определенном интервале времени (или

число

объектов на определенном участке) будет равно’т

= P/N.

Вероятности появления определенного числа событий при пуассоновском законе распределения 'приводятся в сле­ дующей таблице:

Число событий в одном

Вероятность появления данного

интервале времени,

число объектов на

числа событий (объектов)

данном участке и т. п.

 

0

е~т

1

те~т/ \ \

2

т2е~т/2 \

3

пРе~т/ 3!

п

тпе~т/п1

Эти члены образуют пуассоновский ряд, сумма членов которого 'равна единице. Каждый член выражает вероят­ ность того, что произойдет данное число событий, будет наблюдаться данное число объектов, появится данное число неисправностей^ и т. д. Если т меньше единицы, то вероятность максимальна при нулевом числе событий. При 1 < т < 2 максимальной является [вероятность появления одного события и т. д. Для проверки на соот­ ветствие пуассоновскому распределению обычно вычис­ ляется каждый член ряда и с помощью критерия уг эти члены сравниваются с членами эмпирического ряда ана­