Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 400245.doc
Скачиваний:
42
Добавлен:
30.04.2022
Размер:
16.88 Mб
Скачать

1.4. Определение статистических характеристик

Представив результаты эксперимента в виде таблицы сгруппированных данных (табл. 12) или в виде кривых распределения (рис. 3), можно перейти к оценке свойств полученных кривых распределения.

Наиболее важными свойствами распределения являются положение кривой распределения на оси абсцисс, степень рассеяния значений случайной величины (в табл. 12 в качестве случайной величины выступает коробление поршневых колец), степень асимметрии кривой распределения, степень крутости кривой распределения.

Положение кривой распределения на оси абсцисс, определяется несколькими характеристиками, из которых при анализе технологических процессов чаще всего применяется среднее арифметическое значение , медиана Ме и мода Мо.

Среднее арифметическое значение — есть частное отделения суммы измеренных значений на количество слагаемых этой суммы, т. е. на объем выборки п

(35)

Формула (35) применяется при расчете в том случае, когда результаты эксперимента не сгруппированы (например, по данным табл. 6 = 34,21 мкм) или когда определяется с помощью вычислительной машины.

Если результаты исследований представлены в виде сгруппированных данных (например, табл. 12), то среднее арифметическое значение определяют по формуле

(36)

где хi — середина i-го интервала; тi — частота i-го интервала; п — объем выборки; f — число интервалов.

Результаты расчета по формуле (36) сведены в табл. 13.

Формула (36) отличается от формулы (35) тем, что в ней все наблюдаемые в интервале величины представлены серединой интервалов хi. Это предполагает равномерное распределение величин внутри каждого интервала (рис. 3,а). Однако на практике это не всегда обеспечивается. Поэтому среднее арифметическое значение, вычисленное по формуле (36) несколько отличается от среднего арифметического значения, рассчитанного по формуле (35). Данное различие, зависящее главным образом от ширины интервала d, очень незначительно и в большинстве случаев несущественно. В приведенном выше примере различие составляет 1,3%.

Таблица 13

Расчетная таблица

Номер интервала

Интервал

Середина интервала xi

Частота

mi

xi mi

1

7—12

9,5

2

19,0

24,25

588,0625

1176,125

2

12—17

14,5

2

29,0

19,25

370,5625

741,125

3

17—22

19,5

10

195,0

14,25

203,0625

2030,625

4

22—27

24,5

15

367,5

9,25

85,5625

1283,4375

5

27—32

29,5

12

354,0

4,25

18,0625

216,75

6

32—37

34,5

23

793,5

0,75

0,5625

12,9375

7

37—42

39,5

14

553,0

5,75

33,0625

462,875

8

42—47

44,5

10

445,0

10,75

115,5625

1155,625

9

47—52

49,5

8

396,0

15,75

248,0625

1984,5

10

52-57

54,5

3

163,5

20,75

430,5625

1291,6875

11

57—62

59,5

1

59,5

25,75

663,0625

663,0625

Среднее арифметическое значение обладает следующими основными свойствами:

1. Сумма отклонений измеренных величин от среднего арифметического значения всегда равна нулю:

(37)

Это свойство среднего арифметического значения позволяет контролировать правильность проведенных вычислений.

2. Если каждую измеренную величину хj уменьшить на постоянную величину а, то среднее арифметическое значение этих разностей будет на ту же величину а меньше среднего арифметического .

(38)

Откуда

(39)

Это свойство среднего арифметического значения позволяет упростить все расчеты и вместо многозначных цифр оперировать только отклонениями от избранной постоянной величины (например, от номинального размера), т. е. это свойство позволяет применять метод «условного нуля».

Формула (39) может быть применена и для сгруппированных данных. В этом случае

(40)

где

Для расчета X по формуле (40) составляют расчетную табл. 14 (по данным табл. 12).

В качестве значения а можно взять любую величину, однако выгоднее всего для большей простоты вычислений выбрать такое значение а, которое было бы близко к среднему арифметическому значению .

В качестве значения а выбираем середину шестого интервала, так как этому интервалу соответствует наибольшая частота т6 == 23 (а = 34,5 мкм). Тогда на основании данных табл. 14

т. е. получили тот же результат, что и по формуле (36).

Из второго свойства среднего арифметического значения вытекает еще один способ его вычисления:

(41)

где — середина последнего интервала (в табл. 12 = 59,5 мкм); d — ширина интервала (в табл. 12 d = 5 мкм); — сумма накопленных частот всех интервалов (в табл. ); n — объем выборки (в табл. 12 п = 100). По формуле (41) = 33,75 мкм, т. е. получили тот же результат, что и по формулам (36) и (40).

Таблица 14

Расчетная таблица

№ пп

Интервал

Середина интервала Хi

Частота mi

1

7-12

9,5

2

-5

—10

50

—250

1250

2

12—17

14,5

2

- 4

—8

32

—128

512

3

17—22

19,5

10

—3

—30

90

—270

810

4

22—27

24,5

15

—2

—30

60

—120

240

5

27—32

29,5

12

—1

—12

12

—12

12

6

32—37

34,5

23

0

0

0

0

0

7

37-42

39,5

14

1

14

14

14

14

8

42—47

44,5

10

2

20

40

80

160

9

47—52

49,5

8

3

24

72

216

648

10

52—57

54,5

3

4

12

48

192

768

11

57—62

59,5

1

5

5

25

125

625

При пользовании формулой (41) отпадает необходимость в составлении промежуточной расчетной таблицы (типа табл. 14).

Среднее арифметическое значение является обобщающей величиной, которая как бы впитывает в себя особенности данной совокупности. Она отражает уровень всей совокупности в целом, дает сводную обобщенную характеристику данного изучаемого признака.

Среднее арифметическое значение характеризует всю совокупность в целом, а не отдельные члены этой совокупности и имеет смысл только по отношению к качественно однородной совокупности. Поэтому нельзя вычислять среднее арифметическое значение коробления поршневых колец после обработки их на разных операциях. Качественно однородная совокупность может быть составлена из поршневых колец, обработанных на данной операции. Так как среднее арифметическое значение относится к данной совокупности, то перенесение его на явления, выходящие за рамки этой совокупности, рискованно без специального анализа. Это замечание распространяется на все статистические характеристики, которые излагаются ниже.

Определив среднее арифметическое значение одним из вышеприведенных методов, необходимо оценить, точность и надежность его вычисления. Для определения точности и надежности вычисления следует воспользоваться соответствующими формулами (4) или (5). Точность ε или коэффициент q определяют в зависимости от различных случаев путем несложного преобразования формул, сведенных в табл. 2.

Следующей характеристикой положения кривой распределения на оси абсцисс является медиана Ме, которую широко используют при анализе технологических процессов малыми выборками (см. гл. II).

Модой Мо называется значение признака, которому соответствует наибольшее число наблюдений или значение признака в интервале, которому соответствует наибольшая частота (модальный интервал).

На основе сгруппированных данных мода

(42)

где L — нижняя граница модального интервала; d — ширина интервала; — разность частот модального и домодального интервалов; — разность частот модального и послемодального интервалов.

Таблица 15

Программа вичисления среднего квадратического отклонения на вычислительной машине «Промшь»

Ячейка

Распределение памяти

01

02

...

50

51

52

____________________________

____________________________

… … … …

____________________________

____________________________

_____________________

Номер команды

Код команды

Примечание

00

ЧТОО

01

ЗП61

02

ЗП62

03

ЗП63

04

ЧТ90

05

ЗП60

06

ЧТП60

07

Сл61

08

ЗП61

09

ЧТП60

10

ЗП67

11

Ум67

12

Сл62

13

ЗП62

14

ЧТ60

15

СлФ90

При графическом представлении опытных данных в виде полигона распределения мода равна значению признака, которому соответствует максимальная ордината полигона. В практике анализа технологического процесса мода применяется при анализе многовершинных кривых распределения.

Большинство распределений, когда они основаны на довольно большом числе наблюдений, обычно одномодальны, т. е. имеют одну интервальную частоту, превышающую все остальные. Однако иногда встречаются и двухмодальные распределения (рис. 4). В этих распределениях два интервала со сравнительно высокими частотами разделены одним или несколькими интервалами с более низкими частотами. Даже при уcловии, что частоты в этих двух интервалах неравны, оба они называются модальными интервалами. Появление двухмо-дальных распределений требует от технолога-исследователя всегда особого внимания, так как это означает, что сильное неслучайное влияние имеет тенденцию разделить ряд распределения на два типа. Двухмодальность распределения является следствием неоднородности выборки. При решении других технологических задач мода еще не нашла широкого применения.

Рис. 4. Двухнедельное распределение.

Рассмотренные характеристики, определяющие положение кривой распределения на оси абсцисс, указывают на то, какое значение признака наиболее характерно для данной совокупности. Но сами по себе эти характеристики еще недостаточны для оценки всей совокупности, так как главной особенностью совокупности является наличие разнообразия между ее членами, т. е. рассеяние.

На рис. 5 изображены два полигона распределения с одинаковыми средними арифметическими значениями. Как видно из рис. 5, измерения в случае 1 теснее сгруппированы вокруг среднего значения, чем в случае 2

Рис. 5. Полигоны распределения с одинаковыми средними арифметическими значениями X и разными средними квадратическими отклонениями.

Если бы не было рассеяния, то информацию о совокупности можно было получить по одному члену выборки. При наличии же рассеяния эта информация должна быть основана на учете характера и степени рассеяния. Учет рассеяния любого признака в совокупности имеет очень большое значение для технолога, так как рассеяние в конечном счете отражает характер функционирования технологического процесса.

Степень рассеяния определяется несколькими характеристиками, из которых при анализе технологических процессов применяется размах W, дисперсия S2, среднее квадратическое отклонение S, коэффициент вариации V.

Размах W, определяемый по формуле (36) как разность между максимальным хтах и минимальным хтiп значением измеренного признака, может в известной степени определить степень рассеяния. Однако, во-первых, крайние величины в рядах распределения не очень устойчивы и при изменении объема выборки они легко сдвигаются. Во-вторых, при одних и тех же крайних величинах распределение отдельных значений признака внутри ряда может быть различным. В связи с этим размах W нашел широкое применение при анализе технологических процессов малыми выборками (см. главу II).

Дисперсию S2 определяют как сумму произведений квадратов отклонений наблюдаемых значений случайной величины от ее среднего арифметического значения на соответствующие частости:

(43)

В связи с тем, что дисперсия S2 имеет размерность, представляющую собой квадрат размерности измеряемого признака качества, что в практике анализа не всегда удобно, чаще пользуются величиной среднего квадратического отклонения

(44)

Однако при проверке различного рода статистических гипотез, при проведении дисперсионного анализа, в теории и практике планирования эксперимента дисперсия нашла самое широкое распространение, представляя собой одну из центральных характеристик распределения случайных величин.

Если результаты эксперимента не сгруппированы, то среднее квадрэтическое отклонение

(45)

Для данных, приведенных в табл. 6, S = 10,328 мкм.

При вычислении S по непосредственно измеренным величинам среднее квадратическое отклонение

(46)

Расчет среднего квадратического отклонения по формулам (45) или (46) при большом объеме выборки чрезвычайно трудоемок и неосуществим без использования вычислительных машин.

На рис. 6 и в табл. 15 приведены структурная схема и программа вычисления среднего квадратического отклонения по формуле (46) на электронной цифровой вычислительной машине. Если программа предназначена для многократного использования, то целесообразно пробивать ее на специальных металлизированных перфокартах. На рис. 7 представлен комплект пробитых перфокарт для вычисления S (пробивки заштрихованы).

Рис. 6. Структурная схема программы вычисления среднего квадратического отклонения 5 на электронно- цифровой вычислительной машине

Трудоемкость вычисления S можно уменьшить, представляя результаты исследования в виде таблицы сгруппированных данных. В этом случае среднее квадратическое отклонение

(47)

После преобразования формулы (47)

(48)

Опыт исследования показывает, что величина S, вычисленная по формулам (47) или (48), в большинстве случаев больше соответствующего значения, полученного по формулам (45) и (46). Однако на практике это отклонение несущественно.

При расчете S по формуле (47) или (48) погрешность вычисления составляет 1,6%.

Рис. 7. Комплект перфокарт для вычисления среднего квадратического отклонения S на ЭЦВМ

При расчете S по формулам (47) и (48) трудоемкость вычисления несколько уменьшается, однако остается все же большой. Для того чтобы рекомендовать упрощенные методы вычисления S, следует предварительно познакомиться с некоторыми основными свойствами среднего квадратического отклонения.

1. Если все частоты интервалов тi умножить или разделить на одно и тоже число, то среднее квадратическое отклонение S не изменится. Это свойство S следует применять тогда, когда все частоты кратны одному и тому же числу l. В этом случае каждую частоту можно уменьшить в l раз, упрощая тем самым вычисления и не изменяя конечного результата.

2. Если ко всем значениям измеренного признака прибавить или отнять одно и то же число а, то среднее квадратическое отклонение S останется без изменения:

(49)

Формула (49) пригодна также для обработки несгруппированных данных.

Это свойство среднего квадратического отклонения позволяет упрощать расчеты за счет замены многозначных цифр отклонениями от избранной постоянной величины.

Применяя таблицу сгруппированных данных, при расчете следует использовать метод «условного нуля», который также основывается на втором свойстве среднего квадратического отклонения.

Формула для расчета S методом «условного нуля» имеет вид

(50)

где

Среднее квадратическое отклонение S показывает, насколько тесно сгруппированы возможные значения признака около центра группирования (X). Таким образом, среднее квадратическое отклонение является мерой рассеяния, или мерой точности.

Действительно (рис. 5), при увеличении S полигон распределения 2 становится более пологим и низким, что свидетельствует о большем рассеянии значений признака качества и, следовательно, о меньшей точности. Чем меньше S, тем меньше рассеяние значений признака качества, тем больше точность обработки (полигон 1).

Если обработка деталей в цехе или на участке производится на настроенных станках, то значение средних квадратических отклонений каждого станка поможет технологу решать ряд важных задач, связанных с оценкой точности технологического процесса и качества настройки станка на размер, определением вероятного количества годных и бракованных деталей и др.

В связи с тем, что среднее квадратическое отклонение выступает в качестве меры точности, для получения достоверных данных при анализе технологического процесса рекомендуется не реже одного раза в два месяца производить контроль фактической величины среднего квадратического отклонения для каждого станка, участка или цеха.

Важным этапом работы после определения величины среднего квадратического отклонения S является оценка точности и надежности его вычисления. Задавшись надежностью α, точность ε определяют по одной из формул, приведенных в табл. 2. Для определения пределов, в которых с надежностью а лежит истинное значение среднего квадратического отклонения σ0, следует воспользоваться формулами (4) или (5).

Учет изменчивости с помощью коэффициента вариации, определяемого по номограмме, приведенной на рис. 8, очень важен при планировании эксперимента, установлении объема выборочных совокупностей, а также при оценке результатов опытов. Однако одного коэффициента вариации явно недостаточно для характеристики совокупности. Он является лишь дополнительным показателем, полезным при наличии и S.

Если значения измеряемого признака колеблются около нуля, то коэффициентом вариации в качестве характеристики рассеяния не рекомендуется пользоваться. В этом случае среднее квадратическое отклонение и среднее арифметическое значение также близки к нулю, поэтому незначительное изменение любой из этих характеристик может привести к резкому изменению коэффициента вариации.

Зная величину коэффициента вариации V, можно определить показатель точности исследования Н по формуле

(51)

где п — объем выборки.

Чем точнее произведено исследование, тем меньше будет показатель H. В зависимости от природы изучаемого явления показатель точности исследования считается достаточным, если он не превышает 3—5%.

Рис. 8. Номограмма для определения коэффициента вариации V [30].

В выборочных совокупностях значения измеряемого признака качества могут распределяться симметрично и асимметрично по отношению к среднему арифметическому значению. Асимметричность рядов распределения отражает важные их особенности. В технологии машиностроения симметрия обычно вызывается систематическими ошибками, например, износом и деформацией инструмента, температурными деформациями и т. п. Асимметрия может получиться и в случае обработки деталей методом пробных проходов и промеров. Это обусловливается тем, что рабочий, производя индивидуальные промеры, стремится держаться проходной стороны предельного калибра. Таким образом, действительные размеры группируются по полю допуска неравномерно.

Зная величину асимметрии А ряда распределения, технолог может судить о наличии систематических погрешностей, природа которых может быть выяснена дополнительным анализом.

Для выборок с не группированными опытными данными асимметрия

(52)

Для сгруппированных данных асимметрия

(53)

Однако расчет асимметрии по формулам (52) и (53) весьма трудоемок. Для упрощения расчетов рекомендуется пользоваться методом «условного нуля». Для этого составляют дополнительную расчетную таблицу (типа табл. 14), в которой записывают значения .Зная суммы С1, С2, С3, можно рассчитать асимметрию по формуле

(54)

По данным табл. 12 и 14 (d = 5 мкм, п = 100, S = 10,5 мкм, С, = - 15, С3 - 443, С3 = - 153) асимметрия распределения

Если А > 0, то асимметрия положительная (рис. 9,а), а если А < 0 — отрицательная (рис. 9,б). При А = 0 или несущественно отличается от нуля, распределение — симметрично. Распределение считается почти симметричным, если |А|<0,1, и сильно асимметричным, если |А\>0,5.

Степень крутости кривой распределения оценивается при помощи эксцесса Е. В технологии машиностроения интерес представляет не просто степень крутости кривой распределения, а ее отклонение от степени крутости эталонной кривой распределения, в качестве которой выбирается кривая нормального распределения.

Рис. 9. Асимметричные полигоны распределения:

а — положительная асимметрия; б — отрицательная асимметрия.

Для не сгруппированных данных эксцесс

(55)

а для сгруппированных данных

(56)

Вычисление эксцесса Е по приведенным формулам весьма трудоемко. В связи с этим для упрощения вычисления используют метод «условного нуля». При этом формула для расчета эксцесса Е имеет вид

(57)

По данным табл. 12 и 14

Рис. 10. Эксцесс распределений.

Если эксцесс Е> 0, то кривая распределения имеет вершину более острую (рис. 10, кривая 1) по сравнению с вершиной кривой нормального распределения, если Е < 0, то кривая распределения плосковершинная. Ее вершина расположена ниже вершины кривой нормального распределения и может быть даже многовершинной (рис. 10, кривая 2). Для кривой 3 (рис. 10) Е = 0.

Основную ошибку вычисления асимметрии ΔА и эксцесса ΔЕ определяют по формулам

(58)