Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая статистика в технологии машиностроения

..pdf
Скачиваний:
24
Добавлен:
15.11.2022
Размер:
8.19 Mб
Скачать

Пример 34. Вычислить параболическую регрессию у на х для данных, све­ денных в корреляционную табл. 31.

Таблица 31

Корреляционная таблица

Значения у

 

 

Значения X

 

 

1

2

3

4

5

6

 

 

т у

1

2

1

_

_

_

_

3

2

1

2

3

3

3

1

4

4

1

3

1

5

5

2

2

2

1

7

6

1

1

1

3

пх

3

7

6

4

3

2

25

2 }ПхуУ

4

18

25

20

16

11

hx

1,33

2,57

4,17

5,0

5,33

5,50

Для вычисления коэффициентов а, bt с при помощи системы уравнений (156) составим вспомогательную табл. 32. Теперь уравнения (156) примут вид:

 

 

 

25а + 78b +

296с =

93,99;

 

 

 

 

 

 

78а +

2966 +

1284с =

340,98;

 

 

 

 

 

 

296а +

12846+ 6092с =

1416,88.

Таблица 32

 

 

 

 

 

 

 

 

 

К расчету коэффициентов а, 6, с уравнения параболы

 

 

 

V

п х *2

пх**

4

Ух

п х У х

п х * ' У х

п х * * - У х

3

1

3

3

3

3

1,33

3,99

3,99

3,99

7

2

14

28

56

112

2,57

17,99

35,98

71,96

6

3

18

54

162

486

4,17

25,02

75,06

225,18

4

4

16

64

256

1024

5,0

20,00

80,00

320,00

3

5

15

75

375

1875

5,33

15,99

79,95

399,75

2

6

12

72

432

2592

5,50

11,00

66,00

396,00

£ = 2 5

78

296

1284

6092

93,99

340,98

1416,88

Для решения этих уравнений сначала разделим числовые коэффициенты каждого из них на коэффициент при а:

а +

3,126+

11,84с =

3,76;

(а)

а +

3,806 +

16,46с =

4,37;

(б)

а +

4,346 +

20,58с =

4,79.

(в)

101

Вычтем из уравнения (б) уравнение (а) и из уравнения (в) уравнение (б): 0,68Н - 4,62с = 0,61; 0,546 -|- 4,12с = 0,42.

Разделим эти уравнения на коэффициенты при Ь:

Ь +

6,85с =

0,9;

(г)

Ъ +

7,59с =

0,76.

(Д)

Вычтя из уравнения (д) уравнение (г), получим

0,74с = —0,14,

откуда

Подставляя значение с в уравнение (г), найдем

Ь = 0,9 + 6,85-0,19 = 2,21.

Подставляя b и с в уравнение, (а), получим

а= 3-76 — 3,12-2,21—11,84 (—0,19) =

==—0,89.

Рис. 29. График

параболи­

Таким образом,

уравнение парабо­

лической регрессии у на х, но данным

ческой корреляционной свя­

зи у с

х:

табл. 31, примет следующий вид:

а теоретическая;

б —эмпи­

ух =

—0,89 + 2,21* — 0,19х2.

рическая кривая регрессии

Подставляя в это уравнение * = 1 ,2 ,

.,6, получим теорети­

ческие значения частных

средних

у'х:

 

 

 

х

 

1

2

 

3

4

5

6

у'х

 

1,14

2,78

4,07

4,91

5,41

5,52

Наблюденные значения ух приведены в табл. 31. На основании этих данных на рис. 29 построены параболические кривые теоре­ тической и эмпирической регрессий у на *, которые почти точно совпадают.

5. ПОНЯТИЕ 0 МНОЖЕСТВЕННОЙ КОРРЕЛЯЦИИ

Корреляционные связи могут существовать не только между двумя, но и между несколькими признаками.Например,овальность после чистового шлифования зависит от припуска на чистовое шли­ фование и от овальности после предварительного шлифования; припуск на зубошлифование зависит от величины деформации заготовки шестерни послетермической обработки иот погрешностей, полученных после зубонарезания и т. п,

102

Исследование статистических связей между многими вели­ чинами составляет предмет теории множественной корреляции. В практике механической обработки деталей на станках чаще всего встречаются случаи линейной корреляционной связи между тремя величинами или тремя факторами. Поэтому ограничимся рассмот­ рением простейшего случая линейной корреляционной связи между тремя величинами х, у и z, причем будем считать г величи­ ной, зависящей от х и у. Линейная связь между г, х и у выражается уравнением

 

 

z x y CL-\- Ь х ~ f- Су у

(157)

где а,

b и с — постоянные коэффициенты, которые вычисляются

с помощью коэффициентов корреляции между х и у (г ху);

х

и z

(г Хг); у

и z(ry2), а также средних квадратических отклонений

<тл,

а у , а г

по формулам:

 

 

 

 

 

 

U _ ^2

Гх г r y z ' r x y

 

(158)

 

 

* х

1—' х у

 

 

 

г

_ ® z

? 2 у Г х г ' Г х у

 

(159)

 

a

— Z Ь х с у .

 

(160)

Мерой силы линейной связи между г и х, у в совокупности слу­ жит коэффициентом множественной корреляции или сводный коэффициент корреляции, который вычисляется по формуле

 

 

 

R2uX=

.

(161)

 

 

 

'

1 г х у

 

Коэффициент R zijx всегда положительный и заключен между 0

и 1. Если

Rzyx

=

0, то г не имеет линейной связи с х и у, но возможна криволинейная связь.

Если

RztjX =

1, то между z, х н у

существует точная линейная связь вида Z =

= а +

Ьх +

су.

 

 

Для исследования наличия связей между х и z, у и z, а также оценки влияния х и у в отдельности на z пользуются частными коэффициентами, которые обозна­

чим rx z ( у ) (между х и z при постоянном значении у) и ryz ( х )

(между у и z при по­

стоянном х).

 

Эти коэффициенты вычисляются по формулам:

(162)

fxz Гху'Гуг

У i s - rly) 0- 4) ’

(163)

Гуг Гху'Гхг

0-4)

 

Корень в знаменателе этих формул всегда берется со знаком плюс. Смысл частных коэффициентов заключается в том, что они служат мерой линейной связи между л: и 2 при постоянном значении у , а также между у и z при постоянном зна­ чении х. Значения коэффициентов заключены между —1 и + 1 . Когда они равны О, частная связь между х и z, у и z не может быть линейной; если равны ± 1, то связь

линейная. Чем ближе значения частных коэффициентов к ± 1, тем теснее связь, тем ближе она к линейной связи.

Сравнивая значения гхг (у) и гуг (*), можно установить, какой из факторов х или у оказывает более сильное влияние на г. Чем больше величина частного коэффициента корреляции, тем теснее связь данного фактора с г и тем сильнее его влияние на г. Для определения коэффициентов корреляции rxy%ryz> гХг необ­ ходимо составить корреляционные таблицы для х и у, у и г, х и z и произвести необходимые вычисления по аналогии с изложенным для двухмерных связей.

Пример 36. Кольца подшипников подвергаются предварительному и окон­ чательному шлифованию на двух бесцентровошлифовальных стайках. Статисти­ ческими исследованиями установлено, что овальность после предварительного шлифования х, припуск под окончательное шлифование у и овальность после окончательного шлифования z характеризуются показателями:

X =

0,05

мм;

ох =

0,015 мм;

У =

0,025 мм;

оу =

0,06 мм;

Z =

0,02

мм;

о2 =

0,01 мм.

Кроме того, установлены следующие величины коэффициентов корреляции между х, у и z:

тХу = 0,5; rZX. — 0,6; ггу — 0,4.

Необходимо определить коэффициент множественной корреляции Rzyx, уравнение регрессии z по х и у и частные коэффициенты корреляции.

По формулам (158)—(160) определим значения коэффициентов Ь, с, а:

 

0,01(0,6— 0,4*0,5)

0,01-0,4

 

 

 

0,015(1 — 0,52)

0,015*0,75

 

 

с

0,01 (0,4 — 0,6-0,5)

0,01-0,1

 

QQ2,

0,06 (1 — 0,52)

~~ 0,06-0,75

'

 

а = 0,02—0,36- 0,05—0,022.0,025 = 0,0015.

Уравнение корреляционной связи z с х и у будет иметь вид

~Zxy = 0,0015+0,36* + 0,022*/.

Вычислим частные коэффициенты корреляции:

fxz {у) =

0,6 —0,5-0,4

0,5-

V ( l — 0,5)2(1— 0,42)

ГУ* (х) =

0,4 — 0,5-0,6

 

= 0,14.

 

/ ( l

— 0,5)2(1— 0,62)

 

Коэффициент множественной корреляции будет равен

Rzyx = У

0,62 +

0,42 — 2-0,5-0,4-0,6

= 0,61.

 

1— 0,52

 

 

 

Этот коэффициент достаточно велик и свидетельствует о наличии линейной связи между z и х, у. Частные коэффициенты корреляции показывают, что влия­ ние х на z сильнее влияния у , так как связь между х и z теснее, чем связь между у и z. То же вытекает из анализа уравнения регрессии z по х и у. С увеличением у

в два раза_при х = const Z увеличится на 5,75%; с увеличением х в 2 раза при

у = const Z увеличится на 94%. Следовательно, влияние овальности колец после предварительного шлифования сильнее, чем влияние припуска под чистовое шлифование на величину овальности колец после окончательной их обработки.

6. КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ

Корреляционный анализ. Использование теории корреляции для установления наличия, формы и силы связи между двумя или несколькими случайными величинами носит название корреля­ ционного анализа. Корреляционный анализ выполняется в сле­ дующей последовательности: на основании статистических данных составляется корреляционная таблица (см. табл. 29). С помощью данных табл. 29 вычисляется коэффициент корреляции и затем кор­ реляционное отношение (см. табл. 30). По величине коэффициента корреляции и корреляционного отношения судят о форме связи (прямолинейная или криволинейная) и о силе связи. Затем на основании данных корреляционной таблицы строят эмпирическую кривую регрессии и по ее виду подбирают ближайшую теорети­ ческую кривую и математическую формулу этой кривой. Если теоретическая кривая регрессии выражается уравнением прямой (или уравнением параболы второго порядка), то определение постоянных коэффициентов этих уравнений может быть произве­ дено по формулам (140) или (156).

Для определения параметров уравнений регрессий исполь­ зуется также метод наименьших квадратов (см. часть вторая, гл. I, п. 2).

Регрессионный анализ. В практике часто встречается необхо­ димость в установлении связи между двумя величинами у и х , из которых х является переменной, но не случайной величиной, принимающей в каждой новой серии опытов вполне определенное значение. Величина же у является случайной величиной, имеющей нормальное распределение с постоянной дисперсией а2, не зави­

сящей от х, но с переменным центром распределения У, изменяю­

щимся для каждого нового значения х. Таким образом, У является функцией х, т. е. на каждое изменение неслучайной величины х

случайная_величина у реагирует своим средним значением У

Функция У = / (х) в данном случае не выражает корреляционной связи у с х, так как х не является случайной величиной, а является лишь уравнением регрессии среднего значения случайной вели­ чины у по неслучайной величине х.

Тип функции Y = f (х) может быть линейным или криволиней­ ным, а независимых переменных факторов может быть несколько. Мы рассмотрим только один случай, имеющий практическое при­

менение в технологии машиностроения, когда функция Y = f (х) линейна и зависит только от одного переменного фактора х, т. е. выражается уравнением прямой

У= а + |}х.

Втехнологии машиностроения линейный регрессионный ана­ лиз используется, например, для исследования зависимости жест­ кости узлов станка от нагрузки; для исследования зависимостей

высоты микронеровностей па обработанной поверхности от ка­ кого-либо элемента режима резания, для исследования устой­ чивости технологических процессов во времени и других целей.

При регрессионном анализе тип предполагаемой функции У =

=f (х) должен быть известен. В рассматриваемом случае имеется

ввиду, что функция выражается уравнением Y = а + |5х. В за­ дачи регрессионного анализа входит проверка однородности

дисперсий s? величин у,- для каждого значения xt\ нахождение оценок а и Ъдля параметров а и р теоретических линий регрессии; определение доверительных интервалов для истинных значений коэффициентов а и Р; определение критерия для проверки гипо­

тезы о линейности регрессии Y на х.

Регрессионный анализ базируется на статистических данных, которые должны быть предварительно получены и систематизи­ рованы так, как указано в табл. 33.

а

Независимая величинах

о

 

с

 

о

 

с

 

2

 

1

*1

2

*2

Статистические данные для регрессионного анализа

(случайная)

 

наб­

 

 

£

 

 

Средние значения

 

Зависимая величина у

 

людений - п Число

~llli'­

 

 

 

 

 

Уп> У\2> У\3

Утг

пх

 

 

Y i

2

&п г

По

 

 

F 2

У21 У22»У З

 

 

 

 

Таблица 33

<N

' l

CM•-*

C/J

A

4

k хт Уml* Уm2>Утз . Утпк пк

Ym

4

На основании данных табл. 33 строится кривая зависимости У, от Х[. Для этого по оси абсцисс откладываются значения х*,

а по оси ординат — значения Yь. Линия, соединяющая точки пересечения Yt и xi9 и будет эмпирической кривой связи У/ с х*.

Эмпирическая кривая связи У/ с xt в рассматриваемом случае должна приближаться к прямой, выражаемой уравнением У0 = = а + Ьхукоторое определяет теоретическое значение У«£- для раз­

личных значений Х с. Так как вблизи точек Уь полученных эмпи­ рически, можно провести несколько прямых линий, то наилуч­ шей из них будет та, относительно которой разброс наблюден­

ных точек Уi будет наименьшим. Параметры а и b такой линии определяются с помощью способа наименьших квадратов. Однако прежде чем определять параметры а и b эмпирической линии

106

регрессии, необходимо проверить гипотезу однородности диспер­ сий S/ для каждого нового значения xtj вычисляемых по формуле:

пi

 

2

сV i v - Y i ) 2

 

 

 

2 и=1

__

 

 

 

Проверка этой гипотезы производится по

критерию G [см.

формулу

(127)], если пх = п 2 =

=

nkl или по критерию Q

Бартлета

[см. формулу (124)],

когда п

имеет

неодинаковые зна­

чения, или путем сравнения наибольшей дисперсии с наименьшей при помощи критерия Т [см. формулу (120)].

Если гипотеза однородности дисперсий подтверждается, то только при этом условии можно производить вычисление пара­

метров а и b уравнения Y 0 = а + Ьх. При этом параметры а и b рассматриваются как оценки параметров а и р теоретической ли­ нии регрессии, выражаемой уравнением:

Y = а + р*.

Как было указано выше, вычисление оценок а и b параметров а и р производится с помощью способа наименьших квадратов, сущ­ ность которого изложена в ч. II гл. I. Здесь же мы ограничимся лишь конечными уравнениями для определения коэффициентов а и Ь, полученными при помощи способа наименьших квадратов:

 

m

m

 

m

 

 

а £

til + b £ Hi*i =

£ Я/УУ,

 

 

i =

1

1=1

1=1

(164)

 

tn

 

m

m

 

 

 

a

2 tiiXt +

b 2 щх\ =

2 riiXiY

 

 

i=i

 

t= l

/=i

 

 

 

 

 

 

1

Эта система

уравнений

решается

просто, если 2 nixi = 0-

 

 

 

 

 

£=1

Это условие всегда можно выполнить, если принять за начало отсче-

m

n(xi

 

£

 

тов х среднюю арифметическуюX —

-----. Другими словами,

£

«г

 

£= 1

хт, к новой

если перейти от прежней системы абсцисс х г, х 2,

системе х\, Х2, хт, причем xi = xL— X, то в новой системе требуемое условие будет выполнено, так как

т

т

_

£

щх\ — £

tit fa — Х) = 0.

i'= 1

i=l

Решая систему уравнений (164) при предположении, что усло­

вие

2 tiiXi = 0 выполнено, получим

 

 

 

 

 

i=i

 

 

 

 

 

 

 

 

 

 

 

 

CL 2

Mi — 2!

»

 

 

(165)

 

 

 

 

 

 

 

 

 

 

 

 

 

ъ2

 

2

 

 

 

 

 

 

 

1= 1

 

£= 1

 

 

 

 

откуда

 

 

 

т

 

 

 

 

 

 

 

 

 

 

л/?/

 

 

 

 

 

 

 

 

 

£

 

 

 

 

 

 

 

 

с =

/= 1

 

 

 

 

 

 

 

 

 

£

«/

 

 

 

 

 

 

 

 

 

1=1

 

 

 

(166)

 

 

 

 

 

пг

я,*,?,

 

 

 

 

 

 

 

 

£

 

 

 

 

 

 

 

 

6 =

i=l

 

 

 

 

 

 

 

 

 

 

£

ni-

 

 

 

 

 

 

 

 

 

1= 1

 

 

 

 

 

Если условие

2

= 0 не выполнено, то исходное уравне-

ние

_

а + Ьх

/= i

 

заменить

на

_

 

_

Y =

следует

Y

 

= а' + b{xt — X),

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

_

_

*

т

*;•

 

 

 

а = а! — ЪХ и Х = — 2

 

 

 

 

 

 

 

m i=i

 

 

В этом

случае уравнения (164) примут

 

вид

 

 

т

щ +

т

_

 

т

 

_

 

 

а' 2

ь2

щ(xt— х) =

2

 

 

 

 

i=i

 

i= i

 

 

i=i

(167)

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

а' £

л, (X,- X) +

Ь £

Л; (X, X)2 =

£

 

щ (Xt — Л) У,.

 

1= 1

 

1= 1

 

 

1=1

 

На основании уравнений (167) коэффициентыа' и Ьопределяются по следующим формулам:

 

 

£

n i - Y t

 

а =

1= 1_____

 

(168)

т

пс

 

 

£

 

 

 

1= 1

 

 

£

»/(*! - * )У /

 

Ь =

1 = 1

____________

(169)

т

 

 

 

 

£ гч(Х1-х )*

/= 1

По значениям а' и Ь определяется коэффициент а уравнения У = а + Ьх:

а = а' — ЬХ.

(170)

Если п1 = п 2 = = пт, то формулы (168) и (169) примут

вид

т

__ _

(171)

Ь= i=i _______

т_

£(* /-* )2

1=1

Определив коэффициенты а' и Ь, необходимо проверить гипо­ тезу линейности связи У с х. Для этой цели вычисляется оценка si дисперсии <4 распределения генеральной совокупности случай­ ных величин t/i и оценка si дисперсии сг| рассеивания эмпиричес­

ких значений

Y{

относительно теоретических У0ь

определяемых

уравнением:

 

 

Уо = а + Ьх.

(172)

 

 

 

Дисперсия

si

вычисляется

по

формуле

 

 

 

 

 

т

 

 

 

 

 

 

 

£

(«/-!)«?

 

 

 

 

=

^

--------------•

(173)

 

 

 

 

£

(«<•->)

 

 

 

 

 

1=1

 

 

Если /гх =

/г2 =

=

пт,

то формула (173) примет вид

 

 

 

 

si =

1

т

(174)

 

 

 

 

^ E

s i .

 

 

 

 

 

т ~ 1

 

Дисперсия

si

вычисляется

по

формуле

 

 

 

 

 

т

__

 

 

 

 

 

Ь~2=

£ «<• (к<- Н>,)2

(175)

 

 

 

t=i

т — 2

 

 

 

 

 

 

Проверка гипотезы линейности связи У с х производится при

<j2

помощи критерия Т = -J-. Если si значимо превышает sf, то

ч

гипотеза о линейности должна быть отвергнута.

Критические значения Т приведены в приложении 6. При пользовании этой таблицей необходимо иметь в виду, что для рас-

 

to

сматриваемого случая ki = t n — 2 и k 2=

п,- m . Если полу-

i= 1

ченное значение Тн будет меньше табличного значения Т, то гипо­ теза линейности связи Y с х принимается. Если Тн > Т, то ги­ потеза бракуется.

Если гипотеза линейности связи Yt с xt подтверждается, то

вэтом случае можно вычислить и доверительные интервалы для а

и(5. Установлено, что значения коэффициентов а и b имеют нор­ мальное распределение со средними а и р и дисперсиями:

(176)

S 'Ч i=i

sl =

(177)

;=i

где s2 — дисперсия случайных величин уи определяемая по фор­ муле:

 

тп

п

 

_

m

m

 

 

S

S

d f i v - Y o t ) *

S

(«/—!) ^ + £

п ,(К ,-Г 0/)2

 

.2 *= 1 v=l

 

 

1= 1

1= 1

(178)

 

Ь

m

 

 

 

 

+ ( m - 2 )

 

 

S

 

, l < - 2

 

 

 

 

1=1

 

 

 

 

 

Если an

b имеют нормальное распределение, то величины t' =

=

g~ -- и t" =

 

подчиняются закону распределения Стюдента

 

m

 

 

 

 

 

 

с

S /г, — 2 степенями

свободы. Поэтому,

пользуясь таблицей

 

г=1

 

 

 

 

 

 

приложения 2, можно определить точность приближенных ра­ венств а ^ а и Ь г ^ Р в долях sa и sb, т. е. еа = t’sa и гь = предварительно задавшись вероятностью а. Например, задавшись

вероятностью а

= 0,95, имеем для

 

= 20 по таблице приложе­

ния 2 при k =

20 — 2 = 18 1 = 2,1. Следовательно, еа = 2,lsa

и гь — 2,ls6. Доверительные интервалы для а и р будут равны:

 

а — 2,lsa <

а <

а +

2,lsa;

 

b — 2,lsft <

Р <

6 +

2,1s*-

Все необходимые данные для вычислений, относящихся к

ре­

грессивному анализу, удобно свести в табл. 34.

33.

Столбцы 1, 2, 3, 7 заполняются на основании данных табл.

Столбец 13 заполняется

после вычисления У0/ по формуле У0/ =

= а + Ьх[. Заполнение

остальных столбцов ясно из табл.

34.

по

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]