Математическая статистика в технологии машиностроения
..pdfПример 34. Вычислить параболическую регрессию у на х для данных, све денных в корреляционную табл. 31.
Таблица 31
Корреляционная таблица
Значения у |
|
|
Значения X |
|
|
||
1 |
2 |
3 |
4 |
5 |
6 |
|
|
|
т у |
||||||
1 |
2 |
1 |
_ |
_ |
_ |
_ |
3 |
2 |
1 |
2 |
— |
— |
— |
— |
3 |
3 |
— |
3 |
1 |
— |
— |
— |
4 |
4 |
— |
1 |
3 |
1 |
— |
— |
5 |
5 |
— |
— |
2 |
2 |
2 |
1 |
7 |
6 |
— |
— |
— |
1 |
1 |
1 |
3 |
пх |
3 |
7 |
6 |
4 |
3 |
2 |
25 |
2 }ПхуУ |
4 |
18 |
25 |
20 |
16 |
11 |
— |
hx |
1,33 |
2,57 |
4,17 |
5,0 |
5,33 |
5,50 |
— |
Для вычисления коэффициентов а, bt с при помощи системы уравнений (156) составим вспомогательную табл. 32. Теперь уравнения (156) примут вид:
|
|
|
25а + 78b + |
296с = |
93,99; |
|
|
|
|
|
|
|
78а + |
2966 + |
1284с = |
340,98; |
|
|
|
|
|
|
296а + |
12846+ 6092с = |
1416,88. |
Таблица 32 |
|||
|
|
|
|
|
|
|
|
||
|
К расчету коэффициентов а, 6, с уравнения параболы |
|
|||||||
|
|
V |
п х *2 |
пх** |
4 |
Ух |
п х У х |
п х * ' У х |
п х * * - У х |
3 |
1 |
3 |
3 |
3 |
3 |
1,33 |
3,99 |
3,99 |
3,99 |
7 |
2 |
14 |
28 |
56 |
112 |
2,57 |
17,99 |
35,98 |
71,96 |
6 |
3 |
18 |
54 |
162 |
486 |
4,17 |
25,02 |
75,06 |
225,18 |
4 |
4 |
16 |
64 |
256 |
1024 |
5,0 |
20,00 |
80,00 |
320,00 |
3 |
5 |
15 |
75 |
375 |
1875 |
5,33 |
15,99 |
79,95 |
399,75 |
2 |
6 |
12 |
72 |
432 |
2592 |
5,50 |
11,00 |
66,00 |
396,00 |
£ = 2 5 |
— |
78 |
296 |
1284 |
6092 |
— |
93,99 |
340,98 |
1416,88 |
Для решения этих уравнений сначала разделим числовые коэффициенты каждого из них на коэффициент при а:
а + |
3,126+ |
11,84с = |
3,76; |
(а) |
а + |
3,806 + |
16,46с = |
4,37; |
(б) |
а + |
4,346 + |
20,58с = |
4,79. |
(в) |
101
Вычтем из уравнения (б) уравнение (а) и из уравнения (в) уравнение (б): 0,68Н - 4,62с = 0,61; 0,546 -|- 4,12с = 0,42.
Разделим эти уравнения на коэффициенты при Ь:
Ь + |
6,85с = |
0,9; |
(г) |
Ъ + |
7,59с = |
0,76. |
(Д) |
Вычтя из уравнения (д) уравнение (г), получим
0,74с = —0,14,
откуда
Подставляя значение с в уравнение (г), найдем
Ь = 0,9 + 6,85-0,19 = 2,21.
Подставляя b и с в уравнение, (а), получим
а= 3-76 — 3,12-2,21—11,84 (—0,19) =
==—0,89.
Рис. 29. График |
параболи |
Таким образом, |
уравнение парабо |
||||||
лической регрессии у на х, но данным |
|||||||||
ческой корреляционной свя |
|||||||||
зи у с |
х: |
табл. 31, примет следующий вид: |
|||||||
а —теоретическая; |
б —эмпи |
ух = |
—0,89 + 2,21* — 0,19х2. |
||||||
рическая кривая регрессии |
|||||||||
Подставляя в это уравнение * = 1 ,2 , |
.,6, получим теорети |
||||||||
ческие значения частных |
средних |
у'х: |
|
|
|
||||
х |
|
1 |
2 |
|
3 |
4 |
5 |
6 |
|
у'х |
|
1,14 |
2,78 |
4,07 |
4,91 |
5,41 |
5,52 |
Наблюденные значения ух приведены в табл. 31. На основании этих данных на рис. 29 построены параболические кривые теоре тической и эмпирической регрессий у на *, которые почти точно совпадают.
5. ПОНЯТИЕ 0 МНОЖЕСТВЕННОЙ КОРРЕЛЯЦИИ
Корреляционные связи могут существовать не только между двумя, но и между несколькими признаками.Например,овальность после чистового шлифования зависит от припуска на чистовое шли фование и от овальности после предварительного шлифования; припуск на зубошлифование зависит от величины деформации заготовки шестерни послетермической обработки иот погрешностей, полученных после зубонарезания и т. п,
102
Исследование статистических связей между многими вели чинами составляет предмет теории множественной корреляции. В практике механической обработки деталей на станках чаще всего встречаются случаи линейной корреляционной связи между тремя величинами или тремя факторами. Поэтому ограничимся рассмот рением простейшего случая линейной корреляционной связи между тремя величинами х, у и z, причем будем считать г величи ной, зависящей от х и у. Линейная связь между г, х и у выражается уравнением
|
|
z x y — CL-\- Ь х ~ f- Су у |
(157) |
||
где а, |
b и с — постоянные коэффициенты, которые вычисляются |
||||
с помощью коэффициентов корреляции между х и у (г ху); |
х |
и z |
|||
(г Хг); у |
и z(ry2), а также средних квадратических отклонений |
<тл, |
|||
а у , а г |
по формулам: |
|
|
|
|
|
|
U _ ^2 |
Гх г — r y z ' r x y |
|
(158) |
|
|
* х |
1—' х у |
|
|
|
г |
_ ® z |
? 2 у —Г х г ' Г х у |
|
(159) |
|
a |
— Z — Ь х — с у . |
|
(160) |
Мерой силы линейной связи между г и х, у в совокупности слу жит коэффициентом множественной корреляции или сводный коэффициент корреляции, который вычисляется по формуле
|
|
|
R2uX= |
. |
(161) |
|
|
|
' |
1 г х у |
|
Коэффициент R zijx всегда положительный и заключен между 0 |
и 1. Если |
||||
Rzyx |
= |
0, то г не имеет линейной связи с х и у, но возможна криволинейная связь. |
|||
Если |
RztjX = |
1, то между z, х н у |
существует точная линейная связь вида Z = |
||
= а + |
Ьх + |
су. |
|
|
Для исследования наличия связей между х и z, у и z, а также оценки влияния х и у в отдельности на z пользуются частными коэффициентами, которые обозна
чим rx z ( у ) (между х и z при постоянном значении у) и ryz ( х ) |
(между у и z при по |
стоянном х). |
|
Эти коэффициенты вычисляются по формулам: |
(162) |
fxz —Гху'Гуг |
|
У i s - rly) 0- 4) ’ |
(163) |
Гуг —Гху'Гхг |
|
0-4) |
|
Корень в знаменателе этих формул всегда берется со знаком плюс. Смысл частных коэффициентов заключается в том, что они служат мерой линейной связи между л: и 2 при постоянном значении у , а также между у и z при постоянном зна чении х. Значения коэффициентов заключены между —1 и + 1 . Когда они равны О, частная связь между х и z, у и z не может быть линейной; если равны ± 1, то связь
линейная. Чем ближе значения частных коэффициентов к ± 1, тем теснее связь, тем ближе она к линейной связи.
Сравнивая значения гхг (у) и гуг (*), можно установить, какой из факторов х или у оказывает более сильное влияние на г. Чем больше величина частного коэффициента корреляции, тем теснее связь данного фактора с г и тем сильнее его влияние на г. Для определения коэффициентов корреляции rxy%ryz> гХг необ ходимо составить корреляционные таблицы для х и у, у и г, х и z и произвести необходимые вычисления по аналогии с изложенным для двухмерных связей.
Пример 36. Кольца подшипников подвергаются предварительному и окон чательному шлифованию на двух бесцентровошлифовальных стайках. Статисти ческими исследованиями установлено, что овальность после предварительного шлифования х, припуск под окончательное шлифование у и овальность после окончательного шлифования z характеризуются показателями:
X = |
0,05 |
мм; |
ох = |
0,015 мм; |
У = |
0,025 мм; |
оу = |
0,06 мм; |
|
Z = |
0,02 |
мм; |
о2 = |
0,01 мм. |
Кроме того, установлены следующие величины коэффициентов корреляции между х, у и z:
тХу = 0,5; rZX. — 0,6; ггу — 0,4.
Необходимо определить коэффициент множественной корреляции Rzyx, уравнение регрессии z по х и у и частные коэффициенты корреляции.
По формулам (158)—(160) определим значения коэффициентов Ь, с, а:
|
0,01(0,6— 0,4*0,5) |
0,01-0,4 |
|
|
|
|
0,015(1 — 0,52) |
0,015*0,75 |
|
|
|
с |
0,01 (0,4 — 0,6-0,5) |
0,01-0,1 |
|
QQ2, |
|
0,06 (1 — 0,52) |
~~ 0,06-0,75 |
’ |
' |
||
|
а = 0,02—0,36- 0,05—0,022.0,025 = 0,0015.
Уравнение корреляционной связи z с х и у будет иметь вид
~Zxy = 0,0015+0,36* + 0,022*/.
Вычислим частные коэффициенты корреляции:
fxz {у) = |
0,6 —0,5-0,4 |
0,5- |
V ( l — 0,5)2(1— 0,42)
ГУ* (х) = |
0,4 — 0,5-0,6 |
|
|
= 0,14. |
|||
|
/ ( l |
— 0,5)2(1— 0,62) |
|
Коэффициент множественной корреляции будет равен |
|||
Rzyx = У |
0,62 + |
0,42 — 2-0,5-0,4-0,6 |
= 0,61. |
|
1— 0,52 |
||
|
|
|
Этот коэффициент достаточно велик и свидетельствует о наличии линейной связи между z и х, у. Частные коэффициенты корреляции показывают, что влия ние х на z сильнее влияния у , так как связь между х и z теснее, чем связь между у и z. То же вытекает из анализа уравнения регрессии z по х и у. С увеличением у
в два раза_при х = const Z увеличится на 5,75%; с увеличением х в 2 раза при
у = const Z увеличится на 94%. Следовательно, влияние овальности колец после предварительного шлифования сильнее, чем влияние припуска под чистовое шлифование на величину овальности колец после окончательной их обработки.
6. КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
Корреляционный анализ. Использование теории корреляции для установления наличия, формы и силы связи между двумя или несколькими случайными величинами носит название корреля ционного анализа. Корреляционный анализ выполняется в сле дующей последовательности: на основании статистических данных составляется корреляционная таблица (см. табл. 29). С помощью данных табл. 29 вычисляется коэффициент корреляции и затем кор реляционное отношение (см. табл. 30). По величине коэффициента корреляции и корреляционного отношения судят о форме связи (прямолинейная или криволинейная) и о силе связи. Затем на основании данных корреляционной таблицы строят эмпирическую кривую регрессии и по ее виду подбирают ближайшую теорети ческую кривую и математическую формулу этой кривой. Если теоретическая кривая регрессии выражается уравнением прямой (или уравнением параболы второго порядка), то определение постоянных коэффициентов этих уравнений может быть произве дено по формулам (140) или (156).
Для определения параметров уравнений регрессий исполь зуется также метод наименьших квадратов (см. часть вторая, гл. I, п. 2).
Регрессионный анализ. В практике часто встречается необхо димость в установлении связи между двумя величинами у и х , из которых х является переменной, но не случайной величиной, принимающей в каждой новой серии опытов вполне определенное значение. Величина же у является случайной величиной, имеющей нормальное распределение с постоянной дисперсией а2, не зави
сящей от х, но с переменным центром распределения У, изменяю
щимся для каждого нового значения х. Таким образом, У является функцией х, т. е. на каждое изменение неслучайной величины х
случайная_величина у реагирует своим средним значением У
Функция У = / (х) в данном случае не выражает корреляционной связи у с х, так как х не является случайной величиной, а является лишь уравнением регрессии среднего значения случайной вели чины у по неслучайной величине х.
Тип функции Y = f (х) может быть линейным или криволиней ным, а независимых переменных факторов может быть несколько. Мы рассмотрим только один случай, имеющий практическое при
менение в технологии машиностроения, когда функция Y = f (х) линейна и зависит только от одного переменного фактора х, т. е. выражается уравнением прямой
У= а + |}х.
Втехнологии машиностроения линейный регрессионный ана лиз используется, например, для исследования зависимости жест кости узлов станка от нагрузки; для исследования зависимостей
высоты микронеровностей па обработанной поверхности от ка кого-либо элемента режима резания, для исследования устой чивости технологических процессов во времени и других целей.
При регрессионном анализе тип предполагаемой функции У =
=f (х) должен быть известен. В рассматриваемом случае имеется
ввиду, что функция выражается уравнением Y = а + |5х. В за дачи регрессионного анализа входит проверка однородности
дисперсий s? величин у,- для каждого значения xt\ нахождение оценок а и Ъдля параметров а и р теоретических линий регрессии; определение доверительных интервалов для истинных значений коэффициентов а и Р; определение критерия для проверки гипо
тезы о линейности регрессии Y на х.
Регрессионный анализ базируется на статистических данных, которые должны быть предварительно получены и систематизи рованы так, как указано в табл. 33.
а |
Независимая величинах |
о |
|
с |
|
о |
|
с |
|
2 |
|
1 |
*1 |
2 |
*2 |
Статистические данные для регрессионного анализа
(случайная) |
|
наб |
|
|
£ |
|
|
Средние значения |
|
||
Зависимая величина у |
|
людений - п Число |
-О |
~llli' |
|
|
|
|
|
|
|
Уп> У\2> У\3 |
Утг |
пх |
|
|
Y i |
2 |
&п г |
По |
|
|
F 2 |
У21 У22»У З |
|
|
|
|
Таблица 33
<N
' l
CM•-*
C/J
A
4
k хт Уml* Уm2>Утз . Утпк пк |
Ym |
4 |
На основании данных табл. 33 строится кривая зависимости У, от Х[. Для этого по оси абсцисс откладываются значения х*,
а по оси ординат — значения Yь. Линия, соединяющая точки пересечения Yt и xi9 и будет эмпирической кривой связи У/ с х*.
Эмпирическая кривая связи У/ с xt в рассматриваемом случае должна приближаться к прямой, выражаемой уравнением У0 = = а + Ьхукоторое определяет теоретическое значение У«£- для раз
личных значений Х с. Так как вблизи точек Уь полученных эмпи рически, можно провести несколько прямых линий, то наилуч шей из них будет та, относительно которой разброс наблюден
ных точек Уi будет наименьшим. Параметры а и b такой линии определяются с помощью способа наименьших квадратов. Однако прежде чем определять параметры а и b эмпирической линии
106
регрессии, необходимо проверить гипотезу однородности диспер сий S/ для каждого нового значения xtj вычисляемых по формуле:
пi
|
2 |
сV i v - Y i ) 2 |
|
|
|
|
2 и=1 |
__ |
|
|
|
Проверка этой гипотезы производится по |
критерию G [см. |
||||
формулу |
(127)], если пх = п 2 = |
= |
nkl или по критерию Q |
||
Бартлета |
[см. формулу (124)], |
когда п |
имеет |
неодинаковые зна |
чения, или путем сравнения наибольшей дисперсии с наименьшей при помощи критерия Т [см. формулу (120)].
Если гипотеза однородности дисперсий подтверждается, то только при этом условии можно производить вычисление пара
метров а и b уравнения Y 0 = а + Ьх. При этом параметры а и b рассматриваются как оценки параметров а и р теоретической ли нии регрессии, выражаемой уравнением:
Y = а + р*.
Как было указано выше, вычисление оценок а и b параметров а и р производится с помощью способа наименьших квадратов, сущ ность которого изложена в ч. II гл. I. Здесь же мы ограничимся лишь конечными уравнениями для определения коэффициентов а и Ь, полученными при помощи способа наименьших квадратов:
|
m |
m |
|
m |
|
|
а £ |
til + b £ Hi*i = |
£ Я/УУ, |
|
|
|
i = |
1 |
1=1 |
1=1 |
(164) |
|
tn |
|
m |
m |
|
|
|
|
|||
a |
2 tiiXt + |
b 2 щх\ = |
2 riiXiY |
|
|
|
i=i |
|
t= l |
/=i |
|
|
|
|
|
|
1 |
Эта система |
уравнений |
решается |
просто, если 2 nixi = 0- |
||
|
|
|
|
|
£=1 |
Это условие всегда можно выполнить, если принять за начало отсче-
m |
n(xi |
|
£ |
|
|
тов х среднюю арифметическуюX — |
-----. Другими словами, |
|
£ |
«г |
|
£= 1 |
хт, к новой |
|
если перейти от прежней системы абсцисс х г, х 2, |
системе х\, Х2, хт, причем xi = xL— X, то в новой системе требуемое условие будет выполнено, так как
т |
т |
_ |
£ |
щх\ — £ |
tit fa — Х) = 0. |
i'= 1 |
i=l |
Решая систему уравнений (164) при предположении, что усло
вие |
2 tiiXi = 0 выполнено, получим |
|
|
|
|
|||||
|
i=i |
|
|
|
|
|
|
|
|
|
|
|
|
CL 2 |
Mi — 2! |
» |
|
|
(165) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ъ2 |
|
2 |
|
|
|
|
|
|
|
|
1= 1 |
|
£= 1 |
|
|
|
|
|
откуда |
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
л/?/ |
|
|
|
|
|
|
|
|
|
|
£ |
|
|
|
|
|
|
|
|
|
с = |
/= 1 |
|
|
|
|
|
|
|
|
|
|
£ |
«/ |
|
|
|
|
|
|
|
|
|
1=1 |
|
|
|
(166) |
|
|
|
|
|
|
пг |
я,*,?, |
|
|
|
|
|
|
|
|
|
£ |
|
|
|
|
|
|
|
|
|
6 = |
i=l |
|
|
|
|
|
|
|
|
|
|
£ |
ni- |
|
|
|
|
|
|
|
|
|
1= 1 |
|
|
|
|
|
|
Если условие |
2 |
= 0 не выполнено, то исходное уравне- |
|||||||
ние |
_ |
а + Ьх |
/= i |
|
заменить |
на |
_ |
|
_ |
|
Y = |
следует |
Y |
|
= а' + b{xt — X), |
||||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
_ |
_ |
* |
т |
*;• |
|
|
|
|
а = а! — ЪХ и Х = — 2 |
|||||||
|
|
|
|
|
|
|
m i=i |
|
|
|
В этом |
случае уравнения (164) примут |
|
вид |
|||||||
|
|
т |
щ + |
т |
_ |
|
т |
|
_ |
|
|
|
а' 2 |
ь2 |
щ(xt— х) = |
2 |
|
|
|||
|
|
i=i |
|
i= i |
|
|
i=i |
(167) |
||
|
|
|
|
|
|
|
|
т |
||
|
|
|
|
|
|
|
|
|
||
|
а' £ |
л, (X,- —X) + |
Ь £ |
Л; (X, —X)2 = |
£ |
|
щ (Xt — Л) У,. |
|||
|
1= 1 |
|
1= 1 |
|
|
1=1 |
|
На основании уравнений (167) коэффициентыа' и Ьопределяются по следующим формулам:
|
|
£ |
n i - Y t |
|
а = |
1= 1_____ |
|
(168) |
|
т |
пс |
|||
|
|
£ |
|
|
|
|
1= 1 |
|
|
|
£ |
»/(*! - * )У / |
|
|
Ь = |
1 = 1 |
____________ |
(169) |
|
т |
|
|||
|
|
|
£ гч(Х1-х )*
/= 1
По значениям а' и Ь определяется коэффициент а уравнения У = а + Ьх:
а = а' — ЬХ. |
(170) |
Если п1 = п 2 = = пт, то формулы (168) и (169) примут
вид
т |
__ _ |
(171)
Ь= i=i _______
т_
£(* /-* )2
1=1
Определив коэффициенты а' и Ь, необходимо проверить гипо тезу линейности связи У с х. Для этой цели вычисляется оценка si дисперсии <4 распределения генеральной совокупности случай ных величин t/i и оценка si дисперсии сг| рассеивания эмпиричес
ких значений |
Y{ |
относительно теоретических У0ь |
определяемых |
||||
уравнением: |
|
|
Уо = а + Ьх. |
(172) |
|||
|
|
|
|||||
Дисперсия |
si |
вычисляется |
по |
формуле |
|
||
|
|
|
|
т |
|
|
|
|
|
|
|
£ |
(«/-!)«? |
|
|
|
|
|
= |
^ |
--------------• |
(173) |
|
|
|
|
|
£ |
(«<•->) |
|
|
|
|
|
|
1=1 |
|
|
|
Если /гх = |
/г2 = |
= |
пт, |
то формула (173) примет вид |
|||
|
|
|
|
si = |
1 |
т |
(174) |
|
|
|
|
^ E |
s i . |
||
|
|
|
|
|
т ~ 1 |
|
|
Дисперсия |
si |
вычисляется |
по |
формуле |
|
||
|
|
|
|
т |
__ |
|
|
|
|
|
Ь~2= |
£ «<• (к<- Н>,)2 |
(175) |
||
|
|
|
t=i |
т — 2 |
|||
|
|
|
|
|
|
Проверка гипотезы линейности связи У с х производится при
<j2
помощи критерия Т = -J-. Если si значимо превышает sf, то
ч
гипотеза о линейности должна быть отвергнута.
Критические значения Т приведены в приложении 6. При пользовании этой таблицей необходимо иметь в виду, что для рас-
|
to |
сматриваемого случая ki = t n — 2 и k 2= |
п,- — m . Если полу- |
i= 1
ченное значение Тн будет меньше табличного значения Т, то гипо теза линейности связи Y с х принимается. Если Тн > Т, то ги потеза бракуется.
Если гипотеза линейности связи Yt с xt подтверждается, то
вэтом случае можно вычислить и доверительные интервалы для а
и(5. Установлено, что значения коэффициентов а и b имеют нор мальное распределение со средними а и р и дисперсиями:
(176)
S 'Ч i=i
sl = |
(177) |
;=i
где s2 — дисперсия случайных величин уи определяемая по фор муле:
|
тп |
п |
|
_ |
m |
m |
|
|
S |
S |
d f i v - Y o t ) * |
S |
(«/—!) ^ + £ |
п ,(К ,-Г 0/)2 |
|
|
.2 *= 1 v=l |
|
|
1= 1 |
1= 1 |
(178) |
|
|
Ь |
m |
|
|
|
|
+ ( m - 2 ) |
|
|
S |
|
, l < - 2 |
|
|
|
|
|
1=1 |
|
|
|
|
|
|
Если an |
b имеют нормальное распределение, то величины t' = |
|||||
= |
g~ -- и t" = |
|
подчиняются закону распределения Стюдента |
||||
|
m |
|
|
|
|
|
|
с |
S /г, — 2 степенями |
свободы. Поэтому, |
пользуясь таблицей |
||||
|
г=1 |
|
|
|
|
|
|
приложения 2, можно определить точность приближенных ра венств а ^ а и Ь г ^ Р в долях sa и sb, т. е. еа = t’sa и гь = предварительно задавшись вероятностью а. Например, задавшись
вероятностью а |
= 0,95, имеем для |
|
= 20 по таблице приложе |
|
ния 2 при k = |
20 — 2 = 18 1 = 2,1. Следовательно, еа = 2,lsa |
|||
и гь — 2,ls6. Доверительные интервалы для а и р будут равны: |
||||
|
а — 2,lsa < |
а < |
а + |
2,lsa; |
|
b — 2,lsft < |
Р < |
6 + |
2,1s*- |
Все необходимые данные для вычислений, относящихся к |
ре |
|
грессивному анализу, удобно свести в табл. 34. |
33. |
|
Столбцы 1, 2, 3, 7 заполняются на основании данных табл. |
||
Столбец 13 заполняется |
после вычисления У0/ по формуле У0/ = |
|
= а + Ьх[. Заполнение |
остальных столбцов ясно из табл. |
34. |
по