книги / Основы научных исследований
..pdfСледовательно,
|
lga -f blge = 1,183; |
|
lga 4,56 Ige = 2,070, |
откуда |
6 = 0 ,887/(3,51ge) =0,579; l g a = l , 183—0,254= |
=0,929; |
a= l,85 . Окончательно эмпирическая формула |
получит вид
у = 1,85-е0-579*.
Рис. 10.7. Подбор эмпирической характеристики:
а — эмпирическая; б — спрямленная
При подборе эмпирических формул широко исполь зуются полиномы
у = А0 + Л, х + Агх2+ А3х3 + ...+ А1гхп, (10.37)
где А0, А и .., Ап — постоянные коэффициенты. Полино мами можно аппроксимировать любые результаты изме рений, если они графически выражаются непрерывными функциями. Особо ценным является то, что даже при не известном точном выражении функции (10.37) можно оп ределить значения коэффициентов А. Для определения коэффициентов А кроме графического метода, изложен ного выше, применяют методы средних и наименьших квадратов.
Метод средних квадратов основан на следующем по ложении. По экспериментальным точкам можно постро ить несколько плавных кривых. Наилучшей будет та кривая, у которой разностные отклонения оказываются наименьшими, т. е. 2 е « 0 . Порядок расчета коэффициен тов полинома сводится к следующему. Определяется чнс-
301
ло членов ряда (10.37), которое обычно принимают не более 3...4. В принятое выражение последовательно под ставляют координаты х и у нескольких (т) эксперимен тальных точек и получают систему из т уравнений. Каж дое уравнение приравнивают соответствующему откло нению:
А0+ А, х, |
+ А2х\ + ...+ Апх? — f/, = |
е,; |
||
А0+ |
А, х2+ |
А2 х\ + ...+ |
Ап*3 - у2= е2; |
(10.38) |
А0+ |
А1Хт + Л2 Х1 + - + |
Ап Х1 ~ Ут = |
|
Число точек, т. е. число уравнений, должно быть не меньше числа коэффициентов Л, что позволит их вычис лить путем решения системы (10.38).
Разбивают систему начальных уравнений (10.38) по следовательно сверху вниз на группы, число которых должно быть равно количеству коэффициентов Ло. В каж дой группе складывают уравнения и получают новую систему уравнений, равную количеству групп (обычно 2...3). Решая систему, вычисляют коэффициенты Л.
Метод средних обладает высокой точностью, если чис ло точек достаточно велико (не менее 3...4). Однако сте пень точности можно повысить, если начальные условия сгруппировать по 2...3 варианта и вычислить для каждо го варианта эмпирическую формулу. Предпочтение сле дует отдать той формуле, у которой 2e2=m in. Пусть, на пример, выполнено семь измерений:
4 |
5 |
6 |
7 |
8 |
9 |
10 |
10,2 |
6 ,7 |
4 , 8 |
3 ,6 |
2 , 7 |
2 ,1 |
1 ,7 |
Для подбора эмпирической формулы можно выбрать полином
У —А) "Ь Ai "Ь Агх2.
Путем подстановки в это уравнение значений измере ний систему начальных уравнений можно разделить на три группы: 1...2, 3...4; 5...7 в виде
1. Л0+4Л,+16Л2—10,2=еь
2. Л0+5Л1-1-25Л2— 6,7=62;
3.Л о + б Л ^ З б Л г — 4 ,8 = ез;
4.Л0 + 7 Л1 + 4 9 Л2 — 3,6=в4;
5.Ло+ 8Л1+64Л2 — 2 ,7 = 6 5 ;
6.Ло+ЭЛ^вМг— 2,1 =бв;
302
7. 4 0+104, + 10042—1,7=е7.
Сложение уравнений в каждой подгруппе дает
1 - |
я группа 2 4 0 + 9 /4 ,-1-4 1 /4 2 = 1 6 ,9 ; |
2 - |
я группа 240+134|+ 8542=8,4; |
3- |
я группа 340+ 274 I+2442=6,5. |
Определение из этих выражений коэффициентов 4 0, /4, и 4 2 приводит к эмпирической формуле </=26,168— —5,2168*+0,2811x2.
Метод средних квадратов может быть применен для различных кривых после их выравнивания. Пусть, напри мер, имеется восемь измерений:
3 |
6 |
9 |
12 |
15 |
18 |
21 |
24 |
57,6 |
41,9 |
31,0 |
22,7 |
16,6 |
12,2 |
8,9 |
6,5 |
Анализ кривой в системе прямоугольных |
координат |
дает возможность применить формулу (10.30)
у = ае~Ьх.
Произведем выравнивание путем замены переменных Y=lgy, Х=х/2,303. Тогда У =4+В Х , где 4 = lg a , В = = Ь. Так как необходимо определить два параметра, то все измерения делятся на две группы по четыре измере ния. Это приводит к уравнениям:
1,7604 = 4 + |
2.303 В; |
1,2201 = 4 + 2,303 |
В\ |
||
1,6222 = 4 + |
6 |
-В |
1,0864 = 4 + —— |
В; |
|
|
2.303 |
|
2.303 |
|
|
1,4914 = 4 + |
9 |
В |
0,9494 = 4 + — —В; |
||
2.303 |
|||||
|
|
2.303 |
|
||
1,3560 = 4 + |
12 |
В |
0,8129 = 4 -|— |
В; |
|
|
2,303 |
|
2.303 |
|
|
6,2300 = 44 + |
|
В; |
4,0688 = 44 + |
В. |
|
|
2,303 |
2,303 |
|||
После суммирования по группам можно получить си |
|||||
стему двух уравнений с двумя неизвестными 4 |
и В, ре |
шение которых дает: 4 = 1,8952; я=78,56; В = —0,1037; Ь = —0,1037. Окончательно </=78,56 е~°<1037х.
Хорошие результаты при определении параметров за данного уравнения дает использование м е т о д а н а и м е н ь ш и х к в а д р а т о в . Суть этого метода заключа ется в том, что если все измерения функций уи </2, .... уп
303
произведены с одинаковой точностью и распределенные величины ошибок измерения соответствуют нормальному закону, то параметры исследуемого уравнения опреде лятся из условия, при котором сумма квадратов откло нений измеренных значений от расчетных принимает наи меньшее значение. Для нахождения неизвестных пара метров (аь а2, ..., ап) необходимо решить систему линей ных уравнений:
у{ = di + а2 ui + ...+ ап zt;
y2 = ai x2 + a2u2+ ...+ an г2\ |
(10.39) |
У п — а 1 х т + а 2 и т + • • • + а п Zm > |
|
где у ь уп — частные значения измеренных |
величин |
функции у; х, и, г — переменные величины. Эту систему приводят к системе линейных уравнений путем умноже ния каждого уравнения соответственно на х\...хт и по следующего их сложения, затем умножения соответст венно на «1, .... ит. Это позволяет получить так называе мую систему нормальных уравнений
т |
yx = at |
2 |
|
1 |
1 |
t т |
т |
т |
2 |
хх + а2 ^ х и + ...+ ап ^ х г ; |
|
|
1 |
1 |
т |
|
т |
т |
т |
'^ у и = |
|
'^ и х + |
а2 |
+ ...+ an ^^uz\ (1 0 .4 0 ) |
1 |
1 |
1 |
|
i |
т |
|
т |
т |
т |
t |
i |
2 г*t + |
а* 2 |
2 Ы + '" + а л 21 22' |
решение которой и дает искомые коэффициенты.
Пусть, например, необходимо определить коэффици енты Й1 и а2 в уравнении kp=a\-\-a2ц. Так как требуется определить два параметра, то система уравнений может быть представлена в виде двух уравнений у = а .\Х \-\-а 2и2 nyu2= a2xiu2+a2ul, где y = k p\ х, = 1 ; л:2 = ц .
Так как уравнения линейные, можно ограничиться че тырьмя сериями опытов. Если они сведены в табл. 1 0 .8 , то систему нормальных уравнений можно записать в ви де 5,48=40,4-1100а2; 1519= 1100^ 4307 350а2, решение которых дает а, =0,78; а2=0,0025. Следовательно, эмпи рическая формула получит вид йр= 0 ,78+0,0025 ц.
Метод наименьших квадратов обеспечивает достаточ
ен
|
|
|
Т а б л и ц а 10.8 |
|
Результаты опытов |
|
|
и г = ц |
!/ = *р |
|
J/V |
230 |
1,26 |
52900 |
289,8 |
255 |
1,32 |
65025 |
336,6 |
295 |
1,40 |
87025 |
413,0 |
320 |
1,50 |
102400 |
480,0 |
1100 |
5,48 |
307350 |
1519,4 |
но надежные результаты. При этом степень точности коэффициентов Л в (10.37) должна быть такой, чтобы вы численные значения у совпадали со значениями в исход ных табличных значениях. Это требует вычислять зна чения А тем точнее, чем выше индекс Л, т. е. А\ должно быть точнее (больше число десятичных знаков), чем Л3; Лз —точнее, чем Л2, и т. д. Для вычисления коэффициен тов Л методом наименьших квадратов необходимо поль зоваться типовыми программами для ЭВМ.
10.4. Регрессионный анализ
Под регрессионным анализом понимают исследование закономерностей связи между явлениями (процессами), которые зависят от многих, иногда неизвестных, факто ров. Часто между переменными х и у существует связь, но не вполне определенная, при которой одному значе нию х соответствует несколько значений (совокупность) у. В таких случаях связь называют регрессионной. Таким образом, функция y= f(x) является регрессионной (кор реляционной), если каждому значению аргумента соот ветствует статистический ряд распределения у. Следова тельно, регрессионные зависимости характеризуются ве роятностными или стохастическими связями. Поэтому установление регрессионных зависимостей между вели чинами у и х возможно лишь тогда, когда выполнимы статистические измерения.
Статистическиё зависимости описываются математи ческими моделями процесса, т. е. регрессионными выра жениями, связывающими независимые значения х (фак торы) с зависимой переменой у (результативный приз нак, функция цели, отклик). Модель по возможности должна быть простой и адекватной. Например, модуль упругости материала Е зависит от его плотности р так,
3 0 5
что с возрастанием плотности модуль упругости матери* ала увеличивается. Но выявить эту закономерность мож но только при наличии большого количества измерений, так как при исследованиях каждой отдельной парной связи в зависимости E = f ( р) наблюдаются большие от клонения.
Суть регрессионного анализа сводится к установле нию уравнения регрессии, т. е. вида кривой между слу чайными величинами (аргументами х и функцией у), оценке тесноты связей между ними, достоверности и аде кватности результатов измерений.
Чтобы предварительно определить наличие такой свя зи между х и у, наносят точки на график и строят так на зываемое корреляционное поле (рис. 10.8). По тесноте
группирования точек вокруг прямой или кривой линии, по наклону линии можно визуально судить о наличии корреляционной связи. Так, из рис. 10.8, а видно, что экс периментальные данные имеют определенную связь между х и у, а измерения, приведенные на рис. 1 0 .8 , б, такой связи не показывают.
Корреляционное поле характеризует вид связи между х и у. По форме поля можно ориентировочно судить о форме графика, характеризующего прямолинейную или криволинейную зависимости. Даже для вполне выражен ной формы корреляционного поля вследствие статистиче ского характера связи исследуемого явления одно значе ние х может иметь несколько значений у. Если на корре ляционном поле осреднить точки, т. е. для каждого
значения xi определить и соединить точки у,-, то можно будет получить ломаную линию, называемую экспери
306
ментальной регрессионной зависимостью (линией). На личие ломаной линии объясняется погрешностями изме рений, недостаточным количеством измерений, физичес кой сущностью исследуемого явления и др. Если на_кор
реляционном поле провести плавную линию между*/,,ко торая равноудалена от них, то получится новая теорети ческая регрессионная зависимость —линия АБ (см. рис. 1 0 .8 , а).
Различают однофакторные (парные) и многофактор ные регрессионные зависимости. П а р н а я р е г р е с с и я при парной зависимости может быть аппроксимирована прямой линией, параболой, гиперболой, логарифмичес кой, степенной или показательной функцией, полиномом идр. Двухфакторное поле можно аппроксимировать пло скостью, параболлоидом второго порядка, гиперболои дом. Для переменных факторов связь может быть уста новлена с помощью л-мерного пространства уравнения ми второго порядка:
У = ьо + 2bi Х‘ + 2blJ Х‘ Х} + 2Ьн Х*’ *10-41*
* |
/ |
* |
где у —функция цели |
(отклика) |
многофакторных пере |
менных; Хг — независимые факторы; bi— коэффициенты регрессии, характеризующие влияние фактора х,- на функ цию цели; Ьц — коэффициенты, характеризующие двой ное влияние факторов xi и х/ на функцию цели.
При построении теоретической регрессионной зависи мости оптимальной является такая функция, в которой соблюдаются условия наименьших квадратов 2 (у,-—
—*/)2 =m in, где */,-— фактические ординаты поля; у — среднее значение ординаты с абсциссой х. Поле корреля ции аппроксимируется уравнением прямой у=а-\-Ьх. Линию регрессии рассчитывают из условий наименьших квадратов. При этом кривая АБ (см. рис. 10.8, а) наилуч шим образом выравнивает значения постоянных коэффи циентов а и Ь, т. е. коэффициентов уравнения регрессии. Их вычисляют по выражениям
b = (tiZxy — 2 |
х2 у)/л2 х2 — (2 х)2, |
(10.42) |
|
а ~ у — Ьх = |
& ----Ь— . |
(10.43) |
|
|
п |
п |
|
Критерием близости корреляционной зависимости междух и у к линейной функциональной зависимости яв
307
ляется коэффициент парной или просто коэффициент корреляции г, показывающий степень тесноты связи х и у и определяемый отношением
riSjCj y t — 2x t 2yt
(10.44)
где п — число измерений. Значение коэффициента корре ляции всегда меньше единицы. При г= 1,0 х и у связаны функциональной связью (в данном случае линейной), т. е. каждому значению х соответствует только одно зна чение у. Если r< 1, то линейной связи не существует. При г= 0 линейная корреляционная связь между х н у отсут ствует, но может существовать нелинейная регрессия. Обычно считают тесноту связи удовлетворительной при
0,5; хорошей при г= 0,8...0,85. Для определения про цента разброса (изменчивости) искомой функции у от носительно ее среднего значения, определяемого измен чивостью фактора х, вычисляют коэффициент детерми нации
(10.45)
Уравнение регрессии прямой можно представить вы ражением
|
|
У = |
У+ г -^2- (х — х). |
(Ю.4б) |
|||||
|
|
|
|
|
° х |
|
|
|
|
Пусть, например, имеется статистический ряд парных |
|||||||||
измерений: |
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
8 |
11 |
14 |
16 |
21 |
26 |
27 |
32 |
34 |
41 |
по которому можно найти уравнение прямолинейной рег рессии, оценить тесноту связей и оценить степень досто верности. Расчет целесообразно вести в табличной фор ме (табл. 10.9).
В табл. 10.10 приведена сходимость эксперименталь ной и теоретической регрессии.
308
|
|
|
|
|
|
|
|
|
Та б л и ц а |
10.9 |
|
|
|
|
|
|
Расчет уравнения регрессии |
|
|
|
|||
|
|
|
|
|
|
|
м |
|
|
|
■? |
|
|
|
|
|
|
1х |
|
|
|
3 |
|
|
|
|
|
IX |
1=*> |
|
|
|
|
\Ч |
|
|
|
|
|
1 |
1 |
|
|
|
|||
|
|
|
|
1 |
1 |
|
|
|
1 |
||
х |
|
|
|
X |
|
ч |
|
*х |
* |
а |
ч^ |
|
|
|
|
|
|
|
|||||
1 |
|
8 |
—4,5 |
—15 |
20,25 |
225 |
1 |
64 |
8 |
67,5 |
|
2 |
|
11 |
- |
3,5 |
—12 |
12,25 |
144 |
4 |
121 |
22 |
42,0 |
3 |
|
14 |
—2,5 |
—9 |
6,25 |
81 |
9 |
196 |
42 |
22,5 |
|
4 |
|
16 |
- |
1.5 |
—7 |
2,25 |
49 |
16 |
256 |
64 |
10,5 |
5 |
|
21 |
—0,5 |
—2 |
0,25 |
4 |
25 |
441 |
105 |
1,0 |
|
6 |
|
26 |
|
0,5 |
+ 3 |
0,25 |
9 |
36 |
676 |
156 |
1,5 |
7 |
|
27 |
|
1,5 |
+ 4 |
2,25 |
16 |
49 |
729 |
189 |
6,0 |
8 |
|
32 |
|
2,5 |
+ 9 |
6,25 |
81 |
64 |
1024 |
256 |
22,5 |
9 |
|
34 |
|
3,5 |
+11 |
12,25 |
121 |
81 |
1156 |
306 |
31,5 |
10 |
|
41 |
|
4,5 |
+ 18 |
20,25 |
324 |
100 |
1681 |
410 |
81,0 |
55 |
230 |
|
— |
— |
82,50 |
1054 |
385 |
6344 |
1558 |
286,0 |
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
10.10 |
|
|
Сходимость экспериментальной и теоретической регрессии |
|
|||||||||
У |
8 |
11 |
|
14 |
16 |
21 |
26 |
27 |
32 |
34 |
41 |
Уэ |
7,1 |
10,6 |
14,2 |
17,7 |
21,8 |
24,8 |
28,3 |
31,9 |
35,4 |
39,0 |
Коэффициент корреляции согласно (10.54)
т = • |
10-1558 — 55-230 |
= —0,99. |
||
(10 • 385 — 55s) (10 • 6344 — 230г) |
||||
Из (10.52) и (10.53) |
|
|
||
. |
10-1558 — 55-230 |
= 3,55; |
||
|
|
10-385 — 55? |
|
|
а = — |
— 3 , 5 5 — |
— 3 , 4 8 |
||
|
|
10 |
10 |
|
Уравнение регрессии имеет вид |
|
|||
|
|
у = 3 , 4 8 |
3 , 5 5 л; |
Как видно из расчетов, сходимость оказалась хоро шей.
309
Коэффициент детерминации, найденный по формуле (10.45), составляет £д=0,992=0,98, что означает, что 98 % разброса определяется изменчивостью лг, а 2 % другими причинами, т. е. изменчивость функции у почти полностью характеризуется разбросом (природой) фак тора X.
На практике часто возникает потребность в установ
лении связи между у и многими |
параметрами х и ...,Хп |
на основе м н о г о ф а к т о р н о й |
р е г р е с с и и . |
Многофакторные теоретические регрессии аппрокси мируются полиномами первого (10.37) или второго (10.41) порядка. Математические модели характеризуют стохастический процесс изучаемого явления, уравнение
регрессии определяет |
систематическую, |
а ошибки раз |
броса — случайную составляющие. |
|
|
Теоретическую модель множественной регрессии мож |
||
но получить методами |
математического |
планирования, |
т. е. активным экспериментом, а также |
пассивным, ког |
да точки факторного пространства выбираются в про цессе эксперимента произвольно.
1 0 .5 . Оценка адекватности теоретических решений
В результате эксперимента получают статистический ряд обычно парных, одиофакторных (xit yi) или многофак торных '(0 /, Ь/, cit...) измерений. Статистические измере ния подвергают обработке и анализу, подбирают эмпи рические формулы и устанавливают их достоверность.
Перед подбором эмпирических формул необходимо еще раз убедиться в достоверности эксперимента, окон чательно проверить воспроизводимость результатов по критерию Кохрена. Оценка пригодности гипотезы иссле дования, а также теоретических данных на адекватность, т. е. соответствие теоретической кривой эксперименталь ным данным, необходима во всех случаях на стадии анализа теоретико-экспериментальных исследований. Методы оценки адекватности основаны на использова нии доверительных интервалов, позволяющих с задан ной доверительной вероятностью определять искомые значения оцениваемого параметра. Суть такой проверки состоит в сопоставлении полученной или предполагае мой теоретической функции y=f ( x ) с результатами из мерений. В практике оценки адекватности применяют различные статистические критерии согласия.
Одним из таких критериев является к р и т е р и й Фи*
310