Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Основы научных исследований

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
12.77 Mб
Скачать

Следовательно,

 

lga -f blge = 1,183;

 

lga 4,56 Ige = 2,070,

откуда

6 = 0 ,887/(3,51ge) =0,579; l g a = l , 183—0,254=

=0,929;

a= l,85 . Окончательно эмпирическая формула

получит вид

у = 1,85-е0-579*.

Рис. 10.7. Подбор эмпирической характеристики:

а — эмпирическая; б — спрямленная

При подборе эмпирических формул широко исполь­ зуются полиномы

у = А0 + Л, х + Агх2+ А3х3 + ...+ А1гхп, (10.37)

где А0, А и .., Ап — постоянные коэффициенты. Полино­ мами можно аппроксимировать любые результаты изме­ рений, если они графически выражаются непрерывными функциями. Особо ценным является то, что даже при не­ известном точном выражении функции (10.37) можно оп­ ределить значения коэффициентов А. Для определения коэффициентов А кроме графического метода, изложен­ ного выше, применяют методы средних и наименьших квадратов.

Метод средних квадратов основан на следующем по­ ложении. По экспериментальным точкам можно постро­ ить несколько плавных кривых. Наилучшей будет та кривая, у которой разностные отклонения оказываются наименьшими, т. е. 2 е « 0 . Порядок расчета коэффициен­ тов полинома сводится к следующему. Определяется чнс-

301

ло членов ряда (10.37), которое обычно принимают не более 3...4. В принятое выражение последовательно под­ ставляют координаты х и у нескольких (т) эксперимен­ тальных точек и получают систему из т уравнений. Каж­ дое уравнение приравнивают соответствующему откло­ нению:

А0+ А, х,

+ А2х\ + ...+ Апх? — f/, =

е,;

А0+

А, х2+

А2 х\ + ...+

Ап*3 - у2= е2;

(10.38)

А0+

А1Хт + Л2 Х1 + - +

Ап Х1 ~ Ут =

 

Число точек, т. е. число уравнений, должно быть не меньше числа коэффициентов Л, что позволит их вычис­ лить путем решения системы (10.38).

Разбивают систему начальных уравнений (10.38) по­ следовательно сверху вниз на группы, число которых должно быть равно количеству коэффициентов Ло. В каж­ дой группе складывают уравнения и получают новую систему уравнений, равную количеству групп (обычно 2...3). Решая систему, вычисляют коэффициенты Л.

Метод средних обладает высокой точностью, если чис­ ло точек достаточно велико (не менее 3...4). Однако сте­ пень точности можно повысить, если начальные условия сгруппировать по 2...3 варианта и вычислить для каждо­ го варианта эмпирическую формулу. Предпочтение сле­ дует отдать той формуле, у которой 2e2=m in. Пусть, на­ пример, выполнено семь измерений:

4

5

6

7

8

9

10

10,2

6 ,7

4 , 8

3 ,6

2 , 7

2 ,1

1 ,7

Для подбора эмпирической формулы можно выбрать полином

У А)Ai Агх2.

Путем подстановки в это уравнение значений измере­ ний систему начальных уравнений можно разделить на три группы: 1...2, 3...4; 5...7 в виде

1. Л0+4Л,+16Л2—10,2=еь

2. Л0+5Л1-1-25Л2— 6,7=62;

3.Л о + б Л ^ З б Л г — 4 ,8 = ез;

4.Л0 + 7 Л1 + 4 9 Л2 — 3,6=в4;

5.Ло+ 8Л1+64Л2 2 ,7 = 6 5 ;

6.Ло+ЭЛ^вМг— 2,1 =бв;

302

7. 4 0+104, + 10042—1,7=е7.

Сложение уравнений в каждой подгруппе дает

1 -

я группа 2 4 0 + 9 /4 ,-1-4 1 /4 2 = 1 6 ,9 ;

2 -

я группа 240+134|+ 8542=8,4;

3-

я группа 340+ 274 I+2442=6,5.

Определение из этих выражений коэффициентов 4 0, /4, и 4 2 приводит к эмпирической формуле </=26,168— —5,2168*+0,2811x2.

Метод средних квадратов может быть применен для различных кривых после их выравнивания. Пусть, напри­ мер, имеется восемь измерений:

3

6

9

12

15

18

21

24

57,6

41,9

31,0

22,7

16,6

12,2

8,9

6,5

Анализ кривой в системе прямоугольных

координат

дает возможность применить формулу (10.30)

у = ае~Ьх.

Произведем выравнивание путем замены переменных Y=lgy, Х=х/2,303. Тогда У =4+В Х , где 4 = lg a , В = = Ь. Так как необходимо определить два параметра, то все измерения делятся на две группы по четыре измере­ ния. Это приводит к уравнениям:

1,7604 = 4 +

2.303 В;

1,2201 = 4 + 2,303

В\

1,6222 = 4 +

6

1,0864 = 4 + ——

В;

 

2.303

 

2.303

 

1,4914 = 4 +

9

В

0,9494 = 4 + — —В;

2.303

 

 

2.303

 

1,3560 = 4 +

12

В

0,8129 = 4 -|—

В;

 

2,303

 

2.303

 

6,2300 = 44 +

 

В;

4,0688 = 44 +

В.

 

2,303

2,303

После суммирования по группам можно получить си­

стему двух уравнений с двумя неизвестными 4

и В, ре­

шение которых дает: 4 = 1,8952; я=78,56; В = —0,1037; Ь = —0,1037. Окончательно </=78,56 е~°<1037х.

Хорошие результаты при определении параметров за­ данного уравнения дает использование м е т о д а н а и ­ м е н ь ш и х к в а д р а т о в . Суть этого метода заключа­ ется в том, что если все измерения функций уи </2, .... уп

303

произведены с одинаковой точностью и распределенные величины ошибок измерения соответствуют нормальному закону, то параметры исследуемого уравнения опреде­ лятся из условия, при котором сумма квадратов откло­ нений измеренных значений от расчетных принимает наи­ меньшее значение. Для нахождения неизвестных пара­ метров (аь а2, ..., ап) необходимо решить систему линей­ ных уравнений:

у{ = di + а2 ui + ...+ ап zt;

y2 = ai x2 + a2u2+ ...+ an г2\

(10.39)

У п а 1 х т + а 2 и т + • • • + а п Zm >

 

где у ь уп — частные значения измеренных

величин

функции у; х, и, г — переменные величины. Эту систему приводят к системе линейных уравнений путем умноже­ ния каждого уравнения соответственно на х\...хт и по­ следующего их сложения, затем умножения соответст­ венно на «1, .... ит. Это позволяет получить так называе­ мую систему нормальных уравнений

т

yx = at

2

1

1

t т

т

т

2

хх + а2 ^ х и + ...+ ап ^ х г ;

 

1

1

т

 

т

т

т

'^ у и =

 

'^ и х +

а2

+ ...+ an ^^uz\ (1 0 .4 0 )

1

1

1

 

i

т

 

т

т

т

t

i

2 г*t +

а* 2

2 Ы + '" + а л 21 22'

решение которой и дает искомые коэффициенты.

Пусть, например, необходимо определить коэффици­ енты Й1 и а2 в уравнении kp=a\-\-a2ц. Так как требуется определить два параметра, то система уравнений может быть представлена в виде двух уравнений у = а .\Х \-\-а 2и2 nyu2= a2xiu2+a2ul, где y = k p\ х, = 1 ; л:2 = ц .

Так как уравнения линейные, можно ограничиться че­ тырьмя сериями опытов. Если они сведены в табл. 1 0 .8 , то систему нормальных уравнений можно записать в ви­ де 5,48=40,4-1100а2; 1519= 1100^ 4307 350а2, решение которых дает а, =0,78; а2=0,0025. Следовательно, эмпи­ рическая формула получит вид йр= 0 ,78+0,0025 ц.

Метод наименьших квадратов обеспечивает достаточ­

ен

 

 

 

Т а б л и ц а 10.8

 

Результаты опытов

 

 

и г = ц

!/ =

 

J/V

230

1,26

52900

289,8

255

1,32

65025

336,6

295

1,40

87025

413,0

320

1,50

102400

480,0

1100

5,48

307350

1519,4

но надежные результаты. При этом степень точности коэффициентов Л в (10.37) должна быть такой, чтобы вы­ численные значения у совпадали со значениями в исход­ ных табличных значениях. Это требует вычислять зна­ чения А тем точнее, чем выше индекс Л, т. е. А\ должно быть точнее (больше число десятичных знаков), чем Л3; Лз —точнее, чем Л2, и т. д. Для вычисления коэффициен­ тов Л методом наименьших квадратов необходимо поль­ зоваться типовыми программами для ЭВМ.

10.4. Регрессионный анализ

Под регрессионным анализом понимают исследование закономерностей связи между явлениями (процессами), которые зависят от многих, иногда неизвестных, факто­ ров. Часто между переменными х и у существует связь, но не вполне определенная, при которой одному значе­ нию х соответствует несколько значений (совокупность) у. В таких случаях связь называют регрессионной. Таким образом, функция y= f(x) является регрессионной (кор­ реляционной), если каждому значению аргумента соот­ ветствует статистический ряд распределения у. Следова­ тельно, регрессионные зависимости характеризуются ве­ роятностными или стохастическими связями. Поэтому установление регрессионных зависимостей между вели­ чинами у и х возможно лишь тогда, когда выполнимы статистические измерения.

Статистическиё зависимости описываются математи­ ческими моделями процесса, т. е. регрессионными выра­ жениями, связывающими независимые значения х (фак­ торы) с зависимой переменой у (результативный приз­ нак, функция цели, отклик). Модель по возможности должна быть простой и адекватной. Например, модуль упругости материала Е зависит от его плотности р так,

3 0 5

что с возрастанием плотности модуль упругости матери* ала увеличивается. Но выявить эту закономерность мож­ но только при наличии большого количества измерений, так как при исследованиях каждой отдельной парной связи в зависимости E = f ( р) наблюдаются большие от­ клонения.

Суть регрессионного анализа сводится к установле­ нию уравнения регрессии, т. е. вида кривой между слу­ чайными величинами (аргументами х и функцией у), оценке тесноты связей между ними, достоверности и аде­ кватности результатов измерений.

Чтобы предварительно определить наличие такой свя­ зи между х и у, наносят точки на график и строят так на­ зываемое корреляционное поле (рис. 10.8). По тесноте

группирования точек вокруг прямой или кривой линии, по наклону линии можно визуально судить о наличии корреляционной связи. Так, из рис. 10.8, а видно, что экс­ периментальные данные имеют определенную связь между х и у, а измерения, приведенные на рис. 1 0 .8 , б, такой связи не показывают.

Корреляционное поле характеризует вид связи между х и у. По форме поля можно ориентировочно судить о форме графика, характеризующего прямолинейную или криволинейную зависимости. Даже для вполне выражен­ ной формы корреляционного поля вследствие статистиче­ ского характера связи исследуемого явления одно значе­ ние х может иметь несколько значений у. Если на корре­ ляционном поле осреднить точки, т. е. для каждого

значения xi определить и соединить точки у,-, то можно будет получить ломаную линию, называемую экспери­

306

ментальной регрессионной зависимостью (линией). На­ личие ломаной линии объясняется погрешностями изме­ рений, недостаточным количеством измерений, физичес­ кой сущностью исследуемого явления и др. Если на_кор­

реляционном поле провести плавную линию между*/,,ко­ торая равноудалена от них, то получится новая теорети­ ческая регрессионная зависимость —линия АБ (см. рис. 1 0 .8 , а).

Различают однофакторные (парные) и многофактор­ ные регрессионные зависимости. П а р н а я р е г р е с с и я при парной зависимости может быть аппроксимирована прямой линией, параболой, гиперболой, логарифмичес­ кой, степенной или показательной функцией, полиномом идр. Двухфакторное поле можно аппроксимировать пло­ скостью, параболлоидом второго порядка, гиперболои­ дом. Для переменных факторов связь может быть уста­ новлена с помощью л-мерного пространства уравнения­ ми второго порядка:

У = ьо + 2bi Х‘ + 2blJ Х‘ Х} + 2Ьн Х*’ *10-41*

*

/

*

где у —функция цели

(отклика)

многофакторных пере­

менных; Хг — независимые факторы; bi— коэффициенты регрессии, характеризующие влияние фактора х,- на функ­ цию цели; Ьц — коэффициенты, характеризующие двой­ ное влияние факторов xi и х/ на функцию цели.

При построении теоретической регрессионной зависи­ мости оптимальной является такая функция, в которой соблюдаются условия наименьших квадратов 2 (у,-—

—*/)2 =m in, где */,-— фактические ординаты поля; у — среднее значение ординаты с абсциссой х. Поле корреля­ ции аппроксимируется уравнением прямой у=а-\-Ьх. Линию регрессии рассчитывают из условий наименьших квадратов. При этом кривая АБ (см. рис. 10.8, а) наилуч­ шим образом выравнивает значения постоянных коэффи­ циентов а и Ь, т. е. коэффициентов уравнения регрессии. Их вычисляют по выражениям

b = (tiZxy 2

х2 у)/л2 х2 — (2 х)2,

(10.42)

а ~ у Ьх =

& ----Ь— .

(10.43)

 

п

п

 

Критерием близости корреляционной зависимости междух и у к линейной функциональной зависимости яв­

307

ляется коэффициент парной или просто коэффициент корреляции г, показывающий степень тесноты связи х и у и определяемый отношением

riSjCj y t 2x t 2yt

(10.44)

где п — число измерений. Значение коэффициента корре­ ляции всегда меньше единицы. При г= 1,0 х и у связаны функциональной связью (в данном случае линейной), т. е. каждому значению х соответствует только одно зна­ чение у. Если r< 1, то линейной связи не существует. При г= 0 линейная корреляционная связь между х н у отсут­ ствует, но может существовать нелинейная регрессия. Обычно считают тесноту связи удовлетворительной при

0,5; хорошей при г= 0,8...0,85. Для определения про­ цента разброса (изменчивости) искомой функции у от­ носительно ее среднего значения, определяемого измен­ чивостью фактора х, вычисляют коэффициент детерми­ нации

(10.45)

Уравнение регрессии прямой можно представить вы­ ражением

 

 

У =

У+ г -^2- (х — х).

(Ю.4б)

 

 

 

 

 

° х

 

 

 

 

Пусть, например, имеется статистический ряд парных

измерений:

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

8

11

14

16

21

26

27

32

34

41

по которому можно найти уравнение прямолинейной рег­ рессии, оценить тесноту связей и оценить степень досто­ верности. Расчет целесообразно вести в табличной фор­ ме (табл. 10.9).

В табл. 10.10 приведена сходимость эксперименталь­ ной и теоретической регрессии.

308

 

 

 

 

 

 

 

 

 

Та б л и ц а

10.9

 

 

 

 

 

Расчет уравнения регрессии

 

 

 

 

 

 

 

 

 

 

м

 

 

 

■?

 

 

 

 

 

 

1х

 

 

 

3

 

 

 

 

IX

1=*>

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

1

1

 

 

 

1

х

 

 

 

X

 

ч

 

*

а

ч^

 

 

 

 

 

 

 

1

 

8

—4,5

—15

20,25

225

1

64

8

67,5

2

 

11

-

3,5

—12

12,25

144

4

121

22

42,0

3

 

14

—2,5

—9

6,25

81

9

196

42

22,5

4

 

16

-

1.5

—7

2,25

49

16

256

64

10,5

5

 

21

—0,5

—2

0,25

4

25

441

105

1,0

6

 

26

 

0,5

+ 3

0,25

9

36

676

156

1,5

7

 

27

 

1,5

+ 4

2,25

16

49

729

189

6,0

8

 

32

 

2,5

+ 9

6,25

81

64

1024

256

22,5

9

 

34

 

3,5

+11

12,25

121

81

1156

306

31,5

10

 

41

 

4,5

+ 18

20,25

324

100

1681

410

81,0

55

230

 

82,50

1054

385

6344

1558

286,0

 

 

 

 

 

 

 

 

 

Т а б л и ц а

10.10

 

Сходимость экспериментальной и теоретической регрессии

 

У

8

11

 

14

16

21

26

27

32

34

41

Уэ

7,1

10,6

14,2

17,7

21,8

24,8

28,3

31,9

35,4

39,0

Коэффициент корреляции согласно (10.54)

т = •

10-1558 — 55-230

= —0,99.

(10 • 385 — 55s) (10 • 6344 — 230г)

Из (10.52) и (10.53)

 

 

.

10-1558 — 55-230

= 3,55;

 

 

10-385 — 55?

 

 

а = —

3 , 5 5 —

— 3 , 4 8

 

 

10

10

 

Уравнение регрессии имеет вид

 

 

 

у = 3 , 4 8

3 , 5 5 л;

Как видно из расчетов, сходимость оказалась хоро­ шей.

309

Коэффициент детерминации, найденный по формуле (10.45), составляет £д=0,992=0,98, что означает, что 98 % разброса определяется изменчивостью лг, а 2 % другими причинами, т. е. изменчивость функции у почти полностью характеризуется разбросом (природой) фак­ тора X.

На практике часто возникает потребность в установ­

лении связи между у и многими

параметрами х и ...,Хп

на основе м н о г о ф а к т о р н о й

р е г р е с с и и .

Многофакторные теоретические регрессии аппрокси­ мируются полиномами первого (10.37) или второго (10.41) порядка. Математические модели характеризуют стохастический процесс изучаемого явления, уравнение

регрессии определяет

систематическую,

а ошибки раз­

броса — случайную составляющие.

 

Теоретическую модель множественной регрессии мож­

но получить методами

математического

планирования,

т. е. активным экспериментом, а также

пассивным, ког­

да точки факторного пространства выбираются в про­ цессе эксперимента произвольно.

1 0 .5 . Оценка адекватности теоретических решений

В результате эксперимента получают статистический ряд обычно парных, одиофакторных (xit yi) или многофак­ торных '(0 /, Ь/, cit...) измерений. Статистические измере­ ния подвергают обработке и анализу, подбирают эмпи­ рические формулы и устанавливают их достоверность.

Перед подбором эмпирических формул необходимо еще раз убедиться в достоверности эксперимента, окон­ чательно проверить воспроизводимость результатов по критерию Кохрена. Оценка пригодности гипотезы иссле­ дования, а также теоретических данных на адекватность, т. е. соответствие теоретической кривой эксперименталь­ ным данным, необходима во всех случаях на стадии анализа теоретико-экспериментальных исследований. Методы оценки адекватности основаны на использова­ нии доверительных интервалов, позволяющих с задан­ ной доверительной вероятностью определять искомые значения оцениваемого параметра. Суть такой проверки состоит в сопоставлении полученной или предполагае­ мой теоретической функции y=f ( x ) с результатами из­ мерений. В практике оценки адекватности применяют различные статистические критерии согласия.

Одним из таких критериев является к р и т е р и й Фи*

310