книги / Теория инженерного эксперимента
..pdfнечное множество двумерных нормальных распределе ний переменной Y. Построив для каждого интервала зави симость величины отклонения от числа отсчетов, получим распределение, изображенное на фиг. 9.1.
Фи г . 9.1. Если при многократном снятии четырех показаний, ко торые, как ожидается, лежат на истинной кривой, переменные X и Y имеют неопределенность или случайную ошибку, уменьшающую ся при увеличении X и Y, то получаются изображенные на графике двумерные нормальные распределения.
6 разд. 2.5 было показано, что при нормальном рас пределении ошибок измерительного прибора сумма квад ратов отклонений показаний-измерительного прибора от наилучшего значения минимальна. Это же положение справедливо и для общего случая, представленного на фиг. 9.1. Здесь показано бесконечное множество кривых нормального распределения, для каждой из которых справедливы положения, сформулированные в разд. 2.5. Таким образом, можно сказать, что наилучшая линия, проходящая через множество точек, рассеянных на пло скости X Y, должна занимать положение, при котором сумма квадратов отклонений точек от этой линии ми
нимальна. Именно это правило и объясняет происхожде ние термина «метод наименьших квадратов».
Рассмотрим так называемую классическую задачу наименьших квадратов, когда известно, что: 1 ) бесконеч ная совокупность точек на плоскости X Y дает прямую; 2 ) все случайные ошибки сконцентрированы в перемен-
Ф и г. 9.2. Если при многократном снятии четырех показаний, ко торые, как ожидается, лежат на прямой, только переменная Y имеет случайную ошибку, которая одинакова для всех значений Y, то по лучаются одинаковые нормальные распределения.
ной Y (в разд.'М.6 Сказан способ удовлетворения этого условия при анализе размерностей); 3) распределение случайных^ошибок одинаково'при любых значениях Y. При наличии этих трех существенных ограничений об щее множество, изображенное на фиг. 9.1, превращается в более ограниченное множество, изображенное на фиг. 9.2. Читатель, возможно, хотел бы знать, не приве дет ли наложение этих ограничений к тому, что наш ме-
тод окажется почти бесполезным. В гл. 2 и 3 мы видели, что зависимая (измеряемая) переменная обычно имеет различную точность в разных участках области ее зада ния. Часто мы не можем сказать, что выбранная пере менная X не имеет случайной ошибки, и обычно при про ведении экспериментов не бывает заранее известно о су ществовании линейной зависимости. Однако обобщение данной модели двумерной функции настолько увеличи вает объем вычислений и усложняет обработку результа тов, что часто предпочитают применять классическую модель, даже если данные существенно отличаются от идеальных. Во многих же случаях с помощью алгеб раических преобразований удается сделать полученные данные более пригодными для обработки и получить приемлемую аппроксимацию основной модели.
Допуская возможность применения модели, изобра женной на фиг. 9 .2 , запишем общее уравнение прямой
|
Yc= aX + b. |
(9.1) |
Нужно |
получить такие выражения для а и Ь, что |
|
бы сумма |
квадратов отклонений переменной Y от этой |
|
прямой была минимальной. Пусть |
Yc — точное значе |
ние Y при любом значении X и, следовательно, (К — Yc)— отклонение при любом значении X. Необходимо миними
зировать |
2 (У — Ус)2, |
или, |
что то |
же самое, |
2 (У — аХ — 6 )2. В этом |
случае должны |
выполняться |
||
следующие |
соотношения: |
|
|
|
|
д Л ( У - а Х — Ь)* |
~“ U |
(9.2) |
|
|
дЬ |
|||
|
|
|||
и |
d 2 (Y — aX — b)* |
п |
|
|
|
(9.3) |
|||
|
да |
— и |
||
|
|
Если имеется л отсчетов, то уравнение (9.2) принимает вид
(здесь 2 b = nb), а уравнение (9.3) запишется как
6 ЕХ + аЕХ2 =ЕХК. |
(9.5) |
Решая эти два уравнения как систему, находим а и Ь:
и _ 2 X a2 V — 2 Х 2 Х У |
(9.6) |
|
п 2 Х а — (2 Х )а ’ |
||
|
||
п 2 Х У — 2 Х 2 У |
(9-7) |
|
п 2 Х а — (2 Х )а |
||
|
Если известно, что функция X Y проходит через начало координат, то в этом случае в формуле (9.1) Ь — 0 и мы получаем более простое выражение для а:
а = |
2 Х У |
(9.8) |
|
2 Х а |
|
Читатель может вернуться к разд. 7.3, где говорилось о проверке ошибок с помощью экстраполяции, и вспомнить примеры реальных задач, для которых справедливо соот ношение (9.8).
Подстановка в формулы (9.6) и (9.7) обычных экспери ментальных данных часто'приводит к утомительным'вычислениям и в результате получаются большие числа. Не которого упрощения вычислений можно добиться с по мощью следующих двух несложных приемов. Один из
них состоит в том, что |
находятся |
средние значения |
|||
Хт и |
Ym и |
|[выбираются преобразованные |
переменные |
||
X' и |
К' с |
помощью |
соотношений |
X ' = |
X — Хт и |
Y' = Y — Ym. |
При этом начало координат системы XY |
временно переносится в центральную точку распределе ния, в этом случае XY и X2 сокращаются. Другой прием состоит в том, что на глаз проводится приближенная пря мая и с помощью этой прямой оцениваются приближен ные значения двух постоянных Л и В. Пусть известно приближенное уравнение
с помощью которого получим уравнение для |
разности |
|||
(V — С/'). Из формул (9.1) и (9.9) находим |
|
|||
|
|
V — Y '= ( A — а)Х' + (В— Ь). |
(9.10) |
|
Подставим |
теперь |
в формулы (9.6) и (9.7) |
(£/' — Y') |
|
вместо У, a |
X оставим без изменения. Вместо а и b получим |
|||
(Л — а) |
и (В — Ь), |
а это небольшие числа, позволяющие |
||
быстро |
выполнять |
вычисления с помощью настольного |
вычислительного устройства или логарифмической ли нейки. Покажем применение данного метода на примере реальной задачи.
Пример 9.1. Проверяется зависимость снижения тем пературы в трубе парового отопления от ее длины. Для данного типа трубы при неизменных окружающих усло виях получены следующие данные:
Изменение температуры АТ, °С |
5 |
7 |
15 |
20 |
22 |
Длина L, м |
4 |
8 |
12 |
16 |
20 |
Какого рода график можно построить на основе этих данных методом наименьших квадратов и что можно ска зать об этих данных’в целом?
Решение. На фиг. 9.3 показаны графики, построенные по этим данным в линейных координатах. Допустим, что график функции имеет вид прямой, эту прямую можно провести на глаз и найти приближенные значения по стоянных А и В для подстановки в уравнение (9.10). Определение значений температуры для всей трубы может привести к неудовлетворительной точности в оценке АТ вследствие наличия градиентов в любом заданном попе речном сечении; в то же время мы считаем, что значение L определено точно. Мы хотим провести приближенную пря мую через начало координат, так как известно, что истин ная прямая должна пройти именно через эту точку. Од нако мы не воспользуемся формулой (9.8), так как нас интересует вычисленное значение b (которое должно быть равно нулю, если все вычисления правильны) как частич ный показатель приемлемости полученных данных. Приб
лиженная прямая, изображенная на фиг. 9.3, имеет не сколько меньший угловой коэффициент, но она проведена на глаз для облегчения вычислений (с угловым коэффи циентом, равным единице). Приближенное уравнение (9.9) принимает вид
Ц = Ы + О,
где U — температура в градусах Цельсия, a L — длина трубы в метрах. Уравнение (9 .1 0) преобразуется к виду
AU— Д Г=(1—а ) ! + (0—Ь),
так как для приближенной прямой А — 1 и В = 0. Для дальнейшего облегчения вычислений перенесем оси коор динат, как показано на фиг. 9.3; при этом АТ' = АТ — 12,
Ф и г . 9.3. Графическое изображение данных из примера 9.1. На графике показаны: 1) перенос осей координат, 2) приближенная прямая и 3) наилучшая прямая, построенная методом наименьших
квадратов.
AU' = AU — 12 и U = L — 12. Полная таблица вы числений выглядит следующим образом:
|
|
A t/= |
|
AU—12= L—12=1/ |
(AU'— А Г ) |
(Ь'>* |
L ' ( à U '— |
||
АТ |
L |
Д Г -12=Д Г' |
—АТ') |
||||||
= 1 L |
= ДU ' |
( X ) |
(У) |
(X*) |
|||||
|
|
|
|
|
|
|
|
(ХУ) |
|
5 |
4 |
4 |
— 7 |
— 8 |
— 8 |
— 1 |
64 |
8 |
|
7 8 |
8 |
- 5 |
— 4 |
—4 |
1 |
16 |
- 4 |
||
15 |
12 |
12 |
3 |
0 |
0 |
— 3 |
0 |
0 |
|
20 |
16 |
16 |
8 |
4 |
4 |
—4 |
16 |
—16 |
|
22 |
20 |
20 |
10 |
8 |
8 |
—2 |
64 |
—16 |
|
п = 5 |
|
2 Х = 0 |
2 К = —9 |
БХ2=160 |
2Х У = —28 |
В этом простом случае перенос координатных осей и использование приближенной функции по существу неоправданы, однако данный пример позволяет достаточно наглядно проиллюстрировать эти методы. С помощью формул (9.6) и (9.7) получаем следующие результаты:
п |
> ._ |
160• (—9) — 0• (—28) |
__ |
9 |
— — 1,8, |
|
|
|
5 - 1 6 0 - 0 |
|
— |
5 |
|
|
|
6= 1,8, |
|
|
|
|
1 |
___ 5-(—28) — 0-(—9 ) |
|
|
28 |
|
|
1 |
а ~ |
5-160 — 0 |
— |
|
160 — U’18, |
|
|
|
0=1,18. |
|
|
|
Однако необходимо иметь в виду, что эти числа были по лучены для преобразованной системы координат. Теперь
запишем |
АТ — 12 = 1,18(7. — 12) + 1,8, или АТ = |
= 1,187, + |
12 — 14,18 + 1,8, т. е. |
A7’=1,18L—0,4.
Это уравнение прямой, построенной по полученным дан ным способом наименьших квадратов, а сама прямая изоб ражена на фиг. 9.3. Хотя известно, что значение b долж но быть равно нулю, а не —0,4, эта небольшая величина отрезка, отсекаемого на координатной оси, не должна
смущать. Полученные данные показывают, что мы не мо жем определить изменение температуры с ошибкой менее
1 °С, |
поэтому при b = 0,4 °С вряд ли |
можно считать |
|
эти данные |
неудовлетворительными. |
свою^работу и |
|
На |
этом |
инженер может закончить |
представить полученную корреляционную прямую, не проводя дальнейшего анализа, хотя без больших усилий можно получить интересный дополнительный материал. Поскольку принятая нами модель не что иное, как беско нечная последовательность идентичных кривых нормаль ного распределения, расположенных вдоль наилучшей прямой, то логично задать вопрос, каковы показатели точности этих нормальных распределений. В гл. 2 было показано, что среднее квадратическое отклонение s мож но найти по формуле
s2= Sx* |
(9.11) |
где х — отклонение произвольного отсчета относительно наилучшего значения. В данном случае наилучшее значе ние определяется некоторой прямой, и можно легко вы числить или измерить отклонение любой точки от прямой, полученной способом наименьших квадратов, и таким пу тем найти среднее квадратическое отклонение для Y во всем интервале значений. Однако не следует забывать, что эта методика эффективна только в том случае, если удовлетворительна основная модель (фиг. 9.2). Если вдоль прямой величина среднего квадратического отклонения изменяется, или линия не совсем прямая, или X также имеет случайную ошибку, то оценка будет либо неудовле творительной, либо вообще может ввести в заблуждение. Разумеется, в этих случаях прямая, построенная класси ческим методом наименьших квадратов, не будет соответст вовать действительной картине явления.
; ; Пример 9.2. Вычислите среднее квадратическое откло нение для данных об изменении температуры в примере 9.1.
Решение. Составим таблицу данных для каждой из пяти точек, куда запишем истинное значение (т. е. полу ченное методом наименьших квадратов), а также изме ренное значение, и по формуле (9.11) вычислим среднее квадратическое отклонение:
L |
• |
1,181* |
^наим. KB“ U 8L |
^изм |
^ н а и м . кв ^и эм ^2 |
|
|
|
|
|
|
4 |
|
4,75 |
4,35 |
5 |
0,42 |
8 |
|
9,5 |
9,1 |
7 |
4,42 |
12 |
|
14,2 |
13,8 |
15 |
1,45 |
16 |
|
19,0 |
18,6 |
20 |
1,97 |
20 |
|
23,7 |
23,3 |
22 |
1.7 |
Сумма |
|
|
|
|
9,96 |
Откуда |
|
|
____ |
|
|
|
|
|
S= K T = T = 1 *56°C. |
|
Поскольку среднее квадратическое отклонение примерно в 1,5 раза больше вероятной ошибки, то можно сказать, что вероятная ошибка для температуры составляет — 1°С
ичто половина данных имеет ошибку, не превышающую
±1 °С, разумеется, при условии, что ошибки в измере
нии температуры распределены по нормальному закону. Здесь нет возможности рассмотреть другие более слож ные и более трудоемкие методы наименьших квадратов. Если известно, что полученные точки образуют кривую и с помощью простых алгебраических преобразований нельзя получить линейный график, то методом наимень ших квадратов необходимо подобрать некоторый много член с несколькими постоянными. Такого рода работу в настоящее время выполняют вычислительные машины по стандартным программам. Если случайную ошибку невозможно сконцентрировать в переменной Y и она наблюдается как для переменной X, так и для переменной Y, то необходимо применять более сложный и более тру доемкий метод наименьших квадратов [81. Если точность
переменных X и Y меняется при |
изменении X и |
Y, то |
в разных частях области задания |
данные должны |
иметь |
различный вес. Правильная оценка весов дает отчетли вое представление о том, каким образом происходит изменение точности.
Начинающие экспериментаторы, а также опытные ис следователи, не знакомые со статистическими методами, могут изучить эти сложные вопросы, обратившись к ли тературу, перечень которой приводится в конце главы.
19-168
9.2. Построение прямой; быстрые и приближенные методы построения
При большом числе точек метод наименьших квадра тов даже при специально подобранных простых числах (как в предыдущем разделе) связан с утомительными вы числениями, отнимающими много времени. В ряде ин тересных статей Асковиц1 описывает разработанный им чисто графический способ построения кривых методом наименьших квадратов, который, по мнению автора, устраняет многие препятствия на пути широкого приме нения метода в лабораторных условиях. На данном этапе развития этого метода его применение наиболее удобно в одном частном случае, а именно когда интервалы между значениями переменной X одинаковы. Следовательно, если предполагается применять метод Асковица, то исследо ватель должен спланировать эксперимент таким образом, чтобы контролируемая переменная X изменялась каждый раз на одинаковую величину либо так, чтобы на прямой были получены равные интервалы. Это лучше всего вы полнить, используя методику, описанную в разд. 6 .1 .
Если данное условие выполняется, то провести пря мую не составляет большого труда. Соединяем точки / и 2 отрезком прямой. Двигаясь в сторону точки 2, прохо
дим |
вдоль этого отрезка |
расстояние, соответствующее |
г / 3 S, |
и делаем отметку. |
Соединяем полученную точку |
с точкой 3; двигаясь в сторону точки 3, снова проходим расстояние, соответствующее 2 / 3 S, и делаем новую от метку. Повторяем эту процедуру до тех пор, пока не бу дет получена последняя точка. Эта последняя точка ле жит на наилучшей прямой, т. е. прямой наименьших квад ратов. Теперь начинаем построение с другого конца и повторяем весь процесс, двигаясь в противоположном направлении. Находим вторую точку, лежащую на пря мой. Полностью построение прямой по пяти точкам пока зано на фиг. 9.4. Хотя на первый взгляд этот метод и кажется
|
1 См. J . A p p l. Physiology, |
8, |
347—352 (1955); J . А т . |
S ta t. As- |
||
soc., 52, 13—17 (1957); A m . J . Phys., 25, 254—256(1957); A m . J . Phys., |
||||||
26, |
610— 612 (1958); A m . J . |
P hys., 28, 164—168 (1958), |
a также |
|||
S c h e n c k |
H., |
A Mechanical |
Analog of the Least-squares Prob |
|||
lem, |
B u ll. |
M eek. |
E ng. Educ., |
5, |
183—185 (1966). |
|