книги из ГПНТБ / Применение методов статистического моделирования в автоматизированном химическом производстве
..pdf4) Составление матрицы исходных данных
Матрица исходных данных составляется с учетом функции отклика и выбранных факторов. Строки матрицы представ ляют собой фиксированные замеры выбранных факторов, при чем первая строка матрицы совпадает с первым по времени замером, а последняя — с окончанием наблюдения.
5) Группировка исходных данных
Предварительно обработанная информация о процессе группируется по классу точности приборов.
Группировка проводится следующим образом. Первая строка матрицы исходных данных сравнивается со всеми по следующими строками, причем сравнение идет по столбцам в пределах ошибки прибора. Таким образом, в каждую группу входят лишь те строки, все столбцы которых лежат в преде лах: первая строка матрицы ± ошибка прибора. Пусть, на пример, имеется следующая информация о процессе (табл. 1):
|
|
|
|
|
Таблица 1 |
|
Температура |
Соотношение |
Давление |
|
|
|
верха реак |
перед реак |
|
||
|
пар-шихта |
|
|
||
|
тора |
|
тором |
Выход про |
|
|
•** |
|
|||
№ наб |
|
|
*3 |
дукта на про |
|
|
|
|
|||
людения |
при погрешности |
прибора |
пущенную |
||
|
|
|
|
|
шихту |
|
±5,5° |
±1,5 |
|
±0,1 |
|
1 |
623 |
2,5 |
|
0,30 |
35,6 |
2 |
625 |
2,5 |
|
0,30 |
37,0 |
3 |
617 |
2,5 |
|
0,29 |
34,4 |
4 |
623 |
3,0 |
|
0,36 |
34,8 |
5 |
628 |
2,5 |
|
0,35 |
33,1 |
6 |
630 |
2,5 |
|
0,34 |
34,0 |
7 |
633 |
2,0 |
|
0,44 |
33,4 |
8 |
631 |
2,0 |
|
0,40 |
33,4 |
9 |
630 |
2,0 |
|
0,40 |
31,2 |
10 |
636 |
2,0 |
|
0,39 |
33,0 |
11
Следуя описанной методике, получим группы (табл. 2 и 3):
|
|
|
|
|
|
Т а б л и ц а |
2 |
№ группы |
|
|
х а |
х 3 |
У |
|
|
|
1 |
|
623 |
2,5 |
0,30 |
35,6 |
|
|
2 |
|
625 |
2,5 |
0,30 |
37,0 |
|
|
3 |
|
623 |
3,0 |
0,36 |
34,8 |
|
|
4 |
|
628 |
2,5 |
0,35 |
33,1 |
|
Среднее |
значение |
|
624,75 |
2,6 |
0,33 |
35,1 |
|
|
|
|
|
|
|
Т аб л и ц а |
3 |
№ группы |
|
|
х 2 |
х 3 |
У |
|
|
1 |
|
630 |
|
2,5 |
0,34 |
34,0 |
|
2 |
|
633 |
|
2,0 |
0,44 |
33,4 |
|
3 |
|
631 |
|
2,0 |
0,40 |
33,4 |
|
4 |
|
630 |
|
2,0 |
0,40 |
31,2 |
|
Среднее |
631 |
|
2,1 |
0,39 |
33,0 |
|
|
значение |
|
|
|||||
|
|
|
|
|
|
Строки, не вошедшие ни в одну из этих групп, переносятся без изменения в таблицу исходных данных, туда же вносятся и средние значения образованных групп (табл. 4).
|
|
|
|
Т а б л и ц а 4 |
№ группы |
X! |
х 2 |
х 3 |
У |
1 |
624,75 |
2,6 |
0,33 |
35,1 |
2 |
617,0 |
2,5 |
0,29 |
34,4 |
3 |
631,0 |
2,1 |
0,39 |
33,0 |
4 |
636,0 |
2,0 |
0,39 |
33,0 |
При группировании представляется возможным проверить гипотезу об адекватности представления процесса полученной математической модели по /"-критерию.
12
По описанной выше методике вся информация по иссле дуемому процессу дегидрирования этилбензола в стирол была сгруппирована в 25 групп. При этом в качестве влияющих факторов были взяты следующие 11 параметров (табл. 5):
Услов ное обозна чение
Х1
Х2
Х3
■*4
Х6
Ху
х9
х10
Т а б л и ц а 5
Наименование фактора
Соотношение пар — шихта Температура верха реактора
Давление перед адиабатическим реактором Подача пара в пароперегревательную печь Подача шихты Перепад давлений
Давление после адиабатического реактора Температура низа реактора Остаток в печном масле Температура средины реактора
хп Подача пара в испаритель
Вкачестве выходной функции отклика были выбраны вы ход стирола на разложенный этилбензол (у\) и выход на про пущенный этилбензол (г/г) -
Одним из эффективных методов определения линейной (или нелинейной) зависимости исследуемой величины от не скольких других является метод наименьших квадратов, кото рый заключается в следующем.
Рассмотрим зависимость между двумя величинами х и у (в целях упрощения мы будем определять линейную зависи мость величины у от одной величины х, хотя все рассуждения могут быть легко перенесены на многомерный случай, а зави симость может носить, например, квадратичный характер). В нашем распоряжении имеется таблица N результатов измере ний значений величины х и соответствующих значений у.
Будем рассматривать х и у как прямоугольные координа ты точек на плоскости. Предположим, что точки с соответству ющими координатами, взятыми из нашей таблицы, лежат на некоторой прямой линии. Естественно в этом случае предпо-
13
дожить, что между х и у существует линейная зависимость, то есть что у есть линейная функция от х, выражающаяся фор мулой
y = ax + b, |
(1) |
где а и Ь — некоторые постоянные коэффициенты, |
подлежа |
щие определению. |
|
Формула (1) может быть представлена в следующем виде:
ах + Ь—у = 0. |
(2) |
Разумеется, наша гипотеза о строго линейной зависимости между величинами у и х носит приближенный характер: на самом деле, данные, приведенные в таблице, имеют лишь тен денцию группироваться около некоторой прямой линии.
Следовательно, подставляя в формулу (2) вместо х и у табличные значения Х\У\, х2у2, ■■■, xn Ух, получим систему ра венств:
ахг + |
b — у, = sp, |
|
ах 2+ b - у2 = е2; |
^ |
|
axN + b — yN = еЛ„ |
|
|
где |
|
|
£1> |
®дг |
(4) |
— отличные от нуля погрешности.
Требуется подобрать коэффициенты а и b таким образом, чтобы сумма квадратов погрешностей была минимальной, то
есть |
|
|
|
|
и = £i2 + |
£з2 + ••• + |
£5v = min. |
(5) |
|
Заменив в выражении |
(5) значения (4) их значениями из |
|||
равенств (3), получим следующее выражение: |
|
|||
и = (ахг + Ь — у ^ |
+ (ax2 + b — y2f |
+ ... + (ахN + |
ft—уЛ,)2, (6) |
|
или |
|
|
|
|
|
И = 2 |
iflxt + ft - |
у if . |
(7) |
|
(=1 |
|
|
|
В формуле (7) |
числа Х\У\,. . ., х^Уы получены в результате |
измерения, а коэффициенты а и b — неизвестные, подлежащие определению.
Таким образом, и можно рассматривать как функцию от двух переменных а и ft.
Подберем коэффициент а и ft так, чтобы и была минималь
ной. Для этого необходимо, чтобы соблюдались условия: |
|
|
— = 0; |
— = 0. |
(8) |
да |
дЬ |
|
14
Берем частные производные и, разделив их на 2, получим
(ахх + b — у 1)х1+ (ах2+ b - y 2) x 2+ ...+(axN+ b — yN) x N= 0;
(ах1+ Ь — У1) + (ах2+ b — у2) + + (ахм ^ — Уы) ~ 0-
Производя несложные преобразования, окончательно по лучаем систему уравнений
N |
N |
N |
а 2 |
x i2+ b J j -И = |
2 -И УЗ |
N |
■ N |
(9) |
|
x l + b = % yt. |
|
i == 1 i = 1 /
Решая систему (9), находим коэффициенты а и Ь. Мы при вели лишь самый элементарный, хотя и весьма часто встре чающийся случай применения метода наименьших квадратов. В общем случае имеются результаты N независимых опытов,
в |
которых каждому |
набору значений |
факторов xt |
(t = l, |
|||||
2,. |
. ., п) |
соответствует значение функции у. |
|
|
|||||
|
Из |
теоретических |
соображений |
выбрана |
зависимость |
||||
у = ф(хь |
|
си, ..., |
аД, |
содержащая |
ряд неизвестных па |
||||
раметров. |
|
|
|
|
|
|
|
||
|
Требуется |
так выбрать |
эти параметры, чтобы |
кривая |
|||||
у = ср (хи ..., |
хп, аь ..., |
as) наилучшим |
способом |
изображала |
полученную на опыте зависимость. Метод наименьших квад ратов основан на требовании обращения в минимум квадра
тов отклонений |
экспериментальных точек |
от сглаживающей |
кривой. Иными |
N |
[ у ^ — ¥ |
словами, величина к = 2 |
J=1
х пи), аь ...,а5)]2должна быть сведена к минимуму. Здесь х ^ —
значение k-то фактора в /-м наблюдении, a y(i) — значение функции влияния факторов также в /-м наблюдении. Величи на aj, . . ., as, при которой достигается минимизация величи ны и, определяется из системы s уравнений:
^ = 0 ( i = l , 2,..., 5). |
(10) |
ОЯ; |
|
Метод наименьших квадратов описан в ряде руководств по обработке наблюдений и математической статистике, напри мер в работе [5], и является весьма распространенным. Его основным недостатком является трудность отбора наиболее значимых факторов (существенно влияющих на выходное значение у). Действительно, если известно, что на величину у оказывают совокупное влияние п факторов х и . . . , х п, пред ставляет большой интерес не только построение математиче ской модели зависимости у = ц>(хи . . .,хп), но и оценка степени значимости каждого из факторов в отдельности. Заметим, что
15
отбор факторов предшествует построению математической мо дели зависимости. Сначала исследователь должен выделить, пользуясь методами математической статистики, наиболее влияющие на выходное значение процесса факторы, а затем построить математическую модель зависимости выходного значения у от у^ке отобранных факторов. В работе [6] описана модификация метода наименьших квадратов, позволяющая со четать отбор факторов с построением математической модели, которая приводится ниже.
Изложим еще одну распространенную за рубежом модель оценки зависимостей, так называемую модель Брандона, пос ле чего перейдем к разработанному способу отбора факторов.
Трудность стабилизации параметров, невозможность точ ного замера некоторых из них и ряд других обстоятельств, за висящих от производственных условий, проведения экспери мента, заставляют отказаться от обычной практики нахожде ния зависимостей и искать другой, более приемлемый метод их определения.
В зарубежной литературе [7, 8] излагается метод множест венной нелинейной корреляции. Ставится задача определить зависимость одного основного параметра системы от других параметров (хь х2, х3, ..., х п), то есть найти функцию
у — F (хх, х 2, х 3,...,хп).
Предполагается, что функция F является произведением некоторых функций отдельных параметров
У = К fi i.x i)U (*2) / 8 (*з) •••/„ (■*„). |
(П) |
причем каждая из / г (х() принимается для простоты расчета линейной
f l (xi) = al + bl x t.
Возможно использование и более сложной, нелинейной за висимости. Таким образом, задача сводится к определению коэффициентов ah bt \iK (i= 1, 2,. . ., п).
Исходными данными для такого расчета служит таблица экспериментальных данных, как и в методе наименьших квад ратов. Расчет начинается с построения графика зависимости у от X]. На этом графике получается корреляционное поле точек, из которых методом средних или методом наименьших квадратов [7] выявляется наибрлее вероятная линия репрес сии
hЫ = а1+ ь1 х х
иопределяются коэффициенты а\ и Ь\. После этого рассчи тываются значения нового приведенного параметра
У1 = ~ |
—Г - Kf-1(*«)/» (*s) - f n (х п) |
(12) |
f\ |
(*|) |
|
16
и строится график зависимости у\ от хг, по которому опреде ляется уравнение линии репрессии /2(^2)- Затем рассчитыва ются значения следующего приведенного параметра:
/з ( х 2)
и по графику зависимости г/г от Хз находится уравнение линии репрессии /3(*з). Такой расчет продолжается до тех пор, пока не будут определены все функции /г (xj) и коэффициент К.
Недостатки модели Брандона — трудность определения остаточной дисперсии погрешности оценки с помощью функ ции y = F ( x и, как следствие, невозможность прове дения отбора значимых факторов.
Переходим к описанию метода отбора значимых факторов и построения математической модели на основе данных отбо ра. Математические основы этого метода изложены в работах
[6], [И].
Одной из важных задач расчета динамики производствен ного процесса является проблема оптимизации производствен ного процесса— установления комбинации значений, влияю щих на процесс факторов, которые оптимизируют значение выходной функции процесса. Будем считать, что, помимо пе ременных технологических параметров, на значение функции процесса оказывает влияние большое количество не поддаю щихся учету случайных факторов.
Примем следующую математическую запись исследуемого технологического процесса:
^ =; А0+ |
x i + ••• + Ап х п + А. |
(13) |
Здесь W — оптимизируемая выходная функция |
технологиче |
|
ского процесса; |
|
|
A t— численные значения коэффициентов; |
|
|
x t— переменные |
технологические параметры, опреде |
|
ляющие значения оптимизируемой величины; |
||
Д — нормальная |
случайная величина с |
параметрами |
(а, а2), причем параметры А можно без ограниче ния общности свести к (0, а2).
Пусть имеется таблица N наблюдений исследуемого техно логического процесса:
W {1) х 1(1)...х „ (1)
W (N)x<N)...xn{N)
Здесь нижний индекс означает номер параметра, а верх ний— номер наблюдения. Обозначив //-мерный вектор W
значком W, а //-мерные векторы наблюдений параметров
2 Зак. 396 |
17 |
x L— через x h имеем:
\^ = Л 0Т + |
2 |
A i x i + |
/V |
(14) |
|
i = 1 |
|
|
|
Здесь 1— единичный W-мерный вектор, а А — iV-мерный |
||||
вектор значений А. |
|
|
|
|
Обозначив хг= 1 / N ^ X i |
; |
и x t — x t — л;г, |
получим |
|
^ = (Л0 + S А; хг) + 2 АД + д! |
|
|||
i=l |
|
i<=1 |
|
|
Ортогонализируем систему векторов х[ и получаем новую |
||||
систему взаимно ортогональных векторов |
|
|||
W = А0' 1 + 2 -4/ |
+ А, |
|
||
отсюда |
г '= |
1 |
|
|
|
|
|
|
|
Л /...( ^ ё о |
|
(д. ёГ) |
|
(15) |
(С.w |
|
(С у |
|
|
|
|
|
Здесь (а, Ь) — скалярное произведение векторов а и Ь. Отсюда можно определить параметры случайной величи
ны А/:
(6/, 5г)
DA
(Si, Si)
Обозначив
II |
1 I'M * |
S ) gj. |
можно показать, что
М ' ( р . р )
N —n
Отсюда
(Р- Р) ~ -,2
N —п
(16)
(17)
(18)
(19)
(20)
18
Получаем простую и весьма удобную с вычислительной точки зрения методику отбора значимых параметров, сущест венно влияющих на выходное значение производственного процесса. Строим п дисперсий:
|
(Ру. Р/) |
/ |
U — !.•••. ч)\ РJ = W - |
2 |
|
(21) |
|
|
N — i |
|
|||||
|
/=1 |
(tiX) |
|
||||
|
|
|
|
|
|
|
|
Если |
при |
переходе от / к (/+1) |
факторам (добавляется |
||||
( /+ 1)-й |
фактор) |
величины о2 и а3+1 |
несущественно |
отлича |
ются друг от друга (существенность отклонения можно оце нить с помощью различных критериев согласия), то это озна чает, что ( / + 1)-й фактор оказывает на выходное значение непосредственное влияние и может быть отброшен.
Проверка статистических гипотез о значимости расхожде ния двух дисперсий ог2 и о3+1 производится следующим обра
зом. Для проверки такого рода гипотез используется распре
деление отношений дисперсий |
|
|
|
|
|||
|
|
|
F = - ¥ ~ , |
|
|
(22) |
|
|
|
|
|
а/-и |
|
|
|
причем |
постулируется, |
что |
дисперсии |
а;3 |
и оД1 |
взяты из |
|
нормальной генеральной совокупности. |
F |
(так называемое |
|||||
Распределение |
случайной |
величины |
|||||
Д-распределение Фишера) зависит только |
от числа |
степеней |
|||||
свободы |
Ki = N\—1 |
и |
Kz= N2—1, если |
дисперсии |
а 2 и с2+1 |
взяты, соответственно, из выборок объема iV) и N2. В нашем |
|
случае N 1= N2 = N и Ki = K2 = N—1. Чтобы проверить гипотезу |
|
о равенстве а 2 и а-+1,мы должны построить критическую об |
|
ласть для критерия F, после чего, |
сравнивая эмпирическое |
значение F с этой областью, делаем |
окончательный вывод. |
Зададим коэффициент доверия р и зафиксируем два та ких интервала Fi и F2, что при соответствующих степенях сво
боды Ki и Д2 |
|
P (F < /ф) = P ( F > F2) ~ 1 - р . |
(23) |
Если выборочное значение F оказывается в критической об ласти, то есть вне интервала [Еь /г], то гипотеза <з;2 = о?+1
должна быть отвергнута, так как вероятность того, что
F(~[Fi, Fq\, равна 1—2 р и весьма незначительна. В качестве коэффициента доверия р целесообразно принять равным 0,95.
Если значение F не выходит за пределы интервала [Еь/г], у нас нет оснований отвергнуть гипотезу о равенстве диспер сий. Таким образом, при F1<c F k F2 мы считаем, что Д+1)-й фактор оказывает несущественное влияние и может не учиты ваться. При F<Fi или F>F2 расхождение между а 2 и а3+1
считается существенным, и мы считаем добавление (t+ l)-ro фактора необходимым, а его влияние существенным.
2* |
19 |
Таким образом, оценивая изменения дисперсии о2 от /= 1 до }= п, можно отобрать все значимые параметры xt.
Предлагаемая методика отбора параметров хг проста в применении и выгодно отличается от способа отбора парамет ров при обычном методе наименьших квадратов тем, что нуж
но только один раз ортогонализировать систему векторов х/, а не обращать п раз матрицу соответственно для 1, 2 параметров. Вычислительные формулы существенно упроща ются и легко программируются на ЭВМ.
После получения коэффициентов A t переход к итоговым осуществляется по формуле
A n~k “ Ап. -k . 2 |
Aj |
—> |
(1 < * < я + 1). i <24> |
} ~ n - k -\-1 |
|
(S/г—ft, £/z--ft) |
I |
В исследуемом примере процесса дегидрирования этил бензола в стирол на основании F-анализа ряда остаточных
дисперсий были отобраны следующие факторы: |
||
Xi — соотношение пар — шихта; |
|
|
х2 — температура верха реактора; |
реактором; |
|
х3 |
— давление перед адиабатическим |
|
х4 |
— подача пара в пароперегревательную печь; |
|
х9 — остаток в печном масле (для |
исследуемого случая |
в качестве фактора была выбрана активность катализатора — величина, обратная параметру).
В табл. 6 приведены данные измерений по группам для уже отобранных факторов (здесь х9 — активность катализа тора, остальные факторы взяты на основании отбора).
Отбор наиболее влияющих факторов может быть также приведен на основе анализа индексов корреляции. Заметим, однако, что статистический анализ в этом случае становится весьма трудоемким. Индекс корреляции представляет собой отношение среднеквадратичных отклонений
где |
|
|
|
|
|
|
|
|
|
|
V% |
|
N — 1 |
|
/ |
N |
, Ж |
Щ |
|
|
|
|
|
i=i |
|
N — l |
|||
|
|
(У(О._ j,®)2 |
Зу (*•/) |
|
|
■У )2 |
|||
|
|
|
|
|
|
|
|
|
|
уО' определяется |
|
на |
основании построения |
квадратичной |
|||||
модели |
зависимости |
у |
от |
соответствующего |
Xj, то есть |
||||
у j l) ~ a j |
-f- bj Xjl) + |
Cj XjlP, где |
параметры ауф и Cj неизвестны |
||||||
и подлежат определению, |
a |
x'f — значение |
/-го фактора в |
20