Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Применение методов статистического моделирования в автоматизированном химическом производстве

..pdf
Скачиваний:
8
Добавлен:
29.10.2023
Размер:
2.69 Mб
Скачать

4) Составление матрицы исходных данных

Матрица исходных данных составляется с учетом функции отклика и выбранных факторов. Строки матрицы представ­ ляют собой фиксированные замеры выбранных факторов, при­ чем первая строка матрицы совпадает с первым по времени замером, а последняя — с окончанием наблюдения.

5) Группировка исходных данных

Предварительно обработанная информация о процессе группируется по классу точности приборов.

Группировка проводится следующим образом. Первая строка матрицы исходных данных сравнивается со всеми по­ следующими строками, причем сравнение идет по столбцам в пределах ошибки прибора. Таким образом, в каждую группу входят лишь те строки, все столбцы которых лежат в преде­ лах: первая строка матрицы ± ошибка прибора. Пусть, на­ пример, имеется следующая информация о процессе (табл. 1):

 

 

 

 

 

Таблица 1

 

Температура

Соотношение

Давление

 

 

верха реак­

перед реак­

 

 

пар-шихта

 

 

 

тора

 

тором

Выход про­

 

•**

 

№ наб­

 

 

*3

дукта на про­

 

 

 

людения

при погрешности

прибора

пущенную

 

 

 

 

 

шихту

 

±5,5°

±1,5

 

±0,1

 

1

623

2,5

 

0,30

35,6

2

625

2,5

 

0,30

37,0

3

617

2,5

 

0,29

34,4

4

623

3,0

 

0,36

34,8

5

628

2,5

 

0,35

33,1

6

630

2,5

 

0,34

34,0

7

633

2,0

 

0,44

33,4

8

631

2,0

 

0,40

33,4

9

630

2,0

 

0,40

31,2

10

636

2,0

 

0,39

33,0

11

Следуя описанной методике, получим группы (табл. 2 и 3):

 

 

 

 

 

 

Т а б л и ц а

2

№ группы

 

 

х а

х 3

У

 

 

1

 

623

2,5

0,30

35,6

 

 

2

 

625

2,5

0,30

37,0

 

 

3

 

623

3,0

0,36

34,8

 

 

4

 

628

2,5

0,35

33,1

 

Среднее

значение

 

624,75

2,6

0,33

35,1

 

 

 

 

 

 

 

Т аб л и ц а

3

№ группы

 

 

х 2

х 3

У

 

1

 

630

 

2,5

0,34

34,0

 

2

 

633

 

2,0

0,44

33,4

 

3

 

631

 

2,0

0,40

33,4

 

4

 

630

 

2,0

0,40

31,2

 

Среднее

631

 

2,1

0,39

33,0

 

значение

 

 

 

 

 

 

 

 

Строки, не вошедшие ни в одну из этих групп, переносятся без изменения в таблицу исходных данных, туда же вносятся и средние значения образованных групп (табл. 4).

 

 

 

 

Т а б л и ц а 4

№ группы

X!

х 2

х 3

У

1

624,75

2,6

0,33

35,1

2

617,0

2,5

0,29

34,4

3

631,0

2,1

0,39

33,0

4

636,0

2,0

0,39

33,0

При группировании представляется возможным проверить гипотезу об адекватности представления процесса полученной математической модели по /"-критерию.

12

По описанной выше методике вся информация по иссле­ дуемому процессу дегидрирования этилбензола в стирол была сгруппирована в 25 групп. При этом в качестве влияющих факторов были взяты следующие 11 параметров (табл. 5):

Услов­ ное обозна­ чение

Х1

Х2

Х3

■*4

Х6

Ху

х9

х10

Т а б л и ц а 5

Наименование фактора

Соотношение пар — шихта Температура верха реактора

Давление перед адиабатическим реактором Подача пара в пароперегревательную печь Подача шихты Перепад давлений

Давление после адиабатического реактора Температура низа реактора Остаток в печном масле Температура средины реактора

хп Подача пара в испаритель

Вкачестве выходной функции отклика были выбраны вы­ ход стирола на разложенный этилбензол (у\) и выход на про­ пущенный этилбензол (г/г) -

Одним из эффективных методов определения линейной (или нелинейной) зависимости исследуемой величины от не­ скольких других является метод наименьших квадратов, кото­ рый заключается в следующем.

Рассмотрим зависимость между двумя величинами х и у (в целях упрощения мы будем определять линейную зависи­ мость величины у от одной величины х, хотя все рассуждения могут быть легко перенесены на многомерный случай, а зави­ симость может носить, например, квадратичный характер). В нашем распоряжении имеется таблица N результатов измере­ ний значений величины х и соответствующих значений у.

Будем рассматривать х и у как прямоугольные координа­ ты точек на плоскости. Предположим, что точки с соответству­ ющими координатами, взятыми из нашей таблицы, лежат на некоторой прямой линии. Естественно в этом случае предпо-

13

дожить, что между х и у существует линейная зависимость, то есть что у есть линейная функция от х, выражающаяся фор­ мулой

y = ax + b,

(1)

где а и Ь — некоторые постоянные коэффициенты,

подлежа­

щие определению.

 

Формула (1) может быть представлена в следующем виде:

ах + Ь—у = 0.

(2)

Разумеется, наша гипотеза о строго линейной зависимости между величинами у и х носит приближенный характер: на самом деле, данные, приведенные в таблице, имеют лишь тен­ денцию группироваться около некоторой прямой линии.

Следовательно, подставляя в формулу (2) вместо х и у табличные значения Х\У\, х2у2, ■■■, xn Ух, получим систему ра­ венств:

ахг +

b — у, = sp,

 

ах 2+ b - у2 = е2;

^

axN + b — yN = еЛ„

 

где

 

 

£1>

®дг

(4)

— отличные от нуля погрешности.

Требуется подобрать коэффициенты а и b таким образом, чтобы сумма квадратов погрешностей была минимальной, то

есть

 

 

 

 

и = £i2 +

£з2 + ••• +

£5v = min.

(5)

Заменив в выражении

(5) значения (4) их значениями из

равенств (3), получим следующее выражение:

 

и = (ахг + Ь — у ^

+ (ax2 + b — y2f

+ ... + (ахN +

ft—уЛ,)2, (6)

или

 

 

 

 

 

И = 2

iflxt + ft -

у if .

(7)

 

(=1

 

 

В формуле (7)

числа Х\У\,. . ., х^Уы получены в результате

измерения, а коэффициенты а и b — неизвестные, подлежащие определению.

Таким образом, и можно рассматривать как функцию от двух переменных а и ft.

Подберем коэффициент а и ft так, чтобы и была минималь­

ной. Для этого необходимо, чтобы соблюдались условия:

 

— = 0;

— = 0.

(8)

да

дЬ

 

14

Берем частные производные и, разделив их на 2, получим

(ахх + b — у 1)х1+ (ах2+ b - y 2) x 2+ ...+(axN+ b yN) x N= 0;

(ах1+ Ь — У1) + (ах2+ b — у2) + + (ахм ^ — Уы) ~ 0-

Производя несложные преобразования, окончательно по­ лучаем систему уравнений

N

N

N

а 2

x i2+ b J j =

2 -И УЗ

N

■ N

(9)

 

x l + b = % yt.

 

i == 1 i = 1 /

Решая систему (9), находим коэффициенты а и Ь. Мы при­ вели лишь самый элементарный, хотя и весьма часто встре­ чающийся случай применения метода наименьших квадратов. В общем случае имеются результаты N независимых опытов,

в

которых каждому

набору значений

факторов xt

(t = l,

2,.

. ., п)

соответствует значение функции у.

 

 

 

Из

теоретических

соображений

выбрана

зависимость

у = ф(хь

 

си, ...,

аД,

содержащая

ряд неизвестных па­

раметров.

 

 

 

 

 

 

 

 

Требуется

так выбрать

эти параметры, чтобы

кривая

у = ср (хи ...,

хп, аь ...,

as) наилучшим

способом

изображала

полученную на опыте зависимость. Метод наименьших квад­ ратов основан на требовании обращения в минимум квадра­

тов отклонений

экспериментальных точек

от сглаживающей

кривой. Иными

N

[ у ^ — ¥

словами, величина к = 2

J=1

х пи), аь ...,а5)]2должна быть сведена к минимуму. Здесь х ^ —

значение k-то фактора в /-м наблюдении, a y(i) — значение функции влияния факторов также в /-м наблюдении. Величи­ на aj, . . ., as, при которой достигается минимизация величи­ ны и, определяется из системы s уравнений:

^ = 0 ( i = l , 2,..., 5).

(10)

ОЯ;

 

Метод наименьших квадратов описан в ряде руководств по обработке наблюдений и математической статистике, напри­ мер в работе [5], и является весьма распространенным. Его основным недостатком является трудность отбора наиболее значимых факторов (существенно влияющих на выходное значение у). Действительно, если известно, что на величину у оказывают совокупное влияние п факторов х и . . . , х п, пред­ ставляет большой интерес не только построение математиче­ ской модели зависимости у = ц>(хи . . .,хп), но и оценка степени значимости каждого из факторов в отдельности. Заметим, что

15

отбор факторов предшествует построению математической мо­ дели зависимости. Сначала исследователь должен выделить, пользуясь методами математической статистики, наиболее влияющие на выходное значение процесса факторы, а затем построить математическую модель зависимости выходного значения у от у^ке отобранных факторов. В работе [6] описана модификация метода наименьших квадратов, позволяющая со­ четать отбор факторов с построением математической модели, которая приводится ниже.

Изложим еще одну распространенную за рубежом модель оценки зависимостей, так называемую модель Брандона, пос­ ле чего перейдем к разработанному способу отбора факторов.

Трудность стабилизации параметров, невозможность точ­ ного замера некоторых из них и ряд других обстоятельств, за­ висящих от производственных условий, проведения экспери­ мента, заставляют отказаться от обычной практики нахожде­ ния зависимостей и искать другой, более приемлемый метод их определения.

В зарубежной литературе [7, 8] излагается метод множест­ венной нелинейной корреляции. Ставится задача определить зависимость одного основного параметра системы от других параметров (хь х2, х3, ..., х п), то есть найти функцию

у — F (хх, х 2, х 3,...,хп).

Предполагается, что функция F является произведением некоторых функций отдельных параметров

У = К fi i.x i)U (*2) / 8 (*з) •••/„ (■*„).

(П)

причем каждая из / г (х() принимается для простоты расчета линейной

f l (xi) = al + bl x t.

Возможно использование и более сложной, нелинейной за­ висимости. Таким образом, задача сводится к определению коэффициентов ah bt \iK (i= 1, 2,. . ., п).

Исходными данными для такого расчета служит таблица экспериментальных данных, как и в методе наименьших квад­ ратов. Расчет начинается с построения графика зависимости у от X]. На этом графике получается корреляционное поле точек, из которых методом средних или методом наименьших квадратов [7] выявляется наибрлее вероятная линия репрес­ сии

hЫ = а1+ ь1 х х

иопределяются коэффициенты а\ и Ь\. После этого рассчи­ тываются значения нового приведенного параметра

У1 = ~

—Г - Kf-1(*«)/» (*s) - f n (х п)

(12)

f\

(*|)

 

16

и строится график зависимости у\ от хг, по которому опреде­ ляется уравнение линии репрессии /2(^2)- Затем рассчитыва­ ются значения следующего приведенного параметра:

( х 2)

и по графику зависимости г/г от Хз находится уравнение линии репрессии /3(*з). Такой расчет продолжается до тех пор, пока не будут определены все функции /г (xj) и коэффициент К.

Недостатки модели Брандона — трудность определения остаточной дисперсии погрешности оценки с помощью функ­ ции y = F ( x и, как следствие, невозможность прове­ дения отбора значимых факторов.

Переходим к описанию метода отбора значимых факторов и построения математической модели на основе данных отбо­ ра. Математические основы этого метода изложены в работах

[6], [И].

Одной из важных задач расчета динамики производствен­ ного процесса является проблема оптимизации производствен­ ного процесса— установления комбинации значений, влияю­ щих на процесс факторов, которые оптимизируют значение выходной функции процесса. Будем считать, что, помимо пе­ ременных технологических параметров, на значение функции процесса оказывает влияние большое количество не поддаю­ щихся учету случайных факторов.

Примем следующую математическую запись исследуемого технологического процесса:

^ =; А0+

x i + ••• + Ап х п + А.

(13)

Здесь W — оптимизируемая выходная функция

технологиче­

ского процесса;

 

A t— численные значения коэффициентов;

 

x t— переменные

технологические параметры, опреде­

ляющие значения оптимизируемой величины;

Д — нормальная

случайная величина с

параметрами

(а, а2), причем параметры А можно без ограниче­ ния общности свести к (0, а2).

Пусть имеется таблица N наблюдений исследуемого техно­ логического процесса:

W {1) х 1(1)...х „ (1)

W (N)x<N)...xn{N)

Здесь нижний индекс означает номер параметра, а верх­ ний— номер наблюдения. Обозначив //-мерный вектор W

значком W, а //-мерные векторы наблюдений параметров

2 Зак. 396

17

x L— через x h имеем:

\^ = Л 0Т +

2

A i x i +

/V

(14)

 

i = 1

 

 

 

Здесь 1— единичный W-мерный вектор, а А — iV-мерный

вектор значений А.

 

 

 

 

Обозначив хг= 1 / N ^ X i

;

и x t — x t — л;г,

получим

^ = (Л0 + S А; хг) + 2 АД + д!

 

i=l

 

i<=1

 

 

Ортогонализируем систему векторов х[ и получаем новую

систему взаимно ортогональных векторов

 

W = А0' 1 + 2 -4/

+ А,

 

отсюда

г '=

1

 

 

 

 

 

 

Л /...( ^ ё о

 

(д. ёГ)

 

(15)

(С.w

 

у

 

 

 

 

Здесь (а, Ь) — скалярное произведение векторов а и Ь. Отсюда можно определить параметры случайной величи­

ны А/:

(6/, 5г)

DA

(Si, Si)

Обозначив

II

1 I'M *

S ) gj.

можно показать, что

М ' ( р . р )

N —n

Отсюда

(Р- Р) ~ -,2

N —п

(16)

(17)

(18)

(19)

(20)

18

Получаем простую и весьма удобную с вычислительной точки зрения методику отбора значимых параметров, сущест­ венно влияющих на выходное значение производственного процесса. Строим п дисперсий:

 

(Ру. Р/)

/

U — !.•••. ч)\ РJ = W -

2

 

(21)

 

N — i

 

 

/=1

(tiX)

 

 

 

 

 

 

 

 

Если

при

переходе от / к (/+1)

факторам (добавляется

( /+ 1)-й

фактор)

величины о2 и а3+1

несущественно

отлича­

ются друг от друга (существенность отклонения можно оце­ нить с помощью различных критериев согласия), то это озна­ чает, что ( / + 1)-й фактор оказывает на выходное значение непосредственное влияние и может быть отброшен.

Проверка статистических гипотез о значимости расхожде­ ния двух дисперсий ог2 и о3+1 производится следующим обра­

зом. Для проверки такого рода гипотез используется распре­

деление отношений дисперсий

 

 

 

 

 

 

 

F = - ¥ ~ ,

 

 

(22)

 

 

 

 

а/-и

 

 

 

причем

постулируется,

что

дисперсии

а;3

и оД1

взяты из

нормальной генеральной совокупности.

F

(так называемое

Распределение

случайной

величины

Д-распределение Фишера) зависит только

от числа

степеней

свободы

Ki = N\—1

и

Kz= N2—1, если

дисперсии

а 2 и с2+1

взяты, соответственно, из выборок объема iV) и N2. В нашем

случае N 1= N2 = N и Ki = K2 = N—1. Чтобы проверить гипотезу

о равенстве а 2 и а-+1,мы должны построить критическую об­

ласть для критерия F, после чего,

сравнивая эмпирическое

значение F с этой областью, делаем

окончательный вывод.

Зададим коэффициент доверия р и зафиксируем два та­ ких интервала Fi и F2, что при соответствующих степенях сво­

боды Ki и Д2

 

P (F < /ф) = P ( F > F2) ~ 1 - р .

(23)

Если выборочное значение F оказывается в критической об­ ласти, то есть вне интервала [Еь /г], то гипотеза <з;2 = о?+1

должна быть отвергнута, так как вероятность того, что

F(~[Fi, Fq\, равна 1—2 р и весьма незначительна. В качестве коэффициента доверия р целесообразно принять равным 0,95.

Если значение F не выходит за пределы интервала [Еь/г], у нас нет оснований отвергнуть гипотезу о равенстве диспер­ сий. Таким образом, при F1<c F k F2 мы считаем, что Д+1)-й фактор оказывает несущественное влияние и может не учиты­ ваться. При F<Fi или F>F2 расхождение между а 2 и а3+1

считается существенным, и мы считаем добавление (t+ l)-ro фактора необходимым, а его влияние существенным.

2*

19

Таким образом, оценивая изменения дисперсии о2 от /= 1 до }= п, можно отобрать все значимые параметры xt.

Предлагаемая методика отбора параметров хг проста в применении и выгодно отличается от способа отбора парамет­ ров при обычном методе наименьших квадратов тем, что нуж­

но только один раз ортогонализировать систему векторов х/, а не обращать п раз матрицу соответственно для 1, 2 параметров. Вычислительные формулы существенно упроща­ ются и легко программируются на ЭВМ.

После получения коэффициентов A t переход к итоговым осуществляется по формуле

A n~k Ап. -k . 2

Aj

—>

(1 < * < я + 1). i <24>

} ~ n - k -\-1

 

(S/г—ft, £/z--ft)

I

В исследуемом примере процесса дегидрирования этил­ бензола в стирол на основании F-анализа ряда остаточных

дисперсий были отобраны следующие факторы:

Xi — соотношение пар — шихта;

 

х2 — температура верха реактора;

реактором;

х3

— давление перед адиабатическим

х4

— подача пара в пароперегревательную печь;

х9 — остаток в печном масле (для

исследуемого случая

в качестве фактора была выбрана активность катализатора — величина, обратная параметру).

В табл. 6 приведены данные измерений по группам для уже отобранных факторов (здесь х9 — активность катализа­ тора, остальные факторы взяты на основании отбора).

Отбор наиболее влияющих факторов может быть также приведен на основе анализа индексов корреляции. Заметим, однако, что статистический анализ в этом случае становится весьма трудоемким. Индекс корреляции представляет собой отношение среднеквадратичных отклонений

где

 

 

 

 

 

 

 

 

 

 

V%

 

N — 1

 

/

N

, Ж

Щ

 

 

 

 

i=i

 

N — l

 

 

(О._ j,®)2

Зу (*•/)

 

 

■У )2

 

 

 

 

 

 

 

 

 

уО' определяется

 

на

основании построения

квадратичной

модели

зависимости

у

от

соответствующего

Xj, то есть

у j l) ~ a j

-f- bj Xjl) +

Cj XjlP, где

параметры ауф и Cj неизвестны

и подлежат определению,

a

x'f — значение

/-го фактора в

20

Соседние файлы в папке книги из ГПНТБ