книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами
.pdfТа= а Н -у % ц Я ’й >
Й(У[*Я.®])
если в s-й момент времени производится измерение w, т. а s кратно т,
Ts==as + ^Ts+i*^>
Й(У[«Л>5])
если s не кратно х, причем
У1к„,в]= II yl/c^s],...,у 1кп,s] || т,
a s |
Ws(te*[5]tB»[s])POi[0])P(X[0])nРЫЛ I A i - |
|
|
|
i= 1 |
|
ОМ®]. 4®]) |
|
|
-ll)P (X [/l |
|W / -1 D X |
X п |
| П Р (у [/^ ]| З Л Л )} |
П я ( у в [/] I «»[/],М/],и[/])^Й- |
1 = 0 Kn |
/ = т , 2 т , . . „ |
160
Буквой v (v < s) обозначен номер такта, ближайшего к s-му,
вкоторый измеряется до.
Вработе [В. 16] рассмотрена задача управления линейным объектом с запаздыванием и одним косвенным показателем. Полученное управляющее устройство можно представить так, как показано на рис. 3. 1. В этом случае ВУ-1 включает звено
сзапаздыванием и фильтр, параметры которого меняются скачком при каждом новом измерении выхода до.
3.2. АДАПТИВНЫЙ РАСПРЕДЕЛЕННЫЙ КОНТРОЛЬ
ВРАЗОМКНУТЫХ СИСТЕМАХ
Выше, в разделах 1 и 2, а также в ряде работ (например, [В. 56], [3. 7—3. 11]) указывалось на возможность примене ния для управления объектами распределенного контроля, позволяющего учесть свойства распределенности управляемо го процесса и тем самым повысить качество систем управле ния. При этом возникает задача определения оптимальной ве совой функции распределенного контроля. Такая задача ре шается, например, в детерминистской постановке в работе [3. 8]. Автор синтезирует оптимальную весовую функцию рас пределенного контроля для объекта с известным математиче ским описанием и заданным управляющим устройством.
Статистическая постановка задачи содержится в [3. 9— 3. 11]. Неполнота информации о протекании процессов в уп равляемом объекте и изменение режимов работы приводит к задаче применения адаптивного распределенного контроля, т. е. построению такого устройства контроля, в котором мож но менять его весовую функцию в зависимости от состояния регулируемого объекта. Действительно, при управлении та кими процессами оптимальная весовая функция распределен ного контроля для данного времени, вследствие дрейфа харак теристик, в последующие моменты времени может значитель но отличаться от оптимальной. Ниже синтезируется устройство адаптивного дискретного распределенного контроля косвен ных показателей для одного класса распределенных объектов [3. 9—3. 11]. Считаем, что в системе на рис. 3. 1 блок УБ от сутствует, ВУ-1 решает задачу дискретного распределенного контроля q{xK, /) и прогноза выхода до, а ВУ-2 предназначено для настройки ВУ-1 путем коррекции вектора весовых коэф фициентов
а = II «1,га,••■,«/ II т-
J1 |
2217 |
161 |
Вид уравнений, описывающих объект, неизвестен, но дол жен удовлетворять следующему условию: регрессия до на q может быть аппроксимирована линейной зависимостью. Пред положив, что q измеряется точно, введем сигнал дискретного распределенного контроля
1
Q(s]= У] aKqKlxK,s —хЛ]=oc3"^[s—т],
к = 0
qls—т]= \\ql[s—xi]...ql[s—-zl\ || г . |
(3. 3) |
Если можно задать модель объекта по каналам «контролируе мые входы и — косвенные q и выходные показатели ну», т о сигнал в непрерывном времени целесообразно формировать в виде [3. 12]
I |
|
Q(t)= |
(/7)}-(-f(xo,...,x/,M(O),0==/), (3. 4) |
к=О |
|
где р — оператор; |
|
L-1 — обратное преобразование Лапласа; |
|
Фд w(p)— передаточная |
функция между сигналами |
а{хк,р) и w(p).
Слагаемое f в (3. 4) может отсутствовать.
Определим весовые коэффициенты дискретного распре деленного контроля ак (к—1, 2, .., I) такие, чтобы косвенный показатель был наилучшим по критерию R приближением вы ходного показателя до, причем
/?=*=Л4{W(доЫ, Q Ы )}= М {W(Gw[s],a[s],(?[s—'])), |
(3. 5) |
где G — заданный оператор преобразования выхода до.
При квадратической функции потерь задача определения
весовых коэффициентов |
дискретного |
распределенного конт |
|
роля сводится к оценке |
параметров |
в уравнении |
регрессии. |
Для решения поставленной задачи |
воспользуемся |
методом |
стохастической аппроксимации [В. 17, 3. 9—3. 10]. Алгоритм настройки вектора коэффициентов имеет вид
a[s] =a[s—1]—ГЫ Va W(a[s— 1 l,ce»[s],G—1qr[s—~1}, (3. 6)
162
где Va № — градиент функции потерь W по вектору а;
G-1 — оператор, обратный оператору G (например, опера тор задержки, обратный оператору прогнозирования);
r[s] — матрица переменных коэффициентов, удовлетво ряющих условиям Роббинса и Монро. Этим условиям, в част ности, удовлетворяет диагональная матрица
/ Ы = diagj f0Ы,. •• |
■.T/tsl) i |
(3- 7) |
||
В |
|
в |
|
|
где -рсЫ= — ~~ |
или y«[s]= ТТ-4-; Вк,Ск— константы; |
|||
о |
|
С k + |
S |
|
|
|
/с=0,1 |
|
|
Алгоритм (3. 6) |
обеспечивает сходимость a[s] в асимптотике |
|||
к значению а*, |
дающему минимум критерия (3. 5). |
Однако |
||
при практическом использовании алгоритмов типа (3. |
6) в си |
стемах с адаптацией возникают трудности, связанные с огра ниченной длиной реализации сигналов. Применение же адап тации оправдано лишь при дрейфующем а*. В противном случае параметры определяются один раз во время наладки системы и затем не меняются. Следовательно, с одной сторо ны получение очень длинных реализаций затруднительно, с другой — нецелесообразно из-за возможной нестационарностн объекта. Поэтому повышение скорости сходимости явля ется одним из условий эффективного применения алгоритмов [3. 13]. В зависимости от выбора A[s] получаются различные модификации алгоритма (3. 6). Один из способов ускорения сходимости предложен Г. Кестеном [3. 14]. Коэффициенты T k [ s ] в алгоритме выбираются следующим образом:
-рД1]= £к, ТЛ2] = Вк/2;
s
^КЫ = 5 К[2+ ^ £ { (aKUl—0LK[i— l])(aKU— П—aKU—2])}]—1;
f 1 при {-)<0
(3. 8)
j 0 при { )>0.
Ускорение сходимости достигается за счет того, что в об ласти, удаленной от оптимальных значений коэффициентов, выражение (ак[Л—a jt —1]) редко меняет знак. Поэтому коэффициент Тк изменяется в этой области медленнее, чем коэффициент, входящий в матрицу K[s] (3. 7) обычного ва
163
рианта алгоритма стохастической аппроксимации. В окрест ности точки оптимума [s] уменьшается, обеспечивая асимптотическую сходимость.
Я- 3. Цыпкиным [В. 17] предложено находить компонен ты Тк диагональной матрицы (3. 7) путем минимизации по вектору 7 Ы = II 70[s]...f/[s] || т выборочного функционала
|
S |
|
Яэ= |
W(Go»[£],a[s— n.flsl). |
(3. 9) |
|
i = l |
|
При квадратичной функции потерь W такой подход приводит к рекуррентной форме записи алгоритма наименьших квад ратов. При этом
s
ГЫ = [ ^ .q{j-^]qT[j-r.]]-\ |
(3.10) |
/= 1
164
Рис. 3.4
.cr-
.«л
Рис. 3.5
Отметим, что структура последнего алгоритма такова, что начальные значения компонентов вектора а[0] перестают вли ять на величины настраиваемых коэффициентов спустя I так тов работы алгоритма. Поэтому априорные сведения относи тельно а при использовании формул наименьших квадратов бесполезны.
Экспериментальная проверка работоспособности различ ных модификаций алгоритма (3. 6) настройки весовых коэф фициентов осуществлялась в системе дискретного распреде ленного контроля процесса помола клинкера в цементной мельнице открытого цикла [3. 10]. Рис. 3. 3 иллюстрирует изменение во времени расстояния до области оптимума (пунк
тирная линия) |
при настройке двух коэффициентов по обычно |
||
му алгоритму |
(3. 6) — (3. |
7). Кривые 1 и 2 соответствуют зна |
|
чениям B i= B2=0,\5 |
и |
начальным условиям ai[0] = a2[0]= 0 |
|
и ai[0] = a2[0]= —4. |
Кривая 3 построена для В{ = В2—\. Из |
рисунка видно, насколько характер сходимости зависит от вы
бора параметров матрицы |
T[s]. |
(3. 8) Кестена |
(кри |
||
Процесс сходимости |
по |
алгоритму |
|||
вая 1) |
и по алгоритму |
(3. |
10) наименьших квадратов |
(кри |
|
вая 2) |
представлен на рис. 3. 4. |
|
|
||
Точность прогноза w по сигналам q иллюстрирует рис. 3. 5. |
|||||
Здесь |
1 — действительные значения w, |
2 — прогноз. |
|
3. 3. ОПТИМИЗАЦИЯ ЗАМКНУТЫХ СИСТЕМ УПРАВЛЕНИЯ С АДАПТИВНЫМ РАСПРЕДЕЛЕННЫМ КОНТРОЛЕМ
КОСВЕННЫХ ПОКАЗАТЕЛЕЙ
Рассмотрим общий подход к решению задач синтеза адап тивных алгоритмов параметрической оптимизации замкну тых систем с распределенным контролем при наличии несколь ких управляющих входов и и нескольких выходов ху, измеряе мых с помехами h. На рис. 3. 1 показана блок-схема системы.
К объекту приложены сосредоточенные ц°(0. МО и распре деленное ц(х, t) возмущающие воздействия. ВУ-2 работает на
основе |
информации, содержащейся в сигналах <?о, |
Ц / ; |
в= ш— |
где w* — требуемое значение выхода w. |
Реа |
лизация ВУ-2 возможна, например, в виде программы управ ляющей вычислительной машины (УВМ), а УБ и ВУ-1 — на обычной аппаратуре промышленной автоматики. При пере рыве в поступлении данных о w или при выходе из строя и отключении УВМ локальная система регулирования продол
167
жает работать с постоянными ненастраиваемыми параметра ми. Структуры блоков УБ и ВУ-1 считаем известными. Возмо жен и другой путь, когда все устройства УБ, ВУ-1, ВУ-2 реали зуются программно на УВМ.
Критерий оптимальности работы системы R определяется значениями выходного показателя до, согласно (3. 1).
Функция потерь W — выпуклая дифференцируемая. Пред полагаем, что в допустимой области изменения параметров а функция /?(а) имеет единственный экстремум. Условия су ществования и единственности экстремума должны быть рас смотрены особо, применительно к отдельным классам систем. Задача синтеза состоит в следующем. Требуется найти алго ритм функционирования ВУ-2, обеспечивающий в условиях случайных помех сходимость параметров к оптимальным зна чениям а*, при которых
/?(а*) = т!п/?(а). |
(3. 11) |
а |
|
Воспользуемся методами стохастической аппроксимации и теории чувствительности. Рассмотрим вначале простой одно мерный случай, а затем проведем обобщение результатов на многомерные линейные системы [3. 151.
3. 3. 1. Настройка коэффициентов распределенного контроля в замкнутой схеме
Пусть объект с распределенными параметрами устойчив и описывается следующими уравнениями в операционной
форме: |
|
|
д(х,р) = Ф(х,р){и(р)+р°<р)]+А1111(х,р),(г(х,р)}; |
(3. |
12) |
(0 < х < /н, 0<х</„) |
|
|
и>(р)=Фи(р)и(Р)+Фр (Р)\>-0(Р)+1{ Р )+ М Н *’Р)Л'{Р)\- |
(3. |
13) |
Здесь Фи (р ), Ф,А(р), Ф(х, р) — передаточные функции, при
чем Ф{х, р) зависит не только от оператора р, но и от прост ранственной координаты х. Возмущающие воздействия ц°(/), K(t) считаем стационарными случайными функциями. Распре деленное возмущение ц(х, /) — случайное поле, стационарное по аргументу /; А\ и А2 — некоторые линейные операторы, ха рактеризующие связь между ц(х, /) и выходными сигналами
16»
q(x.. t) и w(t)\ контроль q (x, i) осуществляется в дискретном ряде точек х i (i = О, 1, /). Управление определяется сле дующим выражением:
/ |
|
« ( » = —'Фр№)ЛсчФ;,р)+Фр(р)в(р), |
(3. 14) |
г=0 |
|
гдеФ ^д) — передаточная функция регулятора. Все входные и выходные переменные считаем скалярами. Предполагаем также, что инерционность и запаздывание в канале «управ ление и — выход w» значительно больше, чем в контуре ре гулирования по косвенным показателям. Это естественное предположение обычно оправдывается на практике. Одновре менно это одно из условий эффективного применения косвен ных показателей для целей управления.
Определим градиент функции потерь W по а:
Va W =W ,(e)S. |
(3. 15) |
где 5 — вектор функций чувствительности. |
|
5 = УЗ Д .....Si..... 5/ || 5/== |
. |
(/=0,1,...,/)
В соответствии с [3. 15] запишем алгоритм настройки пара метров распределенного контроля внепрерывной форме:
“57T(0W'(e)S. |
(3. 16) |
где у (/) — матрица переменных коэффициентов, удовлетво ряющих условиям Роббинса—Монро. Обычный путь получения функций чувствительности S/ [3. 16] состоит в построении модели чувствительности, на вход которой подается сигнал ге. Учитывая спорадический характер поступления сигнала w и возможность случайного перерыва, откажемся от такого пути ипопытаемся сформировать функциичувствительности 5 /, используя лишь косвенные показатели qi. При этом можно также надеяться на ослабление требований к точности реали зации модели чувствительности и упрощение системы.
169