книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами
.pdfкопленная в УУ к s-му такту, т. е. информация, содержащаяся в сигналах и, у во все предшествующие моменты времени, включая (s—1 )-й: tr — след матрицы; <7* — вектор задаю щих воздействий. Ограничения на управляющие воздействия отсутствуют.
Рассматриваемая система является нейтральной, по тер минологии А. А. Фельдбаума [В. 15]. Для нахождения опти мального вектора достаточно минимизировать по w[s] уделы ный риск rsj_z .
Подставив (1. 171) в (1. 174) и выполнив операцию вы числения математического ожидания, получим при VlsI = «[sl
rs+T=M{(<7 *[s-l-r]— |
Aa\s) — |
—Cp. p-)//s_i} = (<?*[s+-r]—Л«Ы—Cjj. / н ^ ^ С ^ Д з + т]— |
|
— 1 |
], (1. 175) |
ms_i) + ^r[Cr (Ac 7c a Q;J.S_ ! |
где ms _i=yVl{a//s_1}—апостериорное математическое ожи дание вектора jj. при известных из мерениях выхода до (s—1 )-го такта
включительно;
—1
QaS_ l — апостериорная корреляционная мат
рица.
Поскольку оба слагаемых в (1. 175) положительны и от m[s] зависит только первое, то минимум функции риска
r s_i__ достигается, когда первое слагаемое равно нулю, т. е.
|?:i:[s+ T] —A«*|sl—Сц /ns- i = 0,
u:i=[s]=A-1(^H:ts-r1:]— |
ms- i) = A - 1z. |
(1.176) |
Условия существования и единственности управления |
||
Введем обозначения: |
|
|
(?*[s-M — |
1) — II ztj || /х ь |
|
А = II aij II 1x1 ■
.Оптимальное управление (1. 176) существует, если ранги матриц А и А\ совпадают, где
1(30
|
|
Zil |
|
|
|
|
|
i4i = |
г и |
|
|
|
|
|
aix.-.ац |
2/1 |
|
|
|
|
Это условие выполняется, если система (1. 171) |
полностью |
|||||
управляема. |
управление (1. |
176) |
единственно, |
если |
||
Оптимальное |
||||||
■Ч*—Ср ms - 1=£0 и ранг матрицы |
А |
равен I, т. |
е. | А ( |
=^0, |
||
где | А | — определитель матрицы |
А |
[1. 20]. |
|
|
||
Удельный |
риск при оптимальном |
управлении |
|
г * 5 + т— ^ '[С 7'|1 CqCy. Qfi.s—1 l = (,'s+'c)min
не зависит от управлений u[l\,i^s, следовательно, управ
ление м*[5) является одновременно оптимальным и по
П
критерию 7?„=Уи| ^ 1F,-J, т. е- обеспечивает минимум
/=т+ 1
полного риска.
Если условия существования и единственности не выпол няются, это значит, что нет такого управления u[s], при кото ром достигается нуль первого слагаемого в (1. 175) и нельзя пользоваться формулой ( 1 . 176). Оптимальное управление в общем случае найдем, продифференцировав по и[«] функ цию г5 |_т и приравняв производную нулю.
Применив правила векторного дифференцирования, по лучим
h-)/7s—j }= 0 ,
АтС9(?*[5+т] - А и*[5]-С^ ms_I)==0 .
Оптимальное управление в матричной форме находим из
соотношения |
|
АтС9А«*[5]= Л тС9(.7Ня+ х] - С ^ «*_!), |
(1.177) |
101
если |х — векторная случайная величина или
Л 7'С ?/1 и *Ы = А 7'С (г(г7*[5+т! — rns its-f-x]), ( 1 . 178)
если ji[s] — векторный случайный процесс, причем
/ns_ 1[s+T]=.M{Ji[s+^]//s_ 1) - |
(1. |
179) |
условное математическое ожидание р, в |
( s + t ) - m , |
такте |
вычисленное по известной информации, накопленной к (s—1 )- му включительно моменту времени.
Условия существования и единственности управления Обозначим:
D=ATCqA= Н || ш ,
Z = A TCq{q*[s+t]—Cp.ms_ i)= || Z,y|| /х1.
Условие существования решения (1. 177): ранги d и dt мат риц D и D\ должны совпадать, где D\ — расширенная мат рица:
Du .• • DU Z n
Dn •• ■D n
to . .
При d=di = l из |
(1. |
177) |
получаем |
(1. 176). |
Пусть |
0<id — di<l. Формула |
(1. |
177) |
является |
исходной |
для на |
хождения единственного значения оптимального «укорочен ного» d-мерного вектора управляющих воздействий
Вводя в рассмотрение «урезанные» матрицы
D d= || DdtJ || dxd,Zd= II |
Z dtj || dXU ttd[s]= || |
|| dXu |
где |
(Dd)T — Du, | D? | =7^0 , |
получим |
|
|
ud[s]= (Dd)~lZ d. |
(1 . |
180) |
Удельный риск при оптимальном управлении Mrf[s] равен
rds+z> r*s+x.
Заметим, что вывод формул (1. 176), (1. 177) мы провели, не используя плотности вероятности р. и h. Следовательно,
102
лолученный алгоритм является оптимальным при произволь ных законах распределения случайных параметров и помех. Конкретный же вид статистики m s-i , конечно, зависит от статистических характеристик случайных сигналов.
Перейдем к изучению задачи управления объектом с раз личными запаздываниями х, по отдельным каналам управ ления. Уравнения объекта:
7 [s]=*4a3kb[s]-M l/[s—1 1 = Ср, ц Ы -М И з—-т],
|
|
|
l/[s]=V7(u[s],s), |
|
|
|
|
|
(1 . |
181) |
|||
|
|
|
|
y[s]=G9[s]+5/i[s], |
|
|
|
|
|
|
|||
где |
|
l/[s—т]= |
|| |
]...K/ts—x/] || т. |
|
|
|
|
|||||
Компоненты |
вектора |
|
x/I, |
|
|
|
пронумеруем |
так, |
|||||
чтобы |
|
|
|
|
|
|
|
|
|
|
|
|
|
Трудность данной |
задачи |
заключается |
в |
том, |
что |
уп |
|||||||
равляющие |
воздействия I//[s—х(] |
по |
различным |
каналам, |
|||||||||
влияющие на выход |
в один |
и тот же |
момент |
времени |
|||||||||
s, нужно формировать на основании информации |
|
об |
|||||||||||
объекте, накопленной |
к разным |
моментам |
времени (s—tJ . |
||||||||||
,...,(s—хД... С другой |
стороны |
на |
основании |
информации |
|||||||||
Iк в /с-й момент времени необходимо выработать |
управле |
||||||||||||
ния, влияющие на выходные сигналы q объекта |
в |
разные |
|||||||||||
моменты времени: |
(«+хх), |
(/с+ха),...,(к+ х/). |
Это |
принци |
|||||||||
пиально отличает задачу от предыдущей. |
|
|
|
|
|
||||||||
Удельный условный риск в s-м такте равен |
|
|
|
||||||||||
|
rs= M ((q*— [i3KBls]—A H s—хрСд !(9*—[аэквЫ— |
|
|||||||||||
|
|
|
—л wls—т]) //s_ Xl_ i |
}, |
|
|
|
|
|
||||
Где |
|
|
|
Cgi — Cq=^CTqi. |
|
|
|
|
|
|
|||
Введем обозначения: |
|
|
|
|
|
|
|
|
|
|
|||
|
1 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
£ l= |
0 |
Et= |
i |
- i -я строка, |
/= 1 |
|
|
|
(1 . |
182) |
|||
|
|
|
|
||||||||||
|
|
|
|
|
|||||||||
|
6 |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
юз
С учетом принятого обозначения запишем
I
r{s]=M{(q*-v?KB[s} - £ A E . V j l s - ^ y CqA(q*-v?™[s]- i = 1
l
i= 0
Условие оптимальности управления Vjs —xj имеет вид l
|
d~ \ = |
{' |
A E M s - ч ]) + |
dV ils - ^] |
t=i |
||
|
|
i |
|
|
|
|
|
|
+{g^ - ^ l s ] - ^ 1AEiVils - x l]rcqAAEl/,s_ Xi_ l (= 0. |
||
|
|
i= 1 |
|
Из последней |
формулы находим оптимальное управление |
||
|
V ^ ls - x J - f r 'iA E iV СдМ * ~ |
^ { ^ KB[s]//s_ Tl_ i } - |
|
|
|
I |
|
|
|
i = 2 |
|
где |
fx -E -J А тCq\AEi. |
|
Например,, если Cq \= &\zg{Clq \.-.Qq i...Clq i\ — диагональная
l |
|
|
|
матрица и А = || ajK|| /х/, то / i = ^ |
0'д<\аг^ . |
Введем |
обо- |
/ = 1 |
|
|
|
значение: |
лг= 1 ,2 ,...,/, |
|
|
/% _^fs]=M {[4 s:]i//s_ Tw} , |
|
||
*«s[sl=»m4. |
|
(1. |
183) |
Ю4, |
|
|
|
Удельный риск при оптимальном управлении V'i’Ms—4 ]
равен |
^ |
r s(v i*[s—‘ |
ws_ Ti_ ! [s]— 2 Z A t iVAs— |
|
i=2 |
|
l |
—'1])1Сс1р.{я*— С рЩ --1- \ |
[s] —2 4 £ /yas--T j)//s_ Ta)+consp |
|
i=2 |
где Сц>2= ( \ - А Е , и - ' { к Е 1у с (1Лу С С1Л{\--АЕ1! г 1{АЕ,уСС1Л)-
I— единичная матрица-
Минимизируя его по V'a[s—-т2], получаем
V2*[s—Ч\=!-Г1{АЕгу Cq 2{q* - C [Lms__2[s ] - l
— 2 AE ^ils —'til).
»==«■ +1
Аналогично для любого к находим
V*K[s—-к\=и~1[АЕк)тСq<K{q * - c v ms_^. х [s ] -
l |
|
|
|
— 2 Л £ № - - /] ) , |
/с= 1 ,2 ,...,/ |
( 1 . |
181) |
1= /£+1 |
|
|
|
«*[s]=/7- 1(l/*[s])) |
|
|
|
где |
|
(1. |
185) |
fK= E \ A rCqicAEK; |
|
Cq^ { I - A E K_ x/7 -1 Е Т А Т С ^ )TCqtK_ x( I -
AEK1fK- 1E Tк_!Аг CqK—]).
1 . 5. 2 . Алгоритмы вычисления информационных координат
Алгоритм управления (1. 184) в классе нейтральных си стем является оптимальным при любом законе распределе
на
ния случайных сигналов, любых характеристиках измеритель ного устройства. В каналах измерения могут быть дополни тельные запаздывания. Однако вид информационных коор динат ms_ T<_ 1 [s], безусловно, зависит от плотностей вероят
ности сигналов р и /г и от матриц G и В в уравнении ( 1 . 171). Пусть р — векторная случайная величина и плотности ве роятности заданы соотношениями (1. 172), (1. 173). Опреде лим апостериорную плотность Р ,(р ). Введем в рассмотрение модель объекта по каналу «управление-выход» с уравнениями.
<7МЫ =ЛИ5—т]=Л /Г(гг[5—^]) при т^=т
или
1
l/[s— т]= ^ A E i V i l s —хг-] = ^4F( ttls—х])
«= 1
в общем случае.
Так как по отношению к возмущениям система линейная, а случайные параметры и помехи распределены нормально, но и ^$ (р ) соответствует нормальному закону, P s (p) пропор циональна выражению
s
e x p j - i - pr Q^ р - ^ - ^ ( y W - G q J tt - G C p гУ (В ~'УХ
/ = 1
XQ/!5_1(y[/] — Gqjj]—GC^ p )j= P s(p).
Воспользовавшись изложенной выше методикой, находим
p s(p)=P(v-lms,QVLs)
X e x p - J - ^ (p - /« s) 7'Q|JiS({*—/яв)|, |
(1 . 186) |
—1 |
(1. 187) |
где rtis^Q^iB G c ^ y Q h B J](y[/]—G<7M[/], |
l=l
106
Qy.s=Q* + s (£ -1OC(i y Q hB - l GC^ . |
( 1 . 188). |
Соотношения (1 . 187), (1. 188) можно представить в. рекуррентной форме:
—1
ms= m s^ l+QpS (B-WCp ) 7'Q/l5 - 1(y[s]-GgM[s] — GC^ ms- i),
|
(1. |
189> |
Q ^ Q ^ s - l + i B - ' G C ^ )TQ/tB- 1GC(X, |
(1. |
190) |
5=1,2,... |
|
|
Qh-0= Q ix ,m0=M{)>.}. |
|
|
В частности, для плотности (1. 173) математическое ожи дание т0 равно нулю. Вектор ms является вектором инфор
мационных координат. |
марков |
|
Перейдем к исследованию задачи управления |
||
ским объектом. Векторное марковское возмущение |
p[s] |
оп~ |
ределяется соотношением |
|
|
p[s]=Pix [s -l]+ 5 ^ [s], s = l , 2 ..., |
( 1 . |
191) |
где р, В g — матрицы размера
g[s] — векторный гауссов случайный процесс с независи мыми значениями, нулевыми средними и ковариационной матрицей Q-1.
Процесс p[s] характеризуется плотностью вероятности на чального состояния
Р № ) = ] / l^ H le x p l- i - ^ tO lQ ^ ix lO l )
v(2я)
иплотностью вероятности перехода
р(р[/]/^[/—и ) - i / |
I & |
J —i w |
- |
V |
(2 ^) |
' |
|
-p p .[/-l])r Qg(p[/]-pp[/-l])J, |
(1 . 192), |
Qg =(Bg- ' ) TQBg- \
10Г
Как и в предыдущем случае, апостериорная плотность
Ps_ T(l4s])= P { p [ s ] / m s _ x[s], Q [XiS— |
z Ы) |
|
подчиняется |
нормальному закону. Достаточные статистики |
|
/и5_ тЫ, |
—1 |
|
марковские, причем Q |
_ХЫ— коварици- |
•онная матрица, характеризующая точность оценки /га5_ тЫ. Примем
Щ — T[S т] ttlg— Qix,S— т ^ ^ = Q \x,S— т •
Справедливо соотношение |
|
|
|
|
|
|
P((j-[s]/ms,Q(AS)=P(ji[s]//ns_i.Qii.,s_i,9M[s],y[s]) = |
(1. |
193) |
||||
= N 1P(yls]/\>.ls],qlll{s])P{v.ls)/ms-u Q i>.)S- i ), |
||||||
|
|
|||||
тде N i— множитель, не зависящий |
от (4s] |
|
|
|||
P(/n[s]/p.s_i,QM _ i )= j |
|
1 ])P([i[s 1 ]/rtis—j,Q[j. 5—\)dQ |
||||
2 ( ( x [ s - l ] ) |
|
|
|
|
|
|
Учитывая (1. 192) и (1. |
186), |
последнюю формулу |
пре |
|||
образуем следующим образом: |
|
|
|
|
||
|
)=/У2|е х р |— ^-f(i4s]— |
|
|
|||
|
QWs-i]) |
|
|
|||
—Pf4s—1 ])г р^([1 Ы—p(ji[s—1])—(|j.[s—11— |
(!• |
194) |
||||
i)TQjj.^—i (t^t^ |
1 ) |
ftis—i)]W ^= |
|
|
||
I Q|i.,S-l Ы I •exp |
^-([A[5]-ms_1[s])TQ|, iS_ |
1 ЫХ |
||||
(2 )" |
|
|
|
|
|
X(|4s]— ,
где
/я5_хЫ = Ж {|i[s]// s_i} =pms_i;
Qn,i—l ld = Q ff[l—QgpCQp.s—i +pTQs-p)_ 1pTQS']—
= Qgp(QM - i + ptQ^p)_1Q^,s- |
i p-1- |
|
||
При выводе также учтено равенство |
|
|
||
QfJ.,S—1 ~Q|A,S—1 (QfX.S—1 + p TQgp) 1Q(JI,5—1 |
= p TQgp(Q(x,S—1 |
+ |
||
+ ptQ^p)-1Q!x>s_ i • |
|
|
||
Аналогично получаем, |
что |
P(p-[s+ t]/ rns-i,Qli S_i),%= 1,2,..,. |
||
подчиняется нормальному закону, причем |
|
|
||
|
|
Т~Ь 1 |
|
|
/ras_i[s+t]=M {p.[s-H \f$—i^= P ^ ms—1 з |
|
|||
a Qs- J s+ t] вычисляется по рекуррентной формуле. |
|
|||
Оценки ms_Js-t-T] |
используются при |
формировании оп |
||
тимального управления (1 . |
184). Информационные коорди |
|||
наты, входящие в ( 1 . |
184), равны |
|
|
|
ms_ .K_ i |
|
T/C-J-l |
|
|
Ы = р |
ms- x. |
(1. |
195)- |
Для их нахождения обратимся к выражению (1. 193). Первую условную плотность получаем из известной P(h[s]).
имодели объекта
Я(уЫ/р.Ы,?мЫ) = ex p j—-i(y[s]—G?M[sl—
- G C p iM W B - 'Y Q b B - i (у Ы -О ^ Ы -О С ^ уЫ)}- |
d- |
196) |
|||||||
Подставив |
(1. |
196) |
и |
(1. |
194) |
в |
формулу |
(1. |
193),. |
убеждаемся, |
что и |
плотность |
P(p.[s]//ns,Qas) подчиняется |
||||||
нормальному |
закону. |
Достаточные |
статистики ms= m s[s],. |
||||||
Qixs= Q^ls] определяются уравнениями: |
|
|
|
||||||
—1 |
|
|
|
—1 |
|
—1 |
|
|
|
т8 — Qps [Qfzs—iklpms_i4 -(B |
GCp )T QhB' |
(yls]—Gquls])]= |
|||||||
—l |
|
|
|
|
|
|
—1 |
|
|
= Q (IS Qgp(Q^s—1 d'P7' Qg-p) |
^Qfis—lms-\+ QjlS (B |
)Tx |
10»