Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами

.pdf
Скачиваний:
5
Добавлен:
19.10.2023
Размер:
6.85 Mб
Скачать

копленная в УУ к s-му такту, т. е. информация, содержащаяся в сигналах и, у во все предшествующие моменты времени, включая (s1 )-й: tr — след матрицы; <7* — вектор задаю­ щих воздействий. Ограничения на управляющие воздействия отсутствуют.

Рассматриваемая система является нейтральной, по тер­ минологии А. А. Фельдбаума [В. 15]. Для нахождения опти­ мального вектора достаточно минимизировать по w[s] уделы ный риск rsj_z .

Подставив (1. 171) в (1. 174) и выполнив операцию вы­ числения математического ожидания, получим при VlsI = «[sl

rs+T=M{(<7 *[s-l-r]—

Aa\s) —

—Cp. p-)//s_i} = (<?*[s+-r]—Л«Ы—Cjj. / н ^ ^ С ^ Д з + т]—

1

], (1. 175)

ms_i) + ^r[Cr (Ac 7c a Q;J.S_ !

где ms _i=yVl{a//s_1}—апостериорное математическое ожи­ дание вектора jj. при известных из­ мерениях выхода до (s—1 )-го такта

включительно;

—1

QaS_ l — апостериорная корреляционная мат­

рица.

Поскольку оба слагаемых в (1. 175) положительны и от m[s] зависит только первое, то минимум функции риска

r s_i__ достигается, когда первое слагаемое равно нулю, т. е.

|?:i:[s+ T] —A«*|sl—Сц /ns- i = 0,

u:i=[s]=A-1(^H:ts-r1:]—

ms- i) = A - 1z.

(1.176)

Условия существования и единственности управления

Введем обозначения:

 

 

(?*[s-M —

1) — II ztj || /х ь

 

А = II aij II 1x1 ■

.Оптимальное управление (1. 176) существует, если ранги матриц А и А\ совпадают, где

1(30

 

 

Zil

 

 

 

 

i4i =

г и

 

 

 

 

aix.-.ац

2/1

 

 

 

Это условие выполняется, если система (1. 171)

полностью

управляема.

управление (1.

176)

единственно,

если

Оптимальное

■Ч*—Ср ms - 1=£0 и ранг матрицы

А

равен I, т.

е. | А (

=^0,

где | А | — определитель матрицы

А

[1. 20].

 

 

Удельный

риск при оптимальном

управлении

 

г * 5 + т— ^ '[С 7'|1 CqCy. Qfi.s—1 l = (,'s+'c)min

не зависит от управлений u[l\,i^s, следовательно, управ­

ление м*[5) является одновременно оптимальным и по

П

критерию 7?„=Уи| ^ 1F,-J, т. е- обеспечивает минимум

/=т+ 1

полного риска.

Если условия существования и единственности не выпол­ няются, это значит, что нет такого управления u[s], при кото­ ром достигается нуль первого слагаемого в (1. 175) и нельзя пользоваться формулой ( 1 . 176). Оптимальное управление в общем случае найдем, продифференцировав по и[«] функ­ цию г5 |_т и приравняв производную нулю.

Применив правила векторного дифференцирования, по­ лучим

h-)/7s—j }= 0 ,

АтС9(?*[5+т] - А и*[5]-С^ ms_I)==0 .

Оптимальное управление в матричной форме находим из

соотношения

 

АтС9А«*[5]= Л тС9(.7Ня+ х] - С ^ «*_!),

(1.177)

101

если |х — векторная случайная величина или

Л 7'С ?/1 и *Ы = А 7'С (г(г7*[5+т! rns its-f-x]), ( 1 . 178)

если ji[s] — векторный случайный процесс, причем

/ns_ 1[s+T]=.M{Ji[s+^]//s_ 1) -

(1.

179)

условное математическое ожидание р, в

( s + t ) - m ,

такте

вычисленное по известной информации, накопленной к (s1 )- му включительно моменту времени.

Условия существования и единственности управления Обозначим:

D=ATCqA= Н || ш ,

Z = A TCq{q*[s+t]—Cp.ms_ i)= || Z,y|| /х1.

Условие существования решения (1. 177): ранги d и dt мат­ риц D и D\ должны совпадать, где D\ — расширенная мат­ рица:

Du .• • DU Z n

Dn •• ■D n

to . .

При d=di = l из

(1.

177)

получаем

(1. 176).

Пусть

0<id — di<l. Формула

(1.

177)

является

исходной

для на­

хождения единственного значения оптимального «укорочен­ ного» d-мерного вектора управляющих воздействий

Вводя в рассмотрение «урезанные» матрицы

D d= || DdtJ || dxd,Zd= II

Z dtj || dXU ttd[s]= ||

|| dXu

где

(Dd)T — Du, | D? | =7^0 ,

получим

 

 

ud[s]= (Dd)~lZ d.

(1 .

180)

Удельный риск при оптимальном управлении Mrf[s] равен

rds+z> r*s+x.

Заметим, что вывод формул (1. 176), (1. 177) мы провели, не используя плотности вероятности р. и h. Следовательно,

102

лолученный алгоритм является оптимальным при произволь­ ных законах распределения случайных параметров и помех. Конкретный же вид статистики m s-i , конечно, зависит от статистических характеристик случайных сигналов.

Перейдем к изучению задачи управления объектом с раз­ личными запаздываниями х, по отдельным каналам управ­ ления. Уравнения объекта:

7 [s]=*4a3kb[s]-M l/[s—1 1 = Ср, ц Ы -М И з—-т],

 

 

 

l/[s]=V7(u[s],s),

 

 

 

 

 

(1 .

181)

 

 

 

 

y[s]=G9[s]+5/i[s],

 

 

 

 

 

 

где

 

l/[s—т]=

||

]...K/ts—x/] || т.

 

 

 

 

Компоненты

вектора

 

x/I,

 

 

 

пронумеруем

так,

чтобы

 

 

 

 

 

 

 

 

 

 

 

 

 

Трудность данной

задачи

заключается

в

том,

что

уп­

равляющие

воздействия I//[s—х(]

по

различным

каналам,

влияющие на выход

в один

и тот же

момент

времени

s, нужно формировать на основании информации

 

об

объекте, накопленной

к разным

моментам

времени (s—tJ .

,...,(s—хД... С другой

стороны

на

основании

информации

в /с-й момент времени необходимо выработать

управле­

ния, влияющие на выходные сигналы q объекта

в

разные

моменты времени:

(«+хх),

(/с+ха),...,(к+ х/).

Это

принци­

пиально отличает задачу от предыдущей.

 

 

 

 

 

Удельный условный риск в s-м такте равен

 

 

 

 

rs= M ((q*— [i3KBls]—A H s—хрСд !(9*—[аэквЫ—

 

 

 

 

—л wls—т]) //s_ Xl_ i

},

 

 

 

 

 

Где

 

 

 

Cgi — Cq=^CTqi.

 

 

 

 

 

 

Введем обозначения:

 

 

 

 

 

 

 

 

 

 

 

1

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

£ l=

0

Et=

i

- i -я строка,

/= 1

 

 

 

(1 .

182)

 

 

 

 

 

 

 

 

 

 

6

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

юз

С учетом принятого обозначения запишем

I

r{s]=M{(q*-v?KB[s} - £ A E . V j l s - ^ y CqA(q*-v?™[s]- i = 1

l

i= 0

Условие оптимальности управления Vjs —xj имеет вид l

 

d~ \ =

{'

A E M s - ч ]) +

dV ils - ^]

t=i

 

 

i

 

 

 

 

+{g^ - ^ l s ] - ^ 1AEiVils - x l]rcqAAEl/,s_ Xi_ l (= 0.

 

 

i= 1

 

Из последней

формулы находим оптимальное управление

 

V ^ ls - x J - f r 'iA E iV СдМ * ~

^ { ^ KB[s]//s_ Tl_ i } -

 

 

I

 

 

 

i = 2

 

где

fx -E -J А тCq\AEi.

 

Например,, если Cq \= &\zg{Clq \.-.Qq i...Clq i\ — диагональная

l

 

 

 

матрица и А = || ajK|| /х/, то / i = ^

0'д<\аг^ .

Введем

обо-

/ = 1

 

 

значение:

лг= 1 ,2 ,...,/,

 

/% _^fs]=M {[4 s:]i//s_ Tw} ,

 

*«s[sl=»m4.

 

(1.

183)

Ю4,

 

 

 

Удельный риск при оптимальном управлении V'i’Ms4 ]

равен

^

r s(v i*[s—‘

ws_ Ti_ ! [s]— 2 Z A t iVAs—

 

i=2

 

l

—'1])1Сс1р.{я*— С рЩ --1- \

[s] —2 4 £ /yas--T j)//s_ Ta)+consp

 

i=2

где Сц>2= ( \ - А Е , и - ' { к Е 1у с (1Лу С С1Л{\--АЕ1! г 1{АЕ,уСС1Л)-

I— единичная матрица-

Минимизируя его по V'a[s—-т2], получаем

V2*[s—Ч\=!-Г1{АЕгу Cq 2{q* - C [Lms__2[s ] - l

2 AE ^ils —'til).

»==«■ +1

Аналогично для любого к находим

V*K[s—-к\=и~1[АЕк)тСq<K{q * - c v ms_^. х [s ] -

l

 

 

 

2 Л £ № - - /] ) ,

/с= 1 ,2 ,...,/

( 1 .

181)

1= /£+1

 

 

 

«*[s]=/7- 1(l/*[s]))

 

 

где

 

(1.

185)

fK= E \ A rCqicAEK;

 

Cq^ { I - A E K_ x/7 -1 Е Т А Т С ^ )TCqtK_ x( I -

AEK1fK- 1E Tк_!Аг CqK—]).

1 . 5. 2 . Алгоритмы вычисления информационных координат

Алгоритм управления (1. 184) в классе нейтральных си­ стем является оптимальным при любом законе распределе­

на

ния случайных сигналов, любых характеристиках измеритель­ ного устройства. В каналах измерения могут быть дополни­ тельные запаздывания. Однако вид информационных коор­ динат ms_ T<_ 1 [s], безусловно, зависит от плотностей вероят­

ности сигналов р и /г и от матриц G и В в уравнении ( 1 . 171). Пусть р — векторная случайная величина и плотности ве­ роятности заданы соотношениями (1. 172), (1. 173). Опреде­ лим апостериорную плотность Р ,(р ). Введем в рассмотрение модель объекта по каналу «управление-выход» с уравнениями.

<7МЫ =ЛИ5—т]=Л /Г(гг[5—^]) при т^=т

или

1

l/[s— т]= ^ A E i V i l s хг-] = ^4F( ttls—х])

«= 1

в общем случае.

Так как по отношению к возмущениям система линейная, а случайные параметры и помехи распределены нормально, но и ^$ (р ) соответствует нормальному закону, P s (p) пропор­ циональна выражению

s

e x p j - i - pr Q^ р - ^ - ^ ( y W - G q J tt - G C p гУ (В ~'УХ

/ = 1

XQ/!5_1(y[/] — Gqjj]—GC^ p )j= P s(p).

Воспользовавшись изложенной выше методикой, находим

p s(p)=P(v-lms,QVLs)

X e x p - J - ^ (p - /« s) 7'Q|JiS({*—/яв)|,

(1 . 186)

—1

(1. 187)

где rtis^Q^iB G c ^ y Q h B J](y[/]—G<7M[/],

l=l

106

Qy.s=Q* + s (£ -1OC(i y Q hB - l GC^ .

( 1 . 188).

Соотношения (1 . 187), (1. 188) можно представить в. рекуррентной форме:

—1

ms= m s^ l+QpS (B-WCp ) 7'Q/l5 - 1(y[s]-GgM[s]GC^ ms- i),

 

(1.

189>

Q ^ Q ^ s - l + i B - ' G C ^ )TQ/tB- 1GC(X,

(1.

190)

5=1,2,...

 

 

Qh-0= Q ix ,m0=M{)>.}.

 

 

В частности, для плотности (1. 173) математическое ожи­ дание т0 равно нулю. Вектор ms является вектором инфор­

мационных координат.

марков­

Перейдем к исследованию задачи управления

ским объектом. Векторное марковское возмущение

p[s]

оп~

ределяется соотношением

 

 

p[s]=Pix [s -l]+ 5 ^ [s], s = l , 2 ...,

( 1 .

191)

где р, В g — матрицы размера

g[s] — векторный гауссов случайный процесс с независи­ мыми значениями, нулевыми средними и ковариационной матрицей Q-1.

Процесс p[s] характеризуется плотностью вероятности на­ чального состояния

Р № ) = ] / l^ H le x p l- i - ^ tO lQ ^ ix lO l )

v(2я)

иплотностью вероятности перехода

р(р[/]/^[/—и ) - i /

I &

J —i w

-

V

(2 ^)

'

 

-p p .[/-l])r Qg(p[/]-pp[/-l])J,

(1 . 192),

Qg =(Bg- ' ) TQBg- \

10Г

Как и в предыдущем случае, апостериорная плотность

Ps_ T(l4s])= P { p [ s ] / m s _ x[s], Q [XiS—

z Ы)

подчиняется

нормальному закону. Достаточные статистики

5_ тЫ,

—1

марковские, причем Q

_ХЫ— коварици-

•онная матрица, характеризующая точность оценки /га5_ тЫ. Примем

Щ — T[S т] ttlgQix,S— т ^ ^ = Q \x,S— т •

Справедливо соотношение

 

 

 

 

 

P((j-[s]/ms,Q(AS)=P(ji[s]//ns_i.Qii.,s_i,9M[s],y[s]) =

(1.

193)

= N 1P(yls]/\>.ls],qlll{s])P{v.ls)/ms-u Q i>.)S- i ),

 

 

тде N i— множитель, не зависящий

от (4s]

 

 

P(/n[s]/p.s_i,QM _ i )= j

 

1 ])P([i[s 1 ]/rtis—j,Q[j. 5—\)dQ

2 ( ( x [ s - l ] )

 

 

 

 

 

Учитывая (1. 192) и (1.

186),

последнюю формулу

пре­

образуем следующим образом:

 

 

 

 

 

)=/У2|е х р |— ^-f(i4s]—

 

 

 

QWs-i])

 

 

—Pf4s—1 ])г р^([1 Ы—p(ji[s—1])—(|j.[s—11—

(!•

194)

i)TQjj.^—i (t^t^

1 )

ftis—i)]W ^=

 

 

I Q|i.,S-l Ы I •exp

^-([A[5]-ms_1[s])TQ|, iS_

1 ЫХ

(2 )"

 

 

 

 

 

X(|4s]— ,

где

5_хЫ = Ж {|i[s]// s_i} =pms_i;

Qn,i—l ld = Q ff[l—QgpCQp.s—i +pTQs-p)_ 1pTQS']—

= Qgp(QM - i + ptQ^p)_1Q^,s-

i p-1-

 

При выводе также учтено равенство

 

 

QfJ.,S—1 ~Q|A,S—1 (QfX.S—1 + p TQgp) 1Q(JI,5—1

= p TQgp(Q(x,S—1

+

+ ptQ^p)-1Q!x>s_ i

 

 

Аналогично получаем,

что

P(p-[s+ t]/ rns-i,Qli S_i),%= 1,2,..,.

подчиняется нормальному закону, причем

 

 

 

 

Т~Ь 1

 

/ras_i[s+t]=M {p.[s-H \f$—i^= P ^ ms—1 з

 

a Qs- J s+ t] вычисляется по рекуррентной формуле.

 

Оценки ms_Js-t-T]

используются при

формировании оп­

тимального управления (1 .

184). Информационные коорди­

наты, входящие в ( 1 .

184), равны

 

 

ms_ .K_ i

 

T/C-J-l

 

 

Ы = р

ms- x.

(1.

195)-

Для их нахождения обратимся к выражению (1. 193). Первую условную плотность получаем из известной P(h[s]).

имодели объекта

Я(уЫ/р.Ы,?мЫ) = ex p j—-i(y[s]—G?M[sl—

- G C p iM W B - 'Y Q b B - i (у Ы ^ Ы С ^ уЫ)}-

d-

196)

Подставив

(1.

196)

и

(1.

194)

в

формулу

(1.

193),.

убеждаемся,

что и

плотность

P(p.[s]//ns,Qas) подчиняется

нормальному

закону.

Достаточные

статистики ms= m s[s],.

Qixs= Q^ls] определяются уравнениями:

 

 

 

—1

 

 

 

—1

 

—1

 

 

т8 — Qps [Qfzs—iklpms_i4 -(B

GCp )T QhB'

(yls]—Gquls])]=

—l

 

 

 

 

 

 

—1

 

 

= Q (IS Qgp(Q^s—1 d'P7' Qg-p)

^Qfis—lms-\+ QjlS (B

)Tx

10»

Соседние файлы в папке книги из ГПНТБ