книги из ГПНТБ / Ларин В.Б. Синтез оптимальных линейных систем с обратной связью
.pdfгде
|
|
Р |
О |
|
м |
|
|
Р о ~ |
о |
Ея |
М0 — о, |
|
|||
|
|
|
|
|
тХп |
||
W * [ ^ ; |
Wt], |
R0 = |
[Еп- - Eny R [£„; - En], |
||||
X |
= |
S,|, |
0 |
5ф =s |
SVx |
0 |
|
0 s r |
О |
5 Ф/. |
|||||
|
Таким образом, задача синтеза оптимальной линейной следящей системы сведена к задаче синтеза системы ста билизации объекта, движение которого описывается урав нениями (4.59) при критерии качества (4.60), и, согласно 3 41), решение имеет вид
W = IWV |
W2] = |
[А; (s) H~lQ-;lC + (К - - |
L0 - |
L+) X |
||||
X / г ч г 1 [ ( / < - - x |
- |
L + ) D ~ ] p o - H : ' Q : ' N 0.,R ], |
||||||
или |
|
|
|
|
|
|
|
|
w = i ^ , |
\FS] = [(/C0 + K + + |
La + L+) D~'M0 - |
Н В Г 1X |
|||||
|
X |
[(/C0 + |
K+ + |
L0+ |
L+ ) D~lP о + |
HA], |
|
|
где |
|
|
Ap {s) = |
detP, |
|
|
||
|
|
|
|
|
||||
|
|
|
|
|
|
ГЛП |
|
|
|
|
|
^ 0 = |
[ o j ’ |
|
|
||
|
|
|
N = |
Ap (s) P-'M , |
|
|
||
|
|
|
Q = |
Ap(s)8 + ЛЯ, |
|
|
||
|
|
|
= Nj.RN -j- Ap (s) CAp (s), |
|
|
|||
|
|
|
я*я = Q 7 % G Q T \ |
|
|
|||
|
|
|
DD^. ~ |
5 Фо ~Ь Ро^і[>Ро*> |
|
|
||
Ко + |
К+ + К - = ( Я Г ^ Г ' Х ^ - Я И ; 0]) PQ-'D , |
|||||||
L0 + |
L+ + |
L _ = |
- |
H 7lQ7lNo*RoS4>Po*D7', |
а элементы матриц Л и В должны удовлетворять требова нию аналитичности в правой полуплоскости матрицы
Р— М
вместе с обратной.
Г Л А В А 5 |
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ |
|
|
ИГРЫ |
ПРЕСЛЕДОВАНИЯ — УКЛОНЕ |
|
НИЯ С |
КВАДРАТИЧНЫМ ФУНКЦИО |
|
НАЛОМ |
ПЛАТЕЖА. УЧЕТ ЗАПАЗДЫ |
|
ВАНИЯ |
|
Содержание первых четырех глав настоящей монографии составляет изложение спектральных методов синтеза, яв ляющихся результатом использования идей Винера — Кол могорова к синтезу систем с обратной связью, и решение ряда традиционных задач теории автоматического регули рования. В настоящей главе будет показано, что при незна чительной модификации эти методы могут оказаться эффек тивными и при решении некоторых задач теории дифферен циальных игр.
Многие задачи теории дифференциальных игр по по становке близки к задачам синтеза оптимальных систем с обратной связью в теории автоматического регулирования. По-видимому, в связи с этим вариационные методы, эффек тивные при решении задач синтеза, оказываются эффектив ными II при решении соответствующих (близких по поста новке) задач теории дифференциальных игр. Действительно, математический аппарат классического вариационного ис числения (уравнения Эйлера—Лагранжа) позволил решить как задачу аналитического конструирования регуляторов [18], так и задачу линейной дифференциальной игры пре следования — уклонения [33]. Современные вариацион ные методы, связанные с именем Л. С. Понтрягина, Р. Велл мана, Н. Н. Красовского, возникшие при решении ряда задач автоматического управления, успешно используются и при решении соответствующих задач дифференциальных игр. Можно надеяться, что и изложенные выше вариацион ные методы синтеза, математическим аппаратом которых являются уравнения Винера-Хопфа, окажутся полезны ми при решении некоторых задач теории дифференциаль ных игр.
121
§ 1. « К О Н Ф Л И К ТН Ы Е С И ТУ А Ц И И » В З А Д А Ч Е А Н А
Л И ТИ Ч Е С К О ГО К О Н С ТР У И Р О В А Н И Я Р Е ГУ Л Я ТО Р О В
При решении задач синтеза линейных систем с обратной связью в предыдущих главах, как и в [11, 18], предпола галось, что квадратичная форма функционала качества является определенно положительной. Однако можно ука зать класс задач, в которых это предположение не реали зуется [31]. Для иллюстрации этого утверждения иссле
дуем с |
несколько иных позиций пример, рассмотренный |
||
в [20, |
19]. |
|
|
Пусть движение объекта описывается уравнением |
|||
|
X = Ьх + |
ти, |
(5.1) |
где X — координата объекта, |
и — управляющее |
воздей |
|
ствие, |
b = const и т — const. |
|
= Д (х) |
Требуется определить законы управления ut |
|||
и «2 = |
/2 (х) так> чтобы функционал |
|
|
|
оо |
|
|
|
/ = j |
xhlt |
(5.2) |
|
о |
|
|
достигал минимума (наилучший регулятор их = Д (х)) или максимума (наихудший регулятор и2 = /2 (х)) при
я 3 |
(1 |
о |
і |
|
|
f u2dt = |
к. |
|
о |
|
|
(5.3)
(5.4)
Сформулированная изопериметрическая задача сводится к исследованию стационарной точки функционала
|
|
со |
|
|
|
|
/ 0 = |
J |
(X2 + |
Іи2) dt |
(5.5) |
|
|
о |
|
|
|
(X — множитель |
Лагранжа). |
|
|
||
Как показано в [19, |
20], закон управления, при котором |
||||
6 /0 = 0, имеет |
вид |
|
b + k |
|
|
|
и = |
X, |
(5.6) |
||
|
— -— |
||||
|
|
|
т |
• |
|
122
г д е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(5.7) |
т. е. |
|
|
|
|
|
|
|
|
|
|
|
|
|
х = |
х0е~к1, |
|
(5.8) |
|
|
|
|
|
и = |
Ь+ k |
ы |
|
|
|
|
|
|
— ^— хпе~ы. |
|
||
Подставив |
|
(5.8) |
|
в |
(5.4), |
получим |
|
|
|
|
|
|
со |
|
|
|
|
|
|
|
|
|
|
|
|
(5.9) |
или |
|
|
|
|
|
|
|
|
|
|
|
k2— |
2 |
b\k-\-b2 — 0. |
(5.10) |
||
Отсюда |
, |
|
|
|
|
А , |
|
|
, |
= |
( кт2 |
f wn2 I um2 |
26), |
||||
|
|
|
|
ь) + У ^ ( — |
||||
, |
|
, |
|
( xm2 |
, \ |
Г у.т2 I xm2 |
2b), |
|
|
|
|
|
|
|
|
|
|
причем задача имеет решение, если |
|
|||||||
|
|
|
|
|
у.т2 — 2Ь > |
0. |
|
Экстремальные значения функционала (5.2), согласно (5.8), определятся равенством
(5.11)
т. е.
7 т я х — 2k,m in |
7 т in ---- 2k„ |
которым соответствуют уравнения наилучшего и наихудшего регуляторов:
ь + К ■X, щ = b + Äm in -X.
123
Покажем, что %> О, если управление и минимизирует функционал (5.2), и К < 0, если и максимизирует этот функ ционал.
Известно [2], что Л = — а, согласно (5.11),
|
ді |
|
|
|
_dk_ |
|
|
|
дх |
|
|
2kа |
дк |
' |
|
Из (5.10) |
находим |
|
|
|
|
|
|
|
dk |
__ |
тг |
|
2/г2 |
|
|
|
дк |
~ |
"77" |
/г3 — Ьг ' |
|
||
|
|
|
•'о |
|
|
|
|
т. е. |
|
|
|
|
|
|
|
|
ді |
_ |
|
|
nf- |
|
(5.12) |
|
дх ~ |
|
И' — Р |
|
|||
|
|
|
|
||||
П О С К О Л Ь К У |
Ь — Ämin * ^max» |
ТО |
^ |
^ |
^m in ’ ^m ax И |
||
при А = Amin А2 — b2< |
0, |
|
|
0, при А = |
Атах А2 — А2> |
Следовательно, если управление и, стесненное изопериметрическим ограничением (5.4), минимизирует функцио
нал |
(5.2), то множитель Лагранжа К > |
0, если же функцио |
|
нал |
(5.2) максимизируется, то А < |
0. |
|
Таким образом, на простейшем примере показано, что |
|||
при минимизации функционала |
(5.2) |
квадратичная форма |
в (5.5) является определенно положительной, при макси мизации — де является определенно положительной.
К аналогичному выводу можно прийти и в более общем случае, когда движение системы происходит под действием нескольких управлений, стесненных ограничениями типа (5.4), причем одни управления стремятся минимизировать, а другие — максимизировать функционал типа (5.2). Этот случай можно трактовать как дифференциальную игру двух игроков, один из которых стремится минимизировать, а дру гой — максимизировать функционал типа (5.2). Решение подобных задач сводится к исследованию стационарных то чек функционала типа (5.5), в котором квадратичная форма не является определенно положительной из-за наличия от рицательных множителей Лагранжа.
Отметим, что в предыдущих главах решение задач син теза оптимальных регуляторов также сводилось к отыска
124
нию стационарных точек минимизируемых функционалов, но, в отличие от дифференциальных игр, квадратичная форма в этих функционалах всегда предполагалась опре деленно положительной. Таким образом, для решения задач линейных дифференциальных игр с квадратичным функцио налом платежа, по-видимому, можно использовать изложен ные выше методы синтеза оптимальных регуляторов, если эти методы модифицировать так, чтобы область их приме нимости не ограничивалась только определенно положи тельной квадратичной формой в функционале качества.
§ I . |
Р Е Ш Е Н И Е Л И Н Е Й Н Ы Х Д И Ф Ф Е Р Е Н Ц И А Л Ь Н Ы Х |
|
И ГР С К В А Д Р А ТИ Ч Н Ы М Ф У Н К Ц И О Н А Л О М |
|
П Л А ТЕ Ж А |
Рассмотрим динамическую систему, которая состоит из двух управляемых объектов. Дифференциальные уравне ния, описывающие движение системы под действием управ ляющих воздействий ил и и2, выбором которых располагают соответственно первый и второй игроки, имеют вид
+ л*і«і + 'Фі. Г
(5.13)
х2 = А2х2 + М2и2+ ф2. I
Размерности векторов л^, х2, их и и2 равны пх, п2, тх и т2 соответственно, и ф2 — пх- и п2-мерные стационарные случайные процессы (внешние возмущения) с нулевыми ма тематическими ожиданиями и дробно-рациональными мат рицами спектральных плотностей S u (со) и 52а (со), Ах, А2, Мх и М2 — постоянные матрицы пх X пх, п2 х п2, пх х тх и п2 X /По соответственно. Задача заключается в определении законов управления
их = Wxx,
(5.14)
и2 = W2x
(х — [х'і, х2У) таких, чтобы динамическая система, описы ваемая уравнениями (5.13), (5.14), была физически1
1 Здесь и далее дифференциальные уравнения, описывающие дви жение системы, записываются в канонической форме. Это позволяет отож дествить решение задачи синтеза для системы (5.13), когда % — слу чайные возмущения с постоянной спектральной плотностью, с решением детерминированной (ф; = 0) задачи синтеза при ненулевых начальных условиях (см. гл. 2).
125
реализуема1, причем в установившемся режиме первый игрок стремится минимизировать, а второй — максимизировать функционал
|
e0 = |
(z'R0z) |
(5.15) |
при ограничениях (и?) = х{ |
(і = 1, 2, . . . , т; |
т — /n2 -f |
|
+ щ)- |
) — знак математического ожидания, |
R 0 — по |
|
Здесь ( |
|||
стоянная |
весовая матрица, |
г — Lxxx — Ь2х2, |
L1 = [£П11; |
0] — матрица п0 X пх, Ь2 = |
[ЕПо\ 0] — матрица п0 X п2, |
т. е. е0 — среднеквадратическая взвешенная разность между первыми п0 координатами объектов.
Сформулированная задача сводится к исследованию ста
ционарных точек функционала |
|
е — (z'R0z) + (Uj^A^) + (и2А2и2) |
(5.16) |
(Aj и Л2 — диагональные матрицы, элементы которых —
-множители Лагранжа, причем все элементы матрицы Ах неотрицательны, а Л2 — неположительны) на классе физи чески реализуемых динамических систем.
Введем обозначения и = [нь и2У, Ф = [фь Ф^', ti = пх
+ П2,
Р = |
|
|
|
|
s a ( С О ) |
S12(со) |
|
|
е п , р - |
а 2\ ’ |
|
о ) ~ ß zi (®) |
S22(со) |
||
о |
|
5 ф ( с |
|||||
|
м = |
Мх |
0 |
|
|
|
|
|
0 |
М2 , |
W = |
IWV w ty, |
|
||
|
Лх |
о |
|
L\ |
|
|
|
А = |
о |
л . |
R = |
'i |
R oi^i’ |
Т,2]. |
|
— L' |
|||||||
|
Тогда уравнения (5.13), (5.14) и функционал (5.16) за пишутся так:
Рх + Ми ф- ф, |
(5-17) |
u = Wx, |
(5.18) |
е = (x'Rx) + (и’Аи), |
(5.19)1 |
1 Под физической реализуемостью линейной системы, как и ранее, понимается равенство нулю ее весовой функции при t < 0. Примени
тельно к игровой задаче это соответствует ситуации, когда каждый игрок при выработке стратегии в каждый момент времени может использовать только текущие и прошлые значения фазовых координат системы.
126
и задача сводится к определению W таким образом, чтобы первая вариация функционала (5.19) обращалась в нуль.
Первый этап решения сформулированной игровой зада чи, включая вычисление первой вариации функционала (5.19), целиком совпадает с соответствующим этапом реше
ния |
задачи |
синтеза оптимальной |
системы стабилизации |
||
(§ 3, |
гл. |
1) и, согласно (1.76), |
|
||
|
& = |
|
/°° |
|
|
|
- f |
J |
Sp {6Ф* |
+ С271 (Л^*/г — |
'- / с о
-GJjQ-'A) Р - 1] + 5 Ф [CD.Qr'G.GQ-1 +
+ р 7' ( W |
- |
^ Q r ’G.G) Q -1] 6Ф} ds, |
|
где |
|
|
|
G*G = |
N^RN + |
Ap (s) ЛДр (s), |
|
|
Ap (s) = |
det P, |
|
N = |
Ap (s) P _1M, |
||
Q = |
Ap (s) ß + ЛУѴ, |
а полиномиальные матрицы Л и В должны удовлетворять требованию аналитичности в правой полуплоскости матрицы
'Р — М -1
Z =
А В
Следующий шаг при решении сформулированной задачи уже несколько отличается от решения, приведенного в гл. 1. Ввиду наличия отрицательных множителей Лагранжа мат
рица Q7l G^GQ~l уже не будет положительно определенной и ее нельзя представить в виде произведения двух сопря
женных матриц. Решение задачи |
можно получить, предста |
|
вив матрицу QP’G^GQ-1 в виде |
|
|
Q7lG*G<3-1 = |
H J H , 1 |
(5-20) |
где Н — вещественная матрица, аналитическая вместе с об ратной в правой полуплоскости, Т — симметрическая мат рица с постоянными элементами.
1 Факторизация (5.20), в отличие от приведенной в предыдущих главах, где Т = Е, имеет место для любой параэрмитовой матрицы, не имеющей вместе с обратной полюсов нечетной кратности на мнимой оси.
127
Матрица Ф, обращающая в нуль первую вариацию функ ционала (5.19) и имеющая полюсы только в левой полупло
скости, запишется в виде Ф = —Я - 1 (Ко + К+) Г-1 , где аналитическая вместе с обратной в правой полуплоскости матрица Г получается в результате факторизации матрицы 5ф, т. е. = ГГ..., а матрицы Ко и К + определяются из оазложения
Ко + К+ + К - = (T~lH -'Q -lN:i;R - НА) Р -'Г (5.21)
(элементы матриц Ко — полиномы от s, К + — правильные дроби с полюсами только в левой полуплоскости, К - — правильные дроби с полюсами только в правой полупло скости).
Решение задачи, т. е. искомая матрица W, определится формулой
W = [(К0 + К+) Т~ХМ - Н ВГ' 1(К0 + К+) Т~'Р + НА].
(5.22)
Как и в задаче оптимальной стабилизации, матрица \Ѵ не зависит от конкретного выбора матриц А и В, удовлет воряющих требованию аналитичности матрицы Z вместе с обратной в правой полуплоскости. Доказательство этого
утверждения |
полностью совпадает с доказательством, при |
||
веденным в гл. 1 . |
|
|
|
Если элементы матрицы |
константы, то решение рас |
||
сматриваемой задачи принимает вид |
|
||
W = [(К0 |
+ К+) М — Н В ]-1[(К0 + К+) Р + НА], |
(5.23) |
|
Ко + |
К + + К - = (T -'H : ]Q-'N*R - НА) Р-' |
(5.24) |
и не зависит от элементов матрицы Если к тому же параметры объектов позволяют выбрать
матрицы А и В в виде А = Е, В = 0, то процедура опре деления матриц Ко и К+ значительно упрощается. В этом случае Q = N и, согласно (5.20),
я = т-'я.-'я:1[NJRN + д; (S) ЛДр (5)1я - 1=
=T -'H -'R + T -'H -'P JA -'A M -'P ,
аматрицы Ко и К+ определяются из разложения
Ко + К + + К - = — Т -'Н -'Р^М -'А М '1. |
(5.25) |
Отметим, что, согласно результатам гл. 2, решение за дачи в виде (5.23) может быть использовано при решении
128
игровых задач с ненулевыми начальными условиями и ну левыми внешними возмущениями.
Примеры. I. Рассмотрим игровую задачу о сближении двух объектов. Движение первого (догоняющего) объекта описывается уравнением хг = их -f- ф1( а движение второ
го (убегающего) — х2 = и2+ ф2.
Возмущения і ^ и ^ являются стационарными случайны ми процессами с нулевым математическим ожиданием и ма-
ѲІ |
(Г |
трицей спектральных плотностей 5ф = |
, где Ѳх и |
О |
0 2J |
Ѳ2— константы. |
|
При ограничениях на управляющие воздействия
(и2) = к 2
требуется найти закон управления [ult и2У = W [хи х2У (матрицу W передаточных функций регулятора), обеспечи
вающий минимаксное значение (min max) функционалу "і «і
е0= <(Xi — x2)z).
Решение задачи сводится к исследованию стационарных
точек функционала |
е = ((хг — х2)2) + |
(и2) -f- %2 (и\), где |
|||
множители Лагранжа 1, > |
0 и К2 <С 0. |
|
|||
Применительно к рассматриваемой задаче величины, |
|||||
входящие в (5.17) — (5.19), |
имеют вид |
|
|||
х = [х1, х2}', |
u = |
[ul t u2]', |
Ф = [фІ; |
фа]', Р = |
diag(s; s), |
М = diag {1; |
1}, |
R = |
|
А — diag |
Ä,2}. |
Приступим к решению задачи. Требование аналитич
ности матрицы Z~l в правой полуплоскости удовлетворим, положив А = Е2, В = 0.
Так как Др (s) — s2, N = sE2, Q — sE2, то
G*G = N,RN + А; (S ) AAp (s) = - |
'1 — M 2 |
— 1 |
‘ |
||
s2 |
— 1 |
1 - M |
T |
||
|
|
|
|||
|
' 1 — V |
s |
— 1 ' |
|
|
|
Q7%GQ~1 |
|
1 - K s \ |
|
|
|
— 1 |
|
|
|
|
Для факторизации последней матрицы в |
виде (5.20), |
||||
т. е. для |
определения аналитической |
вместе |
с обратной |
||
в правой |
полуплоскости и вещественной матрицы |
Н и |
9 3-582 |
129 |