Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Ларин В.Б. Синтез оптимальных линейных систем с обратной связью

.pdf
Скачиваний:
4
Добавлен:
23.10.2023
Размер:
6.26 Mб
Скачать

где

 

 

Р

О

 

м

 

Р о ~

о

Ея

М0 — о,

 

 

 

 

 

 

тХп

W * [ ^ ;

Wt],

R0 =

[Еп- - Eny R [£„; - En],

X

=

S,|,

0

5ф =s

SVx

0

0 s r

О

5 Ф/.

 

Таким образом, задача синтеза оптимальной линейной следящей системы сведена к задаче синтеза системы ста­ билизации объекта, движение которого описывается урав­ нениями (4.59) при критерии качества (4.60), и, согласно 3 41), решение имеет вид

W = IWV

W2] =

[А; (s) H~lQ-;lC + (К - -

L0 -

L+) X

X / г ч г 1 [ ( / < - - x

-

L + ) D ~ ] p o - H : ' Q : ' N 0.,R ],

или

 

 

 

 

 

 

 

 

w = i ^ ,

\FS] = [(/C0 + K + +

La + L+) D~'M0 -

Н В Г 1X

 

X

[(/C0 +

K+ +

L0+

L+ ) D~lP о +

HA],

 

где

 

 

Ap {s) =

detP,

 

 

 

 

 

 

 

 

 

 

 

 

 

ГЛП

 

 

 

 

 

^ 0 =

[ o j ’

 

 

 

 

 

N =

Ap (s) P-'M ,

 

 

 

 

 

Q =

Ap(s)8 + ЛЯ,

 

 

 

 

 

= Nj.RN -j- Ap (s) CAp (s),

 

 

 

 

 

я*я = Q 7 % G Q T \

 

 

 

 

 

DD^. ~

5 Фо ~Ь Ро^і[>Ро*>

 

 

Ко +

К+ + К - = ( Я Г ^ Г ' Х ^ - Я И ; 0]) PQ-'D ,

L0 +

L+ +

L _ =

-

H 7lQ7lNo*RoS4>Po*D7',

а элементы матриц Л и В должны удовлетворять требова­ нию аналитичности в правой полуплоскости матрицы

Р— М

вместе с обратной.

Г Л А В А 5

ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ

 

ИГРЫ

ПРЕСЛЕДОВАНИЯ — УКЛОНЕ­

 

НИЯ С

КВАДРАТИЧНЫМ ФУНКЦИО­

 

НАЛОМ

ПЛАТЕЖА. УЧЕТ ЗАПАЗДЫ­

 

ВАНИЯ

 

Содержание первых четырех глав настоящей монографии составляет изложение спектральных методов синтеза, яв­ ляющихся результатом использования идей Винера — Кол­ могорова к синтезу систем с обратной связью, и решение ряда традиционных задач теории автоматического регули­ рования. В настоящей главе будет показано, что при незна­ чительной модификации эти методы могут оказаться эффек­ тивными и при решении некоторых задач теории дифферен­ циальных игр.

Многие задачи теории дифференциальных игр по по­ становке близки к задачам синтеза оптимальных систем с обратной связью в теории автоматического регулирования. По-видимому, в связи с этим вариационные методы, эффек­ тивные при решении задач синтеза, оказываются эффектив­ ными II при решении соответствующих (близких по поста­ новке) задач теории дифференциальных игр. Действительно, математический аппарат классического вариационного ис­ числения (уравнения Эйлера—Лагранжа) позволил решить как задачу аналитического конструирования регуляторов [18], так и задачу линейной дифференциальной игры пре­ следования — уклонения [33]. Современные вариацион­ ные методы, связанные с именем Л. С. Понтрягина, Р. Велл­ мана, Н. Н. Красовского, возникшие при решении ряда задач автоматического управления, успешно используются и при решении соответствующих задач дифференциальных игр. Можно надеяться, что и изложенные выше вариацион­ ные методы синтеза, математическим аппаратом которых являются уравнения Винера-Хопфа, окажутся полезны­ ми при решении некоторых задач теории дифференциаль­ ных игр.

121

§ 1. « К О Н Ф Л И К ТН Ы Е С И ТУ А Ц И И » В З А Д А Ч Е А Н А ­

Л И ТИ Ч Е С К О ГО К О Н С ТР У И Р О В А Н И Я Р Е ГУ Л Я ­ ТО Р О В

При решении задач синтеза линейных систем с обратной связью в предыдущих главах, как и в [11, 18], предпола­ галось, что квадратичная форма функционала качества является определенно положительной. Однако можно ука­ зать класс задач, в которых это предположение не реали­ зуется [31]. Для иллюстрации этого утверждения иссле­

дуем с

несколько иных позиций пример, рассмотренный

в [20,

19].

 

 

Пусть движение объекта описывается уравнением

 

X = Ьх +

ти,

(5.1)

где X — координата объекта,

и — управляющее

воздей­

ствие,

b = const и т — const.

 

= Д (х)

Требуется определить законы управления ut

и «2 =

/2 (х) так> чтобы функционал

 

 

оо

 

 

 

/ = j

xhlt

(5.2)

 

о

 

 

достигал минимума (наилучший регулятор их = Д (х)) или максимума (наихудший регулятор и2 = /2 (х)) при

я 3

(1

о

і

 

 

f u2dt =

к.

о

 

 

(5.3)

(5.4)

Сформулированная изопериметрическая задача сводится к исследованию стационарной точки функционала

 

 

со

 

 

 

 

/ 0 =

J

(X2 +

Іи2) dt

(5.5)

 

 

о

 

 

 

(X — множитель

Лагранжа).

 

 

Как показано в [19,

20], закон управления, при котором

6 /0 = 0, имеет

вид

 

b + k

 

 

 

и =

X,

(5.6)

 

— -—

 

 

 

т

 

122

г д е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(5.7)

т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

х =

х0е~к1,

 

(5.8)

 

 

 

 

 

и =

Ь+ k

ы

 

 

 

 

 

— ^— хпе~ы.

 

Подставив

 

(5.8)

 

в

(5.4),

получим

 

 

 

 

 

со

 

 

 

 

 

 

 

 

 

 

 

 

(5.9)

или

 

 

 

 

 

 

 

 

 

 

 

k2

2

b\k-\-b2 — 0.

(5.10)

Отсюда

,

 

 

 

 

А ,

 

 

,

=

( кт2

f wn2 I um2

26),

 

 

 

 

ь) + У ^ ( —

,

 

,

 

( xm2

, \

Г у.т2 I xm2

2b),

 

 

 

 

 

 

 

 

причем задача имеет решение, если

 

 

 

 

 

 

у.т2 — 2Ь >

0.

 

Экстремальные значения функционала (5.2), согласно (5.8), определятся равенством

(5.11)

т. е.

7 т я х — 2k,m in

7 т in ---- 2k„

которым соответствуют уравнения наилучшего и наихудшего регуляторов:

ь + К ■X, щ = b + Äm in -X.

123

Покажем, что %> О, если управление и минимизирует функционал (5.2), и К < 0, если и максимизирует этот функ­ ционал.

Известно [2], что Л = — а, согласно (5.11),

 

ді

 

 

 

_dk_

 

 

дх

 

 

2kа

дк

'

 

Из (5.10)

находим

 

 

 

 

 

 

 

dk

__

тг

 

2/г2

 

 

 

дк

~

"77"

/г3 — Ьг '

 

 

 

 

•'о

 

 

 

 

т. е.

 

 

 

 

 

 

 

 

ді

_

 

 

nf-

 

(5.12)

 

дх ~

 

И' — Р

 

 

 

 

 

П О С К О Л Ь К У

Ь Ämin * ^max»

ТО

^

^

^m in ’ ^m ax И

при А = Amin А2 — b2<

0,

 

 

0, при А =

Атах А2 — А2>

Следовательно, если управление и, стесненное изопериметрическим ограничением (5.4), минимизирует функцио­

нал

(5.2), то множитель Лагранжа К >

0, если же функцио­

нал

(5.2) максимизируется, то А <

0.

 

Таким образом, на простейшем примере показано, что

при минимизации функционала

(5.2)

квадратичная форма

в (5.5) является определенно положительной, при макси­ мизации — де является определенно положительной.

К аналогичному выводу можно прийти и в более общем случае, когда движение системы происходит под действием нескольких управлений, стесненных ограничениями типа (5.4), причем одни управления стремятся минимизировать, а другие — максимизировать функционал типа (5.2). Этот случай можно трактовать как дифференциальную игру двух игроков, один из которых стремится минимизировать, а дру­ гой — максимизировать функционал типа (5.2). Решение подобных задач сводится к исследованию стационарных то­ чек функционала типа (5.5), в котором квадратичная форма не является определенно положительной из-за наличия от­ рицательных множителей Лагранжа.

Отметим, что в предыдущих главах решение задач син­ теза оптимальных регуляторов также сводилось к отыска­

124

нию стационарных точек минимизируемых функционалов, но, в отличие от дифференциальных игр, квадратичная форма в этих функционалах всегда предполагалась опре­ деленно положительной. Таким образом, для решения задач линейных дифференциальных игр с квадратичным функцио­ налом платежа, по-видимому, можно использовать изложен­ ные выше методы синтеза оптимальных регуляторов, если эти методы модифицировать так, чтобы область их приме­ нимости не ограничивалась только определенно положи­ тельной квадратичной формой в функционале качества.

§ I .

Р Е Ш Е Н И Е Л И Н Е Й Н Ы Х Д И Ф Ф Е Р Е Н Ц И А Л Ь Н Ы Х

 

И ГР С К В А Д Р А ТИ Ч Н Ы М Ф У Н К Ц И О Н А Л О М

 

П Л А ТЕ Ж А

Рассмотрим динамическую систему, которая состоит из двух управляемых объектов. Дифференциальные уравне­ ния, описывающие движение системы под действием управ­ ляющих воздействий ил и и2, выбором которых располагают соответственно первый и второй игроки, имеют вид

+ л*і«і + 'Фі. Г

(5.13)

х2 = А2х2 + М2и2+ ф2. I

Размерности векторов л^, х2, их и и2 равны пх, п2, тх и т2 соответственно, и ф2 — пх- и п2-мерные стационарные случайные процессы (внешние возмущения) с нулевыми ма­ тематическими ожиданиями и дробно-рациональными мат­ рицами спектральных плотностей S u (со) и 52а (со), Ах, А2, Мх и М2 — постоянные матрицы пх X пх, п2 х п2, пх х тх и п2 X /По соответственно. Задача заключается в определении законов управления

их = Wxx,

(5.14)

и2 = W2x

(х — [х'і, х2У) таких, чтобы динамическая система, описы­ ваемая уравнениями (5.13), (5.14), была физически1

1 Здесь и далее дифференциальные уравнения, описывающие дви­ жение системы, записываются в канонической форме. Это позволяет отож­ дествить решение задачи синтеза для системы (5.13), когда % — слу­ чайные возмущения с постоянной спектральной плотностью, с решением детерминированной (ф; = 0) задачи синтеза при ненулевых начальных условиях (см. гл. 2).

125

реализуема1, причем в установившемся режиме первый игрок стремится минимизировать, а второй — максимизировать функционал

 

e0 =

(z'R0z)

(5.15)

при ограничениях (и?) = х{

= 1, 2, . . . , т;

т /n2 -f

+ щ)-

) — знак математического ожидания,

R 0 — по­

Здесь (

стоянная

весовая матрица,

г — Lxxx Ь2х2,

L1 = [£П11;

0] — матрица п0 X пх, Ь2 =

[ЕПо\ 0] — матрица п0 X п2,

т. е. е0 — среднеквадратическая взвешенная разность между первыми п0 координатами объектов.

Сформулированная задача сводится к исследованию ста­

ционарных точек функционала

 

е — (z'R0z) + (Uj^A^) + (и2А2и2)

(5.16)

(Aj и Л2 — диагональные матрицы, элементы которых —

-множители Лагранжа, причем все элементы матрицы Ах неотрицательны, а Л2 — неположительны) на классе физи­ чески реализуемых динамических систем.

Введем обозначения и = [нь и2У, Ф = [фь Ф^', ti = пх

+ П2,

Р =

 

 

 

 

s a ( С О )

S12(со)

 

е п , р -

а 2\ ’

 

о ) ~ ß zi (®)

S22(со)

о

 

5 ф ( с

 

м =

Мх

0

 

 

 

 

0

М2 ,

W =

IWV w ty,

 

 

Лх

о

 

L\

 

 

А =

о

л .

R =

'i

R oi^i’

Т,2].

— L'

 

Тогда уравнения (5.13), (5.14) и функционал (5.16) за­ пишутся так:

Рх + Ми ф- ф,

(5-17)

u = Wx,

(5.18)

е = (x'Rx) + (и’Аи),

(5.19)1

1 Под физической реализуемостью линейной системы, как и ранее, понимается равенство нулю ее весовой функции при t < 0. Примени­

тельно к игровой задаче это соответствует ситуации, когда каждый игрок при выработке стратегии в каждый момент времени может использовать только текущие и прошлые значения фазовых координат системы.

126

и задача сводится к определению W таким образом, чтобы первая вариация функционала (5.19) обращалась в нуль.

Первый этап решения сформулированной игровой зада­ чи, включая вычисление первой вариации функционала (5.19), целиком совпадает с соответствующим этапом реше­

ния

задачи

синтеза оптимальной

системы стабилизации

(§ 3,

гл.

1) и, согласно (1.76),

 

 

& =

 

/°°

 

 

- f

J

Sp {6Ф*

+ С271 (Л^*/г —

'- / с о

-GJjQ-'A) Р - 1] + 5 Ф [CD.Qr'G.GQ-1 +

+ р 7' ( W

-

^ Q r ’G.G) Q -1] 6Ф} ds,

где

 

 

 

G*G =

N^RN +

Ap (s) ЛДр (s),

 

Ap (s) =

det P,

N =

Ap (s) P _1M,

Q =

Ap (s) ß + ЛУѴ,

а полиномиальные матрицы Л и В должны удовлетворять требованию аналитичности в правой полуплоскости матрицы

'Р — М -1

Z =

А В

Следующий шаг при решении сформулированной задачи уже несколько отличается от решения, приведенного в гл. 1. Ввиду наличия отрицательных множителей Лагранжа мат­

рица Q7l G^GQ~l уже не будет положительно определенной и ее нельзя представить в виде произведения двух сопря­

женных матриц. Решение задачи

можно получить, предста­

вив матрицу QP’G^GQ-1 в виде

 

 

Q7lG*G<3-1 =

H J H , 1

(5-20)

где Н — вещественная матрица, аналитическая вместе с об­ ратной в правой полуплоскости, Т — симметрическая мат­ рица с постоянными элементами.

1 Факторизация (5.20), в отличие от приведенной в предыдущих главах, где Т = Е, имеет место для любой параэрмитовой матрицы, не имеющей вместе с обратной полюсов нечетной кратности на мнимой оси.

127

Матрица Ф, обращающая в нуль первую вариацию функ­ ционала (5.19) и имеющая полюсы только в левой полупло­

скости, запишется в виде Ф = —Я - 1 (Ко + К+) Г-1 , где аналитическая вместе с обратной в правой полуплоскости матрица Г получается в результате факторизации матрицы 5ф, т. е. = ГГ..., а матрицы Ко и К + определяются из оазложения

Ко + К+ + К - = (T~lH -'Q -lN:i;R - НА) Р -'Г (5.21)

(элементы матриц Ко — полиномы от s, К + — правильные дроби с полюсами только в левой полуплоскости, К - — правильные дроби с полюсами только в правой полупло­ скости).

Решение задачи, т. е. искомая матрица W, определится формулой

W = [(К0 + К+) Т~ХМ - Н ВГ' 1(К0 + К+) Т~'Р + НА].

(5.22)

Как и в задаче оптимальной стабилизации, матрица не зависит от конкретного выбора матриц А и В, удовлет­ воряющих требованию аналитичности матрицы Z вместе с обратной в правой полуплоскости. Доказательство этого

утверждения

полностью совпадает с доказательством, при­

веденным в гл. 1 .

 

 

Если элементы матрицы

константы, то решение рас­

сматриваемой задачи принимает вид

 

W = [(К0

+ К+) М — Н В ]-1[(К0 + К+) Р + НА],

(5.23)

Ко +

К + + К - = (T -'H : ]Q-'N*R - НА) Р-'

(5.24)

и не зависит от элементов матрицы Если к тому же параметры объектов позволяют выбрать

матрицы А и В в виде А = Е, В = 0, то процедура опре­ деления матриц Ко и К+ значительно упрощается. В этом случае Q = N и, согласно (5.20),

я = т-'я.-'я:1[NJRN + д; (S) ЛДр (5)1я - 1=

=T -'H -'R + T -'H -'P JA -'A M -'P ,

аматрицы Ко и К+ определяются из разложения

Ко + К + + К - = — Т -'Н -'Р^М -'А М '1.

(5.25)

Отметим, что, согласно результатам гл. 2, решение за­ дачи в виде (5.23) может быть использовано при решении

128

игровых задач с ненулевыми начальными условиями и ну­ левыми внешними возмущениями.

Примеры. I. Рассмотрим игровую задачу о сближении двух объектов. Движение первого (догоняющего) объекта описывается уравнением хг = их -f- ф1( а движение второ­

го (убегающего) — х2 = и2+ ф2.

Возмущения і ^ и ^ являются стационарными случайны­ ми процессами с нулевым математическим ожиданием и ма-

ѲІ

трицей спектральных плотностей 5ф =

, где Ѳх и

О

0 2J

Ѳ2— константы.

 

При ограничениях на управляющие воздействия

(и2) = к 2

требуется найти закон управления [ult и2У = W [хи х2У (матрицу W передаточных функций регулятора), обеспечи­

вающий минимаксное значение (min max) функционалу "і «і

е0= <(Xi — x2)z).

Решение задачи сводится к исследованию стационарных

точек функционала

е = ((хг х2)2) +

(и2) -f- %2 (и\), где

множители Лагранжа 1, >

0 и К2 <С 0.

 

Применительно к рассматриваемой задаче величины,

входящие в (5.17) — (5.19),

имеют вид

 

х = [х1, х2}',

u =

[ul t u2]',

Ф = [фІ;

фа]', Р =

diag(s; s),

М = diag {1;

1},

R =

 

А — diag

Ä,2}.

Приступим к решению задачи. Требование аналитич­

ности матрицы Z~l в правой полуплоскости удовлетворим, положив А = Е2, В = 0.

Так как Др (s) — s2, N = sE2, Q — sE2, то

G*G = N,RN + А; (S ) AAp (s) = -

'1 — M 2

1

s2

1

1 - M

T

 

 

 

 

' 1 — V

s

1 '

 

 

 

Q7%GQ~1

 

1 - K s \

 

 

 

1

 

 

 

Для факторизации последней матрицы в

виде (5.20),

т. е. для

определения аналитической

вместе

с обратной

в правой

полуплоскости и вещественной матрицы

Н и

9 3-582

129

Соседние файлы в папке книги из ГПНТБ