книги из ГПНТБ / Ларин В.Б. Синтез оптимальных линейных систем с обратной связью
.pdfгде X и ф — «-мерные векторы координат объекта и внеш них возмущений, и — m-мерный вектор управляющих воз действий, Р и М — матрицы п X п и п X т, элементы
которых — операторные полиномы от р = ~d .
Требуется определить уравнение регулятора в цепи об ратной связи так, чтобы замкнутая система была устойчива и в установившемся режиме
функционал
е = (x'Rx) -f- (и'Си) (4.28)
достигал минимума.
Пусть кроме основного из мерительного канала, на вы ходе которого имеем вектор X - f ф, существуют q других каналов, измеряющих все компоненты вектора х или часть их с соответствующими аддитивными стационарными случайными помехами. Для
|
|
|
удобства |
упорядочим |
нуме |
||
рацию координат вектора х и этих |
каналов таким образом, |
||||||
что на выходе |
і'-го измерительного |
канала |
имеем |
|
|||
|
|
L tx -f- ф,- — |
|
" Ф/ i ' |
|
|
|
|
|
+ |
|
|
|
|
|
где Lt = |
[Д/г.; |
0] — матрица |
размера |
kt X |
п, |
|
|
П |
^ |
k2 |
^ &/-fl |
|
^ kq |
1. |
Структурная схема замкнутой системы имеет вид, изо браженный на рис. 1. Определению подлежат передаточные функции W и Wc (і = 1, 2, ..., <7 ), связывающие управле ние и и измеряемые величины:
ы = |
+ |
i- і |
Ф іX+ |
ф()- |
(4.29) |
|
|
|
|
|
|
Чтобы использовать |
решение |
задачи, |
приведенное в |
||
гл. 3, запишем уравнение цепи обратной связи в виде |
|||||
|
и = |
И М *о + |
Фо). |
|
(4.30) |
ПО
где, как |
видно из |
Wlt .... |
W„], |
|
X |
Ь |
х х |
Х 0 = |
о■ в |
_ д |
^ _ |
сравнения
ф
ф1
II
>
_ |
Ф « _ |
(4.29) и (4.30), W0 — [W,
5 ф ф * 5 ф ф ! . . |
|
^ Ф о — ■ ^ Ф і Ф ^ Ф і Ф і • |
•^ Ф і Ф р |
_ ^ Ф ? Ф S q i ^ r p , . |
• 5 ( Р ? Ф « 7 _ |
• |
(4.31) С учетом введенных «фиктивных» координат Ь {х уравне ния движения объекта (4.27) и функционал (4.28) перепи
шутся в виде
|
|
|
|
|
ВоХо ~ |
M0U-|“ фо» |
|
|
|
(4.32) |
|
|
|
|
в = |
(XQRQXQ) -f- (и Си), |
|
|
(4.33) |
||
где |
|
|
|
|
|
|
|
|
|
|
|
'Р |
0 ' |
|
|
ч |
Г A il |
|
' |
М ' |
|
|
, |
k = |
а2 |
м 0 = |
||||||
До = |
А |
Ек_ |
2 kt, |
а = |
, |
. Oftxm. |
||||
|
|
|
ш |
_АЙ_ |
|
|||||
|
|
|
|
|
|
|
|
(4.34) |
||
|
|
• ф |
|
|
|
0 |
|
R |
|
|
|
|
|
> Я*, — 0 |
Ro = |
0 |
' |
||||
|
Ф о = |
,0/іхі |
0кхк. » |
.0 |
Okxk |
Теперь для решения сформулированной задачи (уравне ния (4.32), (4.30), (4.33)) можно использовать конечные фор мулы гл. 3, только вместо х, ф, S,|,, cp, S (p, Р, М, R и W в них следует подставлять х0, ф0, 5 фо, ф0,S Vo, Р0, М0, R0 и W0, оп ределяемые соотношениями (4.31), (4.34).
Матрица искомых передаточных функций определяется
формулами |
|
|
|
|
№0 = [Др ( S ) Н7' Q~ С + (К - - |
До - А+ ) D~'M{ |
* |
||
|
|
1 л — 1 |
H 7 ' Q 7 l [ N * R ; 0]), |
|
* {(К - — А0 — L+) D~'pl |
||||
или |
|
|
|
|
W —[(/С0 + |
/С+ + |
До + Д+ ) D М0— НВ] |
83 |
|
X [(/Со + |
/С+ + |
До + д+) D -lP0 + НА], |
|
|
где |
|
|
|
|
Ар (я) = det Р, |
|
|
|
|
N = Ар (s) Р ~ХМ,
ш
Q = Ap (s) ß + AN, |
|
|
|
|
Я *Я = Qr'G.GQ-1, |
|
|
|
|
G*G = Л^ЯЯ -I- Д* (s) CA,, (s), |
|
|
||
•0°* = G'i>» + f ( ß < r aP (l*, |
|
|
|
|
/Со + /С+ + /С- = ( H |
^ Q |
^ |
R P |
- 1-, 0] - Я [ЛР-1; 0]) D, |
L0+ L+ + L_ =, - Я7' Q71[ВД |
0] S ^ * ^ 1, |
|||
а элементы матриц Л и |
Я должны удовлетворять требо |
|||
ванию аналитичности в правой полуплоскости матрицы |
||||
7 _ |
ГР |
— ЯГ] |
|
|
[Л |
|
5 |
|
|
вместе с обратной. |
|
|
||
|
|
|
|
|
§ 3. |
О С И Н ТЕ З Е О П ТИ М А Л Ь Н Ы Х Л И Н Е Й Н Ы Х С ЛЕ |
|||
|
Д Я Щ И Х |
С И С ТЕМ |
||
До сих пор метод синтеза, |
изложенный в гл. 1, использо |
вался для решения задач оптимальной стабилизации. В на стоящем параграфе этот метод будет применен к решению задач синтеза оптимальных линейных следящих систем, частным случаем которых являются задачи оптимальной стабилизации (программный сигнал равен нулю).
Под оптимальной следящей системой понимается, как и в [24], например, система с обратной связью, выходная координата (вектор координат) которой должна наиболее точно воспроизводить некоторое программное движение. Программный сигнал, поступающий на вход следящей си стемы, может быть искажен помехами, на заданную часть системы (объект) могут действовать внешние возмущения, и, наконец, используемые для формирования закона уп равления координаты объекта могут измеряться не точно.
В простейшей постановке задача формулируется следую щим образом. Пусть движение объекта описывается диффе
ренциальным уравнением |
|
Рх = М и-j-ф , |
(4.35) |
где X — координата объекта, и — управляющее |
воздей |
ствие, гр — внешнее возмущение, Р и ЯГ — операторные по-
d
ЛИНОМЫ ОТ р = -гг.
112
Пусть г — полезный сигнал, |
поступающий на вход си |
|
стемы с аддитивной помехой |
Предполагается, что коор |
|
дината объекта х измеряется также с аддитивной |
погреш |
|
ностыо ф. |
|
|
Пусть ijj, г, I и ф — стационарные случайные |
процессы |
с нулевым математическим ожиданием и матрицей спект
ралы-іых плотностей |
S*,(w) |
0 |
0 |
1 |
|
||
5(ю) = |
Snp (со) |
|
|||||
|
5,|,ф (ц>) |
Srr (со) |
|
|
|
|
|
|
|
0 |
0 |
|
|
||
|
О |
0 |
|
5фф (со) |
S(pt (со) |
|
|
_ |
О |
0 |
|
S&P (со) |
S K (со)_ |
|
|
|
|
5ф0И |
|
0 |
|
|
|
|
. |
0 |
|
5 фЛ “ ).' |
|
|
|
Требуется определить закон управления в цепи обрат |
|||||||
ной связи |
|
|
|
|
|
|
|
W 'U ^ W ^ x + |
t f + W ^r + |
Q |
|
(4.36) |
|||
(полиномы Wо (р), W-y (р) и |
W2 (р)) так, |
чтобы на |
классе |
||||
устойчивых замкнутых систем в установившемся |
режиме |
||||||
минимизировался функционал |
|
|
|
|
|||
|
в = ( ( * - г ) г) + с 8 (и8). |
|
|
(4.37) |
Первое слагаемое в функционале (4.37) (дисперсия (х— /•)) характеризует качество воспроизведения полезного сиг нала г выходной координатой х системы с обратной связью, а второе слагаемое ((ц2) — дисперсия и, с — const) огра ничивает «мощность управления», затрачиваемую на это воспроизведение.
Как уже отмечалось, задачи оптимальной стабилизации
являются частным случаем рассматриваемой задачи, |
когда |
г — 0, £ = 0. Однако метод решения, изложенный в |
гл. I, |
оказывается эффективным и при отличных ,от нуля г и §.
Введем в рассмотрение |
дополнительную |
координату |
У = |
г, |
(4.38) |
и задачу об оптимальном воспроизведении полезного сигнала сформулируем следующим образом.
Для объекта, 'движение которого описывается |
матрич |
ным уравнением |
|
Р0х0 = ти + |
(4.39) |
8 3 -58 2 |
113 |
|
требуется определить закон управления в цепи обратной связи
W,u = W (x0 + Фо) |
(4.40) |
так, чтобы на классе устойчивых замкнутых систем мини мизировался функционал
е = (x0Rx0) + с3 (и2). |
(4.41) |
В уравнениях (4.39) — (4.41)
X |
Фо = |
Ро = |
|
т |
М |
L У |
|
О |
|||
|
|
|
|
||
W = [Wv W2], |
Ф |
Я = |
1 |
- |
|
фо = |
.1 |
1 |
|||
|
|
|
|
Сформулированная задача формально не отличается от задач оптимальной стабилизации, и ее решение, согласно (3.50), имеет вид
W(s) = |
Wö'(s)W(s) = |
PP* (s) |
(k - — /„ — /+ ) D |
—1 |
||||||
'm |
||||||||||
|
|
|
|
g* (s) |
|
|
|
|
|
|
|
X |
(k—— lo — 1+) D~lP0 |
1 |
|
гпД |
(4.42) |
||||
|
g*(s) |
|||||||||
|
|
|
|
|
|
|
|
|
||
(s — переменная Лапласа), |
|
|
|
|
|
|
||||
|
g* (s) g (s) = |
т Д т - f |
c2P* (s) P (s), |
|
||||||
|
|
DD^ — |
+ Pо5ф0Р 0*, |
|
|
|
||||
|
+ |
k— |
|
1 |
m*R ■ |
|
g(s) а |
|
Pö'D, |
(4.42a) |
|
. g* (s) |
|
|
|||||||
|
|
|
|
|
q(s) |
|
|
|
||
|
A> + |
1+ + |
= |
— |
g* (S) |
•m^RSm.PnJD,—1 |
|
|||
|
|
|
0 * A |
|
||||||
|
|
q(s) = |
P (s) ß (s) + am. |
|
|
|
||||
Здесь |
полином g |
(s) |
имеет нули только в левой полу |
плоскости, а матрицы D и D~l аналитические в правой полуплоскости. Элементы вектора-строки а и скаляр ß (s) — полиномы от s, удовлетворяющие требованию аналитич
ности в правой полуплоскости матрицы Z =
вместе с обратной, т. е. полином q (s) — det Z должен быть гурвицевьш. Элементы векторов k0 и 10 — целые части (по линомы от s), /г+ и /+ — правильные дроби с полюсами
114
только в левой полуплоскости, |
/е_ и |
/_ — правильные |
дроби с полюсами только в правой |
полуплоскости. |
|
Проиллюстрируем специфику |
задач |
воспроизведения |
полезных сигналов системами с обратной связью на число вых примерах.
Пусть движение объекта описывается дифференциаль
ным уравнением |
|
|
|
|
X+ |
X — 2х = |
и — аи + ф, |
а > 0 , |
(4.43) |
причем 5 ^ (со) = |
А| |
О |
— 0 (г и ф |
некор- |
|
5 фв |
|||
|
О 1/ф г + со2) |
|
|
|
релированы, г и х |
измеряются точно, т. е. £ = ср = 0). |
|||
Требуется сконструировать закон |
управления |
|
||
W0(p)u = |
W1 (p)x + W ,(p)r |
(4.44) |
так, чтобы замкнутая система объект + регулятор была устойчива и ее выходная координата х наиболее точно вос производила полезный сигнал г, т. е. величина
е = ( ( х ~ г ) 2) |
(4.45) |
достигала минимума (ограничения науправление отсут ствуют, т. е. с — 0).
Введя координату
У = г, |
(4.46) |
уравнения движения замкнутой системы (4.43), (4.44), (4.46) можно записать в виде (4.39) — (4.41), где
Ро (Р) = |
(Р + 2) (р — 1) |
0' |
т(р) = |
р — а |
|
0 |
l j ’ |
0 |
|||
|
|
Требование аналитичности в правой полуплоскости матрицы
P o (s) |
— т (s) |
Z(s) = |
ß(s) . |
« (* ) |
вместе с обратной удовлетворим, положив ß = 1, а =
=I— (s -}- а -j- 1), 0J. Тогда, согласно (4.42),
q = det Z = а2 - f а — 2, |
g* (s) g (s) = m:i.Rm = |
а2 — s2, |
|||||
|
T. |
e. |
g = |
a + |
s, |
|
|
0 |
1 |
(Аф, |
у, |
0), |
|
|
|
b + s |
J |
/0 = /+ |
= 0, |
||||
r |
|
|
|
|
|
8 * |
115 |
k — — |
2а |
|
|
'S)) |
|
|
|
-f- b J ’ |
|
а — s |
(а + 2) (а— i) ’ |
а |
|||||||
|
k-D |
ltn = |
■ |
2 а |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
( а + 2 ) ( а - 1 ) ’ |
|
|
||||
k - J r ' P a = |
2 а |
(5 + |
2) |
(s — |
1) |
. |
s + |
b |
|
|
(а + |
2) |
(а — 1) |
’ а -f- b |
|||||
|
|
|
|||||||
|
_ * |
|
£ ± + . f_ |
I; |
]] |
|
|
||
|
g * (s) |
* |
о — |
s |
1 |
* |
1’ |
|
|
( r = [ ^ 1>r 2] = |
|
а 8 + а - f 2 . b — a (g-f- 2) ( g — 1) |
|||||||
S + |
2a |
’ |
ö + |
a |
|
|
2 a |
•(4.47) |
|
|
|
|
|
Структурная схема оптимальной замкнутой системы, как видно из уравнений (4.35), (4.36), (4.42), имеет вид, изображенный на рис. 2.
г+£ |
Объект |
|
гЛ |
Объект |
|
|
|
|
|
||
|
W, |
Л |
Ф |
Hf |
-г® |
|
|
|
|||
|
Рис . 2. |
|
|
Р и с . 3. |
|
|
Обычно же при синтезе замкнутых систем их структура |
||||
схематизируется так, как |
показано на рис. 3, причем по |
лагается, что Н[ (s) задается заранее (как правило, Hf = 1), а не определяется в результате решения вариационной за дачи (как указано в [24, стр. 44], если функция Ht (s) не задана, то ее можно выбрать так, чтобы упростить реа лизацию Gc (s)).
Как видно из сравнения рис. 2 и 3, соответствующие оптимальные системы при заданной передаточной функции Hf (s) могут быть тождественны только при нулевом по лезном сигнале (г = 0, £ = 0). В противном случае (г Ф 0) необходимо Hf (s), как и Gc (s), определять из решения ва риационной задачи, причем даже и в этом случае могут возникнуть ситуации, когда система, изображенная на рис. 2, окажется эффективнее, чем система, изображенная на рис. 3.
Применительно к рассмотренному выше объекту прове дем количественное сравнение эффективности систем, изоб раженных на рис. 2 и 3.
И6
Пусть Hf = — 1, и закон управления для объекта, дви жение которого описывается уравнением (4.43) (для упро щения выкладок в (4.43) полагалось а — 2), будем разы скивать в виде
|
и (s) = |
Gc (s) [X (s) — г (s)]. |
|
|
(4.48) |
||
Обозначив X — г = |
z, |
уравнения |
(4.43), (4.48) и |
(4.45) |
|||
запишем так: |
|
|
|
|
|
|
|
(s + |
2) (s — 1) г = (s — 2) и + |
1|>0, |
|
|
|||
и = |
G^z, |
|
|
|
|
|
(4.49) |
е = |
(г2), |
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
(со) = Я | + |
у2 (1 + ю2) (4 + |
ш2) |
|
|
|||
62 + |
со2 |
|
|
|
|||
|
|
|
|
|
|
||
Решение задачи в постановке (4.49) приведено в |
гл. 1, |
||||||
и для рассматриваемого примера получаем |
|
|
|||||
(2c + d — 6 + 2)s2 + (4 c+ 3 d + |
6c + |
6d + |
4)s + |
|
|||
|
+ 2(d + 2b + bc+bd) |
|
|
(4.50) |
|||
|
|
{2c + d + 4) (6 + |
s) |
|
|
||
|
|
|
|
|
|||
где |
|
|
|
|
|
|
|
d= V “ yä~ + |
4 > 0 > |
С = У Г Y |
+ 2d + |
5 > 0 ' |
(4-51) |
Минимальные значения функционалов elmin и e2mim со ответствующие законам управления (4.47) при а = 2 (см. рис. 2) и (4.50) (см. рис. 3), определяются, согласно (1.86), формулами
|
|
л Г ,а |
, |
16у2 |
] |
(4.52) |
|
e im in |
— |
2 І^ Л ф - t - |
( 6 _ | _ 2 )3 |
J’ |
|||
|
|
л Гу2 (2с + d + 4)2 1 |
(4.53) |
||||
^ |
= |
— [ |
\ Ь + 2Г |
j- |
|||
|
|||||||
Учитывая неравенства у2с2 > |
yzcd > |
и y2d2> |
|||||
нетрудно показать, |
что |
|
|
|
|||
|
|
|
4яу2 (2с + |
d) |
|
||
ß 2 m ln |
|
£ lm ! n + |
|
(Ь + 2)2 |
|
|
|
|
|
|
|
|
|
117
т. е. закон управления (4.47) при а = 2 (рис. 2) обеспечит всегда лучшее воспроизведение полезного сигнала г, чем закон управления (4.50) (см. рис. 3) *.
Так, при Аф |
0 оптимальная система с предварительной |
обработкой полезного сигнала (см. рис. 2) даст дисперсию |
|
ошибки в девять |
раз меньшую, чем оптимальная система |
с жесткой обратной связью (см. рис. 3, Ht = — I): |
|
|
е2ш1п |
= |
9. |
|
|
|
elm!n Кф-ѵО |
|
|
|
С другой стороны, из формулы (4.47) и рис. 2, 3 видно, |
|||||
что при |
b Ф 2 |
обе системы одинаково воспроизведут по- |
|||
лезный |
сигнал, |
если G0 = |
_2 |
fr |
1-2 |
|
’ а # / = |
<і (s ~f~2). |
Таким образом, для оптимального воспроизведения полез ного сигнала передаточную функцию цепи обратной связи (см. рис. 3) нельзя выбирать произвольно (например, Hf = = — 1), а следует определять ее совместно с Gc из решения вариационной задачи. По-видимому, единственным исклю чением из этого правила является случай, когда нет реаль ной возможности измерять сигналы г и х раздельно, а суще ствует лишь возможность измерения разности этих сигна лов [26].
Укажем еще одну ситуацию, когда система, реализо ванная по схеме рис. 3, обеспечит худшее воспроизведение полезного сигнала, чем оптимальная система, изображенная
на рис. 2. |
|
Пусть а — b = 2; тогда, согласно (4.47), |
= 0, т. е. |
устойчивая замкнутая система будет оптимально воспроиз водить полезный сигнал г лишь в том случае, если он на вход системы не поступает. Оптимальный закон управле ния имеет вид
и — X+ 2х. |
(4.54) |
В то же время очевидно, что никаким выбором передаточных функций Gc и Hf нельзя одновременно добиться устой чивости замкнутой системы и реализации закона управле ния (4.54), оставаясь в рамках схемы, изображенной на рис. 3.
1 e2min асимптотически приближается к elmin лишь при у -> 0, т. е. Н тіл = е2т'т только при нулевом полезном сигнале.
118
Следует заметить, что идея использования звена для предварительной обработки полезного сигнала (на рис. 2 звено с передаточной функцией W2) высказывалась в [24]
(здесь на |
рис. |
1.4-2 приведено |
задающее |
устройство — |
||
звено а) и в [30] (где на рис. |
1-2 |
показано |
звено с |
пере |
||
даточной |
функцией Н\ (s)). |
Однако ни в |
[24], ни в |
[30] |
||
нет алгоритмов |
определения |
передаточных |
функций |
этих |
||
звеньев. |
|
|
|
|
|
|
И, наконец, приведем решение задачи синтеза оптималь ных линейных следящих систем в более общей постановке. Пусть движение объекта, предназначенного для воспроиз ведения программного сигнала г, описывается, как и в § 3 гл. 1, системой обыкновенных дифференциальных урав нений с постоянными коэффициентами
(см. |
(1.51)). |
Рх = Ми + яр |
(4.55) |
||
|
|
|
|
||
Требуется определить |
закон |
управления |
|
||
|
и = |
(х + |
Ф*) + |
^2 (г + Фг) |
(4.56) |
так, |
чтобы минимизировался функционал |
|
|||
|
е = ((х — гУ Щ х — г)) + (и'Си). |
(4.57) |
Таким образом, программный сигнал г (я-мерный вектор) поступает на вход системы с аддитивной помехой срЛ, вектор координат объекта х измеряется с помехой фд:, требуется оптимизировать (в смысле минимума функционала (4.57)), систему (4.55), (4.56) при условии, что яр, г, фг и ф~ — я-мерные некоррелированные стационарные случайные про цессы с нулевым математическим ожиданием и известными матрицами спектральных плотностей.
Решение задачи аналогично приведенному выше реше нию задачи синтеза следящей системы по одной координате
и также сводится к задаче синтеза системы |
стабилизации |
||||||
введением добавочных координат. |
|
|
|||||
Дополним |
систему |
(4.35) |
следующим, уравнением: |
||||
|
|
|
|
У = |
г у |
|
^ (4.58) |
и пусть Л'0 = |
[х'\ |
у']', |
яро |
= |
[яр'; г'}', |
<p = |
[ ф '; ф,']'. |
Тогда X — г = |
[Еп\— E„ ] x0, и уравнения (4.55), (4.58), |
||||||
(4.56) и функционал (4.57) запишутся в виде |
|||||||
|
|
Р0х0 = |
М0и + яро, |
I |
|
||
|
|
ц = |
р |
(д-0+ф )> |
) |
(4-59) |
|
|
|
е = (х0%охо) + (и'Си), |
(4.60) |
119