Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Управление большими системами. УБС-2017

.pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
17.48 Mб
Скачать

Фундаментальные математические основы теории управления

MINIMIZING THE FEEDBACK MATRIX NORM IN MODAL CONTROL PROBLEM

Nikita Bersenev, Institute of Control Sciences of RAS, Moscow, postgraduate (nick.e-note@yandex.ru).

Victor Utkin, Institute of Control Sciences of RAS, Moscow, Doctor of Science, professor (Moscow, Profsoyuznaya st., 65, (495)334-93-21).

Abstract: The modal control problem, which consists in assigning the zeros of the roots of a closed system with choice of linear feedback, is widely known thoroughly studied and widely used in control theory and practice. However, the problem of choosing the spectrum of a closed system is still an open topic for research.

In this paper the problem of minimizing the Frobenius norm of the feedback matrix in the modal control problem is posed. The rate of convergence of the system is set. The main difference between the problem considered here and the known classic modal control problem is that the spectrum of a closed system is not specified, but to be chosen in the optimization process.

Keywords: modal control, linear systems, optimal control.

41

41

Управление большими системами. Выпуск XX

УДК 62.50 ББК 32.817

СИНТЕЗ РОБАСТНОЙ СИСТЕМЫ УПРАВЛЕНИЯ ПОЛОЖЕНИЕМ МАЯТНИКА

Краснов Д.В.1

(Институт проблем управления им. В.А. Трапезникова РАН, Москва)

Рассматривается электромеханический объект управления – перевернутый маятник с учетом редуцированной динамической модели двигателя постоянного тока. Параметрические неопределенности механической системы и внешние возмущения не принадлежат пространству управления. На основе представления системы в канонической форме «вход – выход» с учетом гладких возмущений разработан закон разрывного управления, обеспечивающий различные режимы работы системы инвариантно по отношению к имеющимся неопределенностям и не требующий перенастройки при изменении внешних воздействий. По измерениям только ошибки слежения разработан метод синтеза укороченного наблюдателя для оценивания смешанных переменных (комбинаций переменных состояний, внешних воздействий и их производных) с линейными корректирующими воздействиями с насыщением.

Ключевые слова: электромеханическая система, слежение, разрывное управление, наблюдатель состояния, робастность.

1. Введение

Рассматривается проблема управления угловым положением перевернутого маятника в условиях параметрической неопределенности и действия внешних возмущений. В модели объекта управления, которая представлена в разделе 2, учитывается динамика электрического исполнительного устройства – элек-

1 ДмитрийВалентиновичКраснов, инженер-программист(dim93kr@mail.ru).

42

Фундаментальные математические основы теории управления

тропривода постоянного тока. С одной стороны, это дает возможность использовать разрывное управление, но, с другой стороны, не позволяет непосредственно компенсировать возмущения, действующие на механическую подсистему.

Тем не менее, если параметрические и внешние возмущения полагаются гладкими функциями времени, то математическая модель объекта управления представима в каноническом виде в виртуальном пространстве смешанных переменных – комбинаций переменных состояния, внешних воздействий и их производных. В данной виртуальной модели созданные комбинации неизвестных возмущений являются уже согласованными (принадлежат пространству управления), но множитель перед управлением теряет определенность.

Вразделе 3 на основе канонической системы, записанной относительно ошибки слежения, разработан базовый закон разрывного управления, обеспечивающий отработку различных допустимых траекторий инвариантно по отношению к имеющимся неопределенностям и не требующий перенастройки при изменении внешних факторов и цели управления.

Впредположении, что только ошибка слежения подлежит прямым измерениям, в разделе 4 предложен метод синтеза укороченного наблюдателя с линейными корректирующими воздействий с насыщением, в котором реализуется метод разделения движений в пространстве ошибок наблюдения. Наблюдатель строится как реплика канонической системы и дает оценки смешанных переменных, которые непосредственно фигурируют в базовом законе управления, что существенно упрощает структуру регулятора. В разделе 5 приведены результаты моделирования разработанных алгоритмов.

2.Описание модели объекта управления

Рассматривается опорный электромеханический объект управления [9] – перевернутый маятник (механическая подсистема), управляемый электроприводом постоянного тока. Математическая модель объекта управления включает учитываемую динамику электропривода и имеет вид

43

43

Управление большими системами. Выпуск XX

x1 = x2 ,

(1)x2 = a21 sin x1 a22 x2 + a23 (x3 + η),

x3 = −a32 x2 a33 x3 + b3u,

где x1 – угловое положение маятника (выходная, регулируемая и измеряемая переменная), рад; x2 – угловая скорость, рад/с; x3 – вращающий момент, приложенный к маятнику на оси подвеса, который развивается электроприводом с разрывным

управлением u (напряжение якоря), Н м; b3 > 0 ,

aij > 0 ,

b3 ,a32 ,a33

– известные коэффициенты передачи,

a21 = g / l ,

a22 = κ / l ,

a23 = 1/(ml2 ) , g = 9,8 – ускорение свободного паде-

ния, м/c2 ;

m , l – масса и длина маятника соответственно, кг, м;

κ – коэффициент вязкого трения, параметры m, l, κ

точно не

определены, Н с/м2 , но известны диапазоны, в которых находятся их значения.

(2)0 < m1 m m2 , 0 < l1 l l2 , 0 < κ1 κ κ 2 ;

η(t) – неизвестная функция времени, которая характеризует

действие внешних, ограниченных возмущений с ограниченной производной:

(3)η(t) N0 , η(t) N1 , t 0 .

Области изменения переменных состояния имеют конструктивные ограничения, которые согласованы с мощностью электропривода, т. е. режимы работы, параметры которых удовлетворяют неравенствам:

(4)

xi (t)

Xi , i =

1,3

, t 0 ,

обеспечиваются при

(5)

 

 

u(t)

 

U.

 

 

 

В неравенствах (2)–(5) границы диапазонов считаются известными константами.

Ставится задача синтеза разрывного управления по обратной связи, обеспечивающего слежение выходной переменной

 

x1(t)

 

за заданной,

допустимой траекторией g(t) :

 

g(t)

 

X1 ,

 

 

 

g(t)

 

X 2 , t 0

в предположении, что измеряется только

 

 

44

 

 

 

 

 

 

 

Фундаментальные математические основы теории управления

ошибка слежения: e1 (t) = x1(t) g(t) . Аналитический вид функций g(t), g(t), g(t) не известен.

Нетрудно убедиться в том, что система (1) при η(t) 0

управляема и наблюдаема относительно выходной переменной [6, 10]. Наша цель состоит в синтезе многофункциональной робастной системы слежения, не требующей перенастройки в зависимости от изменений внешних воздействий и параметров механической подсистемы m , l , κ в известных пределах. Допускается, например, наличие съемных стержней маятника разной массы и разной длины, удовлетворяющих (2). Для решения поставленной задачи требуется привлекать специальные методы робастного управления и наблюдения.

В следующем разделе представлена процедура синтеза базового закона разрывного управления, обеспечивающего асимптотическую стабилизацию ошибки слежения:

(6)

lim e (t) = 0

 

t→∞ 1

в предположении,

что текущие значения всех внутренних

и внешних переменных известны.

3. Базовый закон разрывного управления

Для синтеза закона управления по обратной связи, обеспечивающего стабилизацию ошибки слежения, целесообразным является представление математической модели объекта управления в эквивалентной форме «вход–выход» относительно ошибок слежения [1]. Предположение о гладкости внешних воздействий позволяет получить каноническую форму «вход–выход» в виртуальном пространстве смешанных переменных – комбинаций переменных состояния, внешних воздействий и их производных [2, 4]. Для получения этой формы нужно три раза продифференцировать ошибку слежения в силу системы (1) и выполнить невырожденные замены переменных. В итоге система (1) будет представлена в следующем каноническом виде:

(7)e1 = e2 , e2 = e3 , e3 = ψ(x,t) + bu ,

где e1 = x1 g , e2 = x2 g , e3 = a21 sin x1 a22 x2 + a23 (x3 + η) g

45

45

Управление большими системами. Выпуск XX

это смешанные переменные нового координатного базиса,

(8)

 

 

ei (t)

 

Ei ,i = 1,2,3

, E1,2

= 2X1,2 ;

 

 

 

 

 

 

 

функция ψ(t)

имеет вид

 

 

 

 

 

 

 

ψ(t) = a21x2 cos x1 + a33a21 sin x1

(a23a32 + a22a33 )x2 +

(a

 

a

)e a a

a

 

 

(a

a )g

g

 

22 + 33

3 + 33 23η+

23

η

 

22 + 33

 

и полагается возмущением, которое в силу (2)–(4) ограничено

(9) ψ (t) F t 0

и принадлежит пространству управления. В то же время для обеспечения инвариантности к внешнему возмущению в системе (7) нет возможности использовать методы комбинированного управления, так как множитель перед управлением в системе

(7) принял вид b = a23b3 и потерял определенность, в силу (1),

(2) известен только его знак и диапазон значений:

(10) 0 < b b b .

Для обеспечения инвариантности по отношению к внешнему согласованному возмущению в системе (7)–(8) вводится базовый закон разрывного управления вида:

(11)

u = −M sgn s, s = c1e1 + c2e2 + e3 , U M = const > 0 ,

где s

– поверхность переключений, ci = const > 0 – коэффици-

енты Гурвицева полинома, а именно для корней λ1,2 уравнения

λ2 + c2λ+ c1 = 0 выполняется условие: Re λ1,2 < 0 .

Найдем нижнюю оценку для выбора амплитуды разрывного управления M из достаточного условия ss < 0 [8]:

(12)ss = s(c1e2 + c2e3 +ψ (x,t) bM sgn s)

s (c1E2 + c2 E3 + F bM ) < 0 M > (c1E2 + c2 E3 + F) / b.

При выбранной на основе неравенств (5), (12) амплитуде за

конечное время ts > 0 на поверхности s = 0 в пространстве R3 возникнет скользящий режим. При t > ts динамический порядок системы (7), (11)–(12) понижается с третьего до второго:

 

s = c1e1 + c2e2 + e3 = 0 e3 = −c1e1 c2e2 ,

(13)

e1 = e2 , e2 = −c1e1 c2e2 .

46

 

Фундаментальные математические основы теории управления

Редуцированная система (13), которой описываются движения в скользящем режиме, устойчива, не зависит от возмущений, а желаемые темпы сходимости ошибки слежения (6) обеспечиваются выбором параметров c1,2 > 0 .

Для информационного обеспечения базового закона управления при измерении только ошибки слежения e1(t) в следую-

щем разделе представлен метод синтеза укороченного наблюдателя состояний и возмущений, в котором также реализуется метод разделения движений.

4.Синтез наблюдателя смешанных переменных

Вотличие от известных подходов, требующих расширения пространства состояний за счет экзогенных динамических моделей внешних воздействий [1, 7], предлагается комплексный подход к задаче наблюдения. Для оценивания смешанных переменных вводится наблюдатель второго порядка, построенный на основе укороченной системы (7) в виде

(14)

z1 = z2

+ v1, z2 = v2 ,

где z

– вектор состояний,

z = (z1 , z2 )T R2 , v1,2 – корректирую-

щие воздействия наблюдателя, которые формируются на основе измерений e1 (t) так, чтобы обеспечить стабилизацию системы

относительно ошибок наблюдения εi = ei zi , i = 1,2 :

(15)ε1 = ε2 v1, ε2 = e3 v2 ,

где e3 (t) полагается ограниченным внешним воздействием (8).

Для упрощения вычислительного аспекта ниже предлагается метод синтеза корректирующих воздействий наблюдателя в виде sat-функций – линейных функций с насыщением [3, 5]. Такой подход обеспечивает решение задачи наблюдения с некоторой, наперед заданной точностью, но, в отличие от линейного наблюдателя с большими коэффициентами [11], не требует расширения пространства состояний для оценивания внешних возмущений. Идея заключается в том, чтобы за конечное время T > 0 обеспечить в системе (15) стабилизацию с заданной точностью ошибок наблюдения и их производных. Тогда при T > 0

47

47

Управление большими системами. Выпуск XX

переменные наблюдателя сойдутся в малую окрестность смешанных переменных zi (t) ei (t) , а из уравнения статики

ε 2 = e3 v2 0 будет получена оценка v2 (t) e3 (t) .

Лемма. Если в системе (15) с корректирующими воздействиями в виде линейных функций с насыщением

 

 

M sgnε

 

,

 

ε

 

 

> 1/ l

,

 

 

 

 

 

 

(16)

v1

= M1sat(l1ε1) =

1

1

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

M1l1ε1,

ε1

1/ l1;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

 

sgnv ,

 

v

 

 

 

> 1/ l

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v2 = M 2sat(l2v1) =

 

 

2

 

1

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M 2l2v1,

v1

1/ l2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

начальные условия и функция e3 (t) ограничены

 

 

 

(17)

 

εi (0)

 

Ei , i = 1,2 ,

 

e3 (t)

 

F3 = E3 ,

 

 

 

 

 

 

 

 

то тогда для любых, сколь угодно малых δ, T > 0 найдутся та-

кие положительные действительные числа

Mi ,li , что Mi ,li :

Mi > Mi , li

> li , i = 1,2

выполнятся неравенства

 

 

(18)

 

εi (t)

 

δ,

i = 1,2 ,

 

e3 (t) v2 (t)

 

δ t T.

 

 

 

 

 

 

Доказательство. Разделим отрезок времени [0;T ] на 4

от-

резка с помощью точек 0 < t1 < t2 < t3 < t4 = T . Предполагая,

что

δ<< min{E1 , E2}, амплитуды Mi > 0

 

( i = 1,2 ) корректирующих

воздействий (16) будем выбирать так, чтобы обеспечить последовательно (сверху вниз) сходимость корректирующих воздействий в линейные зоны за конечное время:

(19)

 

ε1 (t)

 

1/ l1 t > t1,

 

v1(t)

 

1/ l2 t > t3 .

 

 

 

 

Параметры li > 0 (i = 1,2 ) выполняют роль больших коэффициен-

тов и выбираются так, чтобы обеспечить (18), а также за время [t2i1;t2i ] выполнениенеравенств:

(20)

 

εi+1 (t) vi (t)

 

=

 

αi+1 (t)

 

i+1 < δ t > t2i , i = 1,2; ε3 := e3.

 

 

 

 

 

Решения системы (15)–(16) ограничены на любом конечном

интервале времени. Параметры корректирующих воздействий выбираются с целью стабилизации переменных состояния, что позволяет ввести ограничения εi (t) Fi = const t 0, i = 1,2.

48

Фундаментальные математические основы теории управления

В системе (15)–(16) sgnv1(t) = sgnε1(t) t 0 по построению, а совпадение знаков sgnv2 (t) = sgnε 2 (t) может не иметь места при 0 t t2 и гарантируется только при t > t2 вне окрестности ε 2 2 (20).

Если sgnv2 (0) = sgnε 2 (0) , то система (15)–(16) в начальный момент времени представима в виде: ε i = ε i+1 Mi sgnε i , i = 1,2 .

Ее переменные монотонно устремятся в некоторые окрестности нуля при выборе амплитуд корректирующих воздействий на основе достаточных условий:

(21)εiεi < 0 εi (εi+1 Misgnεi ) εi (Fi+1 Mi ) < 0

Mi > Fi+1, i = 1,2,

где

Fi = Ei , i = 1,2 . В худшем случае области изменений оши-

бок наблюдения можно оценить следующим образом:

(22)

F1 =

 

ε1(0)

 

E1 , F2 =

 

ε 2 (t2 )

 

E2 + (F3 + M2 )t2 , F3 = E3 .

 

 

 

 

Неравенства для выбора амплитуд корректирующих воздействий Mi , обеспечивающих (19) за указанное время, имеют вид

(23)

Mi

>

 

ε i (t2i2 )

 

 

+ Fi+1

,i = 1,2.

 

 

 

 

 

 

 

t2i1

t2i2

 

 

 

 

 

С учетом (22) из (23) последовательно, снизу вверх имеем:

(24)

M

2

>

E2 + (F3 + M2 )t2

 

+ F M

=

E2 + F3t3

,

 

 

 

 

 

 

 

 

t3

t2

 

 

 

3

2

 

t3 2t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2t

2

< t

3

< T,

M

 

= E / t + F .

 

 

 

 

 

 

 

1

1

1

2

 

 

 

Таким образом, найдены Mi

(24): Mi > Mi , i = 1,2 , нера-

венства (19) будут выполнены.

 

 

 

 

 

 

 

 

Положим, например,

t = t1 = t2 t1 = t3 2t2 = t4 t3 > 0 .

Тогда границы диапазона для выбора

t > 0 , при котором обес-

печивается заданное время T > 0 сходимости ошибок наблюде-

ния, имеет вид:

T =

 

t6 0 <

t T / 6 .

 

 

 

(25)

 

 

 

 

 

 

 

 

 

Амплитуды Mi последовательно,

снизу вверх выбираются

на основе (24), (22) при принятом значении

t (25).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

49

 

 

 

 

 

 

 

 

 

 

 

 

 

 

49

Управление большими системами. Выпуск XX

С учетом (19)–(20) система (15)–(16) представима в виде:

(26)

 

 

 

 

 

 

 

ε1 = −M1l1ε1 + ε 2 ,

 

ε1

 

1/ l1

t > t1 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε 2 = −M2l2v1 + ε3 = −M2l2 (ε 2 α2 ) + ε3 ,

 

 

 

 

 

 

 

 

 

 

v1

 

 

1/ l2

 

ε 2

 

 

1/ l2 + 2 t > t3 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для переменных системы (26) на интервалах [t1;t1 +

t = t2 ],

[t3;t3 +

 

t = t4 ] справедливы оценки соответственно:

 

 

 

 

 

 

 

 

 

 

 

ε 2 (t)

 

 

 

 

1

 

ε 2 (t)

 

 

 

F

M

 

F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(27)

 

ε

 

(t

 

)

 

 

 

 

 

+

 

 

 

 

 

 

 

 

eM1l1 t

 

2

+

 

1

2

e

M1l1 t ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

M l

 

 

l

 

M l

 

 

 

M l

M l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1

 

 

 

 

1

 

1 1

 

 

 

1 1

 

 

 

1 1

 

 

 

 

 

 

ε 2

(t4 )

 

F3

+ 2 +

M 2 F3

eM 2l2 t .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M 2l2

 

 

 

 

M 2l2

 

 

 

 

С учетом v1 = M1l1ε1

t > t1 ,

 

v2 = M 2l2 (ε 2 α 2 ) ,

t > t3 из

(27)

следуют

нижние оценки

для

выбора

коэффициентов

l1,2 > 0 , при которых обеспечиваются неравенства (20):

(28)

(M

i

F

+1

)eM ili t

i+1

l

i

>

 

1

ln

Mi

Fi+1

 

, i = 1,2 .

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

tMi

i+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С учетом (27)–(28) при t2i < t T для переменных системы

(26)имеем соответственно:

(29)

 

 

ε1

 

 

ε 2

 

+

 

 

2

,

 

 

 

ε 2

 

 

 

ε 3

 

 

+

 

3

+

2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M2l2

 

 

 

 

 

 

 

 

 

 

M1l1

 

 

 

 

 

 

 

 

 

 

 

 

Из двух последних выражений (28), (29) следует, что нера-

венства

 

e3 (t) v2 (t)

 

δ ,

 

ε 2 (t)

 

δ

будут выполнены t T

 

 

 

 

при любом l2 > l2 , если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

+ δ

 

 

 

1

 

 

 

 

 

 

M

2

F

 

(30)

 

l2 = max

3

 

 

 

;

 

 

 

 

 

 

ln

 

3

.

 

 

 

 

 

 

 

 

 

 

 

 

 

δ

 

 

 

 

 

 

 

 

 

M2δ

 

 

 

tM2

 

 

 

Для выбранного l2 > l2 определяем точность

0 < 2 δ (F3 + δ ) /(M2l2 ) ,

которую нужно обеспечить выбором l1 (28). Оба неравенства

ε 2 (t) v1(t) 2 < δ t > t2 ,

50