книги / Системы экстремального управления
..pdfQ = Q (х, у , <р), например, по одной из формул:
Q = max {ô (s,)} — min {ô fo)},
Q = |
min |
{ô (Si)}, |
(11.2.12) |
Q = |
max |
{ô (sj)}, |
|
|
i=X,..., m |
|
|
и проверяет выполнение ограничений:
б (sO > О (i = 1 , . ., m). |
(11.2.13) |
Эти формулы являются дискретными представлениями непрерывных зависимостей (11.2.5), (11.2.8), (11.2.9) и (11.2.7). Такая аппроксимация приближенна и при рав номерном и бесконечном числе точек замера припуска точна.
Продолжим обсуждение схемы. Полученное в БФК значение показателя качества Q и состояние ограничений (11.2.13) поступают на автоматический оптимизатор АО. Этот оптимизатор, оперируя одним из методов поиска, экстремизирует критерии с соблюдением заданных ограни чений путем воздействия на управляемые параметры х, у , Ф с помощью исполнительных механизмов ИМ. Работая таким образом, АО определит в конечном счете оптималь ный припуск, что и решает поставленную задачу.
Б. Решение граничных задач. Граничной задачей назы вается задача, требующая решения системы дифференци альных уравнений
(11.2.14)
дЗп =fm {Уi-,Уг |
Уда. О |
при t > 0 с граничными условиями, заданными в момент времени t Ф 0 . Это означает, что в начальный момент t — 0 определены не все начальные условия. Некоторые из Уг (0) (i = 1, . ., т) неизвестны, что исключает решение этой задачи обычными способами интегрирования диффе ренциальных уравнений (на аналоговой машине или ме тодом Рунге — Кутта на ЦВМ).
Рассмотрим решение поставленной задачи методами экстремального управления.
Пусть для определенности первые т — п переменных определены в начальный момент времени:
Уг (°) - <*iî У2 (0) = «2 Î •Ут-п (0) = flm-n» (И.2.15)
а остальные заданы в момент Т ■=£■0:
Ут-п+1 (Л = Om-n+lî |
•; Ут (Л = «тп* (И.2.16) |
Задача заключается в определении начальных условий для этих п переменных,- после чего система интегрирует ся стандартным образом.
Обозначим
Ут-п+1 (0 ) = |
Ут-п+2 (®) = ^2 » |
Ут (0) = Х п , (11.2.17) |
где хх, х2, ., хп — неизвестные параметры. Решение системы зависит от этих параметров. Их следует выбрать таким образом, чтобы при t = Т выполнились условия (11.2.16).
Введем функцию невязки в виде
71
Q (#1, |
, • . • , %п) = |
2 IУт-n+i (Л |
ûm-n+i]2» |
(11.2.18) |
||
|
|
|
г= 1 |
|
|
|
где ym-n+i(T) |
(г = 1, |
.. ,«) |
— значение <(то — |
0-й |
||
переменной |
в |
момент |
t = Т |
при |
начальных •условиях |
(11.2.17). Смысл этой функции сводится к следующему. Определим неизвестные начальные условия произвольным образом (11.2.17). Тогда, решая с этими начальными усло виями заданную систему дифференциальных уравнений, получим при t = Т значения переменных, которые, вооб ще говоря, не удовлетворяют граничным условиям (11.2.16). Степень этого несоответствия естественно,. опре делить как сумму квадратов разностей (11.2.18), которая неотрицательна и равна нулю лишь при выполнении заданных граничных условий (11.2.16).
Таким образом, решение граничной задачи сводится к минимизации функции вида (11.2.18), т. е. к задаче эк стремального управления.
Блок-схема решения граничной задачи показана на рис. 11:2.4. Здесь объектом является процесс решения заданных уравнений (11.2.14). На вход в этот объект
подаются начальные условия аг, а2, ., am_n, хг, ., хп. На выходе объекта через промежуток времени Т появля ются значения всех переменных уг (Т), ym (Т). По следние п значений сопоставляются с граничными усло виями при t = Т и полученные разности поступают на блок формирования критерия БФК, который образует невяз ку по формуле (11.2.18). Значение невязки Q поступает
Рис. 11.2.4. Блок-схема решения граничной задачи с помощью ав томатического оптимизатора.
на автоматический оптимизатор АО, который определяет начальные условия хх, . хп таким образом, чтобы минимизировать невязку Q.
Следовательно, применяя методы экстремального уп равления, можно эффективно решать граничные задачи систем обыкновенных дифференциальных уравнений.
В . Метод самонастраивающейся модели. В научных и практических задачах часто возникает проблема син теза модели объекта по наблюдениям его входа и выхода. Эта задача довольно просто сводится к задаче экстре мального управления.
Пусть структура модели задана, т. е. определен опе ратор связи ее входа и выхода с точностью до ряда не
известных коэффициентов |
|
Z' — F (Y, X), |
(11.2.19) |
где Z' — выход модели, Y — ее вход, X — вектор неиз вестных параметров. Вид оператора F предполагается заданным.
Для оценки точности модели вводится скалярная функция невязки выходов объекта и модели
Q = Ф (Z'Z), |
|
(11.2.20) |
|
где Z — выход объекта. Невязку |
Q можно |
определить, |
|
например, в виде |
|
|
|
Q = |
\Z' — Z\2. |
(11.2.21) |
|
Очевидно, что невязка зависит от |
входа Y |
и парамет- |
|
ров X |
|
|
(11.2.22) |
Q = Q(X, Y). |
|
||
Таким образом, задача |
синтеза |
модели |
сводится к |
Рис. 11.2.5. Блок-схема системы самонастраивающейся модели.
минимизации невязки Q, т. е. к решению следующей экст ремальной задачи:
Q (X, У)—s-min. |
(11.2.23) |
X |
|
Блок-схема системы самонастраивающейся модели с ис
пользованием |
автоматического |
оптимизатора показана |
на рис. 11.2.5. |
Пусть объект линеен и имеет один вход и |
|
П р и м е р . |
||
один выход: |
ъ Д| “I" |
о>2У* |
|
Модель имеет ту же структуру и зависит от двух парамет ров хх и х2:
z' = а?! -f х2у.
Невязка (11.2.21) имеет вид
Q (хх, х2) = [(хх — аг) + (х2 — а2) у]2.
Ее минимум соответствует выполнению условия
(хх |
flj) = |
(х2 а2) у, |
которое выполняется для переменного значения у — у it) лишь при
—av OLSO 1 д2)
т.е. при совпадении параметров модели и объекта. Как видно, задача синтеза адекватной модели в данном случае может быть решена лишь при переменном входе,
т.е. при
У— У С^-
Если же у = const, то задача не решается.
В этом, в частности, и проявляется принцип необхо димого разнообразия входа при реализации метода само настраивающейся модели. Он утверждает, что для опреде ления параметров объекта необходимо обеспечить доста точное разнообразие его входа. В противном случае по ставленная задача неразрешима.
§ 11.3. Геометрия поиска |
|
|
^Состояние многопараметрического |
безынерционного |
|
объекта характеризуется вектором |
|
|
X = (х1э |
., хп). |
(11.3.1) |
Рассмотрим тг-мерное пространство, в котором имеется ортогональная прямоугольная система координат, опреде ляемая базисом {ег, е2, ., еп), где ег (i = 1 , . п) — орты. Каждая точка этого пространства может быть пред ставлена в виде вектора
А == |
4“ О-Фч —j- |
4 |
(11.3.2) |
где |
av |
., ап — координаты |
этой тонки в выбранной |
||
системе координат. Вектор X в таком и-мерном простран |
|||||
стве |
{Л} |
определяет |
точку |
с координатами |
ах = хх, |
а2 —х2, |
., ап = хп. |
Таким |
образом, между |
точками |
пространства {ÂL} и состояниями экстремального объекта устанавливается взаимнооднозначное соответствие, т. е. каждому состоянию объекта X соответствует одна точка пространства параметров А и, наоборот, каждой точке
о) |
б) |
Рис. 11.3.1. Пространство параметров: а) |
п = 2, б) п = 3. |
этого пространства А соответствует одно, и только одно, состояние объекта^. Это позволяет не различать векторы А и X, так как А = X. Такое пространство называют
пространством параметров {X}.
Процесс поиска экстремума очень удобно рассматри вать в пространстве параметров, где алгоритмы оптими зации приобретают наглядный геометрический смысл.
Так как рассматривать на чертеже геометрические построения в пространстве более чем трех измерений крайне затруднительно (хотя и возможно), мы в дальней шем будем ограничиваться двумерными иллюстрациями (п = 2) и в редких случаях — трехмерными (п = 3). Од нако выводы, которые при этом можно сделать, легко распространяются на многомерный случай. В этом несом ненное преимущество геометрических представлений. Ус пех поисковых методов в значительной мере определился наличием такой необыкновенно наглядной геометрической интерпретации поиска.
На рис. 11.3.1 показано пространство оптимизируемых
параметров для случая двух- |
(а) и трехмерного (б)объекта. |
Исходное состояние здесь |
определяется точкой Х 0 = |
= (х10, х20, х30). При изменении только одного параметра Xi мы переходим в точку Xv При этом точка, изображаю щая состояние объекта в этом пространстве параметров, описывает траекторию в виде прямой Х 0Хх, параллельной оси xv Если же изменять все параметры одновременно, то точка, изображающая состояние объекта, опишет, в общем случае, криволинейную траекторию, например такую, как показано на рис. 11.3.1, а и б при переходе из состояния Х 0 в состояние Х 2.
Таким образом, изменяя параметры оптимизируемого объекта, мы двигаемся в различных направлениях про странства параметров. Искомое экстремальное состояние
X*, минимизирующее функцию качества |
|
Q (X*) = min Q (X), |
(11.3.3) |
A'es |
|
впространстве параметров также представляется точкой X*, сближение с которой является целью экстремаль ного управления. Эту точку в пространстве параметров обычно называют «целью». Кроме этой характерной точки,
впространстве параметров имеются поверхности равного значения показателя качества, уравнения которых имеют вид
Q(X) = c = const, |
(11.3.4) |
где с — значение показателя качества. Будем в дальней шем называть эти поверхности поверхностями равного уровня. Для случая п = 2 такие поверхности являются ли ниями. Образование линий равного уровня наглядно показано на рис. 1 1 .3 .2 , а.
Здесь функция Q = Q {хх, х2) имеет «чашеобразную» форму. Ее сечения плоскостями Q = ct- (i = 1, 2, 3) спро ецированы на плоскость параметров (хг, х2). Полученные замкнутые линии и являются линиями равного уровня. Они показаны на рис. 11.3.2, б.
В двумерном случае (п = 2) линии равного уровня имеют наглядную «топографическую» аналогию. Пусть
величина Q является |
высотой (см. рис. 11.3.2). Тогда |
Q = Q (хх, х2) является |
рельефом некоторой «местности». |
Действительно, каждой точке (хх, х2) этой местности соот ветствует определенная высота Q (над уровнем моря). Следовательно, в двумерном случае пространство пара метров {яц х2} с линиями равного уровня (см. рис. 11.3.2, б) является, по сути дела, обычной топографической картой «местности», характеризуемой функцией Q = Q (xlt х2). Эта аналогия настолько глубока и наглядна, что привела
Рис. 11.3.2. Пример построения линий равного уровня (п—2).
к заимствованию ряда терминов из топографии. Так, функцию качества Q (X) часто называют рельефом, увели чение — «подъемом», а уменьшение — «спуском» и т. д.
.Рассмотрим теперь, как в пространстве параметров {X} представляются ограничения первого
*1 (X) = 0 (i = l, |
. , к < п ) |
(11.3.5) |
и второго рода
М Х ) > 0 |
0 = 1. |
Р ^ п ) . |
(11.3.6) |
Как легко заметить, ограничения первого рода умень шают размерность пространства параметров. Так, в трех мерном случае (рис. 11.3.3) решение находится на по верхности g (arlt х2, х3) — 0, которая и определяет дву мерное пространство оптимизируемых параметров.
Ограничения второго рода (11.3.6) высекают «куски» пространства параметров, где следует искать экстремум. Уравнение hj (X ) — 0 является уравнением границы, разделяющей пространство параметров на две части.