Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
9
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Q = Q (х, у , <р), например, по одной из формул:

Q = max {ô (s,)} — min {ô fo)},

Q =

min

{ô (Si)},

(11.2.12)

Q =

max

{ô (sj)},

 

 

i=X,..., m

 

 

и проверяет выполнение ограничений:

б (sO > О (i = 1 , . ., m).

(11.2.13)

Эти формулы являются дискретными представлениями непрерывных зависимостей (11.2.5), (11.2.8), (11.2.9) и (11.2.7). Такая аппроксимация приближенна и при рав­ номерном и бесконечном числе точек замера припуска точна.

Продолжим обсуждение схемы. Полученное в БФК значение показателя качества Q и состояние ограничений (11.2.13) поступают на автоматический оптимизатор АО. Этот оптимизатор, оперируя одним из методов поиска, экстремизирует критерии с соблюдением заданных ограни­ чений путем воздействия на управляемые параметры х, у , Ф с помощью исполнительных механизмов ИМ. Работая таким образом, АО определит в конечном счете оптималь­ ный припуск, что и решает поставленную задачу.

Б. Решение граничных задач. Граничной задачей назы­ вается задача, требующая решения системы дифференци­ альных уравнений

(11.2.14)

дЗп =fm {Уi-,Уг

Уда. О

при t > 0 с граничными условиями, заданными в момент времени t Ф 0 . Это означает, что в начальный момент t — 0 определены не все начальные условия. Некоторые из Уг (0) (i = 1, . ., т) неизвестны, что исключает решение этой задачи обычными способами интегрирования диффе­ ренциальных уравнений (на аналоговой машине или ме­ тодом Рунге — Кутта на ЦВМ).

Рассмотрим решение поставленной задачи методами экстремального управления.

Пусть для определенности первые т п переменных определены в начальный момент времени:

Уг (°) - <*iî У2 (0) = «2 Î •Ут-п (0) = flm-n» (И.2.15)

а остальные заданы в момент Т ■=£■0:

Ут-п+1 = Om-n+lî

•; Ут = «тп* (И.2.16)

Задача заключается в определении начальных условий для этих п переменных,- после чего система интегрирует­ ся стандартным образом.

Обозначим

Ут-п+1 (0 ) =

Ут-п+2 (®) = ^2 »

Ут (0) = Х п , (11.2.17)

где хх, х2, ., хп — неизвестные параметры. Решение системы зависит от этих параметров. Их следует выбрать таким образом, чтобы при t = Т выполнились условия (11.2.16).

Введем функцию невязки в виде

71

Q (#1,

, • . • , %п) =

2 IУт-n+i

ûm-n+i]2»

(11.2.18)

 

 

 

г= 1

 

 

 

где ym-n+i(T)

(г = 1,

.. ,«)

значение <(то

0-й

переменной

в

момент

t = Т

при

начальных •условиях

(11.2.17). Смысл этой функции сводится к следующему. Определим неизвестные начальные условия произвольным образом (11.2.17). Тогда, решая с этими начальными усло­ виями заданную систему дифференциальных уравнений, получим при t = Т значения переменных, которые, вооб­ ще говоря, не удовлетворяют граничным условиям (11.2.16). Степень этого несоответствия естественно,. опре­ делить как сумму квадратов разностей (11.2.18), которая неотрицательна и равна нулю лишь при выполнении заданных граничных условий (11.2.16).

Таким образом, решение граничной задачи сводится к минимизации функции вида (11.2.18), т. е. к задаче эк­ стремального управления.

Блок-схема решения граничной задачи показана на рис. 11:2.4. Здесь объектом является процесс решения заданных уравнений (11.2.14). На вход в этот объект

подаются начальные условия аг, а2, ., am_n, хг, ., хп. На выходе объекта через промежуток времени Т появля­ ются значения всех переменных уг (Т), ym (Т). По­ следние п значений сопоставляются с граничными усло­ виями при t = Т и полученные разности поступают на блок формирования критерия БФК, который образует невяз­ ку по формуле (11.2.18). Значение невязки Q поступает

Рис. 11.2.4. Блок-схема решения граничной задачи с помощью ав­ томатического оптимизатора.

на автоматический оптимизатор АО, который определяет начальные условия хх, . хп таким образом, чтобы минимизировать невязку Q.

Следовательно, применяя методы экстремального уп­ равления, можно эффективно решать граничные задачи систем обыкновенных дифференциальных уравнений.

В . Метод самонастраивающейся модели. В научных и практических задачах часто возникает проблема син­ теза модели объекта по наблюдениям его входа и выхода. Эта задача довольно просто сводится к задаче экстре­ мального управления.

Пусть структура модели задана, т. е. определен опе­ ратор связи ее входа и выхода с точностью до ряда не­

известных коэффициентов

 

Z' — F (Y, X),

(11.2.19)

где Z' — выход модели, Y — ее вход, X — вектор неиз­ вестных параметров. Вид оператора F предполагается заданным.

Для оценки точности модели вводится скалярная функция невязки выходов объекта и модели

Q = Ф (Z'Z),

 

(11.2.20)

где Z — выход объекта. Невязку

Q можно

определить,

например, в виде

 

 

 

Q =

\Z' — Z\2.

(11.2.21)

Очевидно, что невязка зависит от

входа Y

и парамет-

ров X

 

 

(11.2.22)

Q = Q(X, Y).

 

Таким образом, задача

синтеза

модели

сводится к

Рис. 11.2.5. Блок-схема системы самонастраивающейся модели.

минимизации невязки Q, т. е. к решению следующей экст­ ремальной задачи:

Q (X, У)—s-min.

(11.2.23)

X

 

Блок-схема системы самонастраивающейся модели с ис­

пользованием

автоматического

оптимизатора показана

на рис. 11.2.5.

Пусть объект линеен и имеет один вход и

П р и м е р .

один выход:

ъ Д| “I"

о>2У*

 

Модель имеет ту же структуру и зависит от двух парамет­ ров хх и х2:

z' = а?! -f х2у.

Невязка (11.2.21) имеет вид

Q (хх, х2) = [(хх — аг) + (х2 — а2) у]2.

Ее минимум соответствует выполнению условия

(хх

flj) =

2 а2) у,

которое выполняется для переменного значения у — у it) лишь при

av OLSO 1 д2)

т.е. при совпадении параметров модели и объекта. Как видно, задача синтеза адекватной модели в данном случае может быть решена лишь при переменном входе,

т.е. при

У— У С^-

Если же у = const, то задача не решается.

В этом, в частности, и проявляется принцип необхо­ димого разнообразия входа при реализации метода само­ настраивающейся модели. Он утверждает, что для опреде­ ления параметров объекта необходимо обеспечить доста­ точное разнообразие его входа. В противном случае по­ ставленная задача неразрешима.

§ 11.3. Геометрия поиска

 

 

^Состояние многопараметрического

безынерционного

объекта характеризуется вектором

 

X = (х1э

., хп).

(11.3.1)

Рассмотрим тг-мерное пространство, в котором имеется ортогональная прямоугольная система координат, опреде­ ляемая базисом {ег, е2, ., еп), где ег (i = 1 , . п) — орты. Каждая точка этого пространства может быть пред­ ставлена в виде вектора

А ==

4“ О-Фч —j-

4

(11.3.2)

где

av

., ап — координаты

этой тонки в выбранной

системе координат. Вектор X в таком и-мерном простран­

стве

{Л}

определяет

точку

с координатами

ах = хх,

а2 х2,

., ап = хп.

Таким

образом, между

точками

пространства {ÂL} и состояниями экстремального объекта устанавливается взаимнооднозначное соответствие, т. е. каждому состоянию объекта X соответствует одна точка пространства параметров А и, наоборот, каждой точке

о)

б)

Рис. 11.3.1. Пространство параметров: а)

п = 2, б) п = 3.

этого пространства А соответствует одно, и только одно, состояние объекта^. Это позволяет не различать векторы А и X, так как А = X. Такое пространство называют

пространством параметров {X}.

Процесс поиска экстремума очень удобно рассматри­ вать в пространстве параметров, где алгоритмы оптими­ зации приобретают наглядный геометрический смысл.

Так как рассматривать на чертеже геометрические построения в пространстве более чем трех измерений крайне затруднительно (хотя и возможно), мы в дальней­ шем будем ограничиваться двумерными иллюстрациями (п = 2) и в редких случаях — трехмерными (п = 3). Од­ нако выводы, которые при этом можно сделать, легко распространяются на многомерный случай. В этом несом­ ненное преимущество геометрических представлений. Ус­ пех поисковых методов в значительной мере определился наличием такой необыкновенно наглядной геометрической интерпретации поиска.

На рис. 11.3.1 показано пространство оптимизируемых

параметров для случая двух-

(а) и трехмерного (б)объекта.

Исходное состояние здесь

определяется точкой Х 0 =

= (х10, х20, х30). При изменении только одного параметра Xi мы переходим в точку Xv При этом точка, изображаю­ щая состояние объекта в этом пространстве параметров, описывает траекторию в виде прямой Х 0Хх, параллельной оси xv Если же изменять все параметры одновременно, то точка, изображающая состояние объекта, опишет, в общем случае, криволинейную траекторию, например такую, как показано на рис. 11.3.1, а и б при переходе из состояния Х 0 в состояние Х 2.

Таким образом, изменяя параметры оптимизируемого объекта, мы двигаемся в различных направлениях про­ странства параметров. Искомое экстремальное состояние

X*, минимизирующее функцию качества

 

Q (X*) = min Q (X),

(11.3.3)

A'es

 

впространстве параметров также представляется точкой X*, сближение с которой является целью экстремаль­ ного управления. Эту точку в пространстве параметров обычно называют «целью». Кроме этой характерной точки,

впространстве параметров имеются поверхности равного значения показателя качества, уравнения которых имеют вид

Q(X) = c = const,

(11.3.4)

где с — значение показателя качества. Будем в дальней­ шем называть эти поверхности поверхностями равного уровня. Для случая п = 2 такие поверхности являются ли­ ниями. Образование линий равного уровня наглядно показано на рис. 1 1 .3 .2 , а.

Здесь функция Q = Q {хх, х2) имеет «чашеобразную» форму. Ее сечения плоскостями Q = ct- (i = 1, 2, 3) спро­ ецированы на плоскость параметров (хг, х2). Полученные замкнутые линии и являются линиями равного уровня. Они показаны на рис. 11.3.2, б.

В двумерном случае (п = 2) линии равного уровня имеют наглядную «топографическую» аналогию. Пусть

величина Q является

высотой (см. рис. 11.3.2). Тогда

Q = Q (хх, х2) является

рельефом некоторой «местности».

Действительно, каждой точке (хх, х2) этой местности соот­ ветствует определенная высота Q (над уровнем моря). Следовательно, в двумерном случае пространство пара­ метров {яц х2} с линиями равного уровня (см. рис. 11.3.2, б) является, по сути дела, обычной топографической картой «местности», характеризуемой функцией Q = Q (xlt х2). Эта аналогия настолько глубока и наглядна, что привела

Рис. 11.3.2. Пример построения линий равного уровня (п—2).

к заимствованию ряда терминов из топографии. Так, функцию качества Q (X) часто называют рельефом, увели­ чение — «подъемом», а уменьшение — «спуском» и т. д.

.Рассмотрим теперь, как в пространстве параметров {X} представляются ограничения первого

*1 (X) = 0 (i = l,

. , к < п )

(11.3.5)

и второго рода

М Х ) > 0

0 = 1.

Р ^ п ) .

(11.3.6)

Как легко заметить, ограничения первого рода умень­ шают размерность пространства параметров. Так, в трех­ мерном случае (рис. 11.3.3) решение находится на по­ верхности g (arlt х2, х3) — 0, которая и определяет дву­ мерное пространство оптимизируемых параметров.

Ограничения второго рода (11.3.6) высекают «куски» пространства параметров, где следует искать экстремум. Уравнение hj (X ) — 0 является уравнением границы, разделяющей пространство параметров на две части.

В одной из них условие hj (X ) ]> 0 выполняется, а в дру­

гой — не выполняется

(на рис. 11.3.4 эти части заштри­

 

 

 

хованы). При этом мини-

 

 

9^

мум показателя

качества

 

 

может оказаться вне допу­

 

 

 

стимой

области.

В этом

 

 

 

случае

цель

X *,

удовле­

 

 

 

творяющая ограничениям,

 

 

 

может

оказаться

на гра­

 

 

 

нице (см. рис. 11.3.4).

 

 

 

Рельеф функции каче­

 

 

$

ства Q — Q (X) можно ха­

 

 

рактеризовать не только

 

 

 

поверхностями

равного

 

 

 

уровня. Другой важной и

 

 

 

наглядной

характеристи­

 

 

 

кой многомерной функции

Рис. 11.3.3. Пример ограничения

является ее градиент. Име­

типа равенства в трехмерном про­

ются два определения гра­

 

странстве.

 

диента:

 

 

1)

Градиентом

 

направленный

называется

вектор,

в сторону наибольшего увеличения

показателя

качества

Рис. 11.3.4. Пример ограничений типа неравенств (п=2).

и модуль которого равен производной показателя каче­ ства в этом направлении.

2) Градиент функции Q = Q (X) аналитически опре­ деляется в следующем виде:

g ra d < ? (X )= (i2 g !-

ÔQ (X)

, ^ 2 - ) . (И.3.7)

дхг

 

 

т. е. составляющие градиента вдоль координатных осей равны частным производным по этим координатам.

Для иллюстрации покажем при п = 2 , что оба определе­ ния идентичны.

Опишем вокруг точки Х 0 =

= (я?> #а) окружность малого радиуса е так, что внутри этой окружности функцию качества можно считать линейной фор­ мой:

Q (X) = < ? 0 + «i (хг — xi) -|-

+ аа 2 xl),

(11.3.8)

Рис. 11.3.5. К определению градиента (п=2).

где Q0 = Q (xl, х\). Это представление является разло­ жением в ряд Тейлора, где ввиду малости е отброшены члены второго порядка малости. Очевидно, что

_ 3QW

 

 

(1о

-- --ô-----

 

(11.3.9)

 

Х=Х0

а

*<?(•*>

\х=х0

 

d x i

 

0X2

 

 

 

 

 

 

 

Для координат этой окружности (рис. 11.3.5) имеем

хг =

я? +

е cos ср,

 

(11.3.10)

х2 =

^ 2 +

е sin Ф-

 

 

 

Значение показателя качества в точках этой окружности получим, подставив (11.3.10) в (11.3.8):

@(ф) = Qo + ÛIÊCOSÇ + а2е sinç.

(11.3.11)

Теперь найдем на окружности точку, показатель качества которой наиболее отличается от его значения в исходном состоянии Х0. Очевидно, что производная в этом направ­ лении будет максимальной.

Для этого достаточно

найти максимум функции:

ДQ = Q (ф) — Qo =

Д1 8 cos ф -j- а? е sin ф. (11.3.12)