Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
7
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

определение показателя качества в точках х

 

g. «Д

оператор вычисления приращения

 

показателя

качества

AQ = Q (х + g) — Q (х — g).

 

 

 

(4.1.5)

Операторами <(х+

я» определяется

 

изменение

 

управляе­

мого параметра на

величину а в ту

 

или

иную

сторону.

 

 

Переход

к этим

операторам

 

 

условный

и зависит от вели­

 

 

чины AÇ. Условия соответст­

 

 

вующих переходов обозначе­

 

 

ны рядом со стрелками в виде

 

 

неравенств.

Оператором

«21»

 

 

обозначена выдержка системы

 

 

в течение времени Т в зафик­

 

 

сированном состоянии.

 

 

 

Кружком на схеме обозна­

 

 

чен

блок

запоминания «па­

 

 

мять

Q»,

необходимый

для

 

 

функционирования

алгорит­

 

 

ма. В блок запоминания за­

 

 

носится

значение

Q (х +

g),

 

 

которое

после

запоминания

 

 

сразу

поступает

на выход

 

 

этого

 

блока.

Направление

Рис. 4.1.2. Блок-схема алго­

движения

запоминаемой

и

воспроизводимой

 

информа­

ритма поиска с парными про­

 

бами.

 

ции показано на схеме пунк­

тирной стрелкой.

На рис. 4.1.3 показана блок-схема устройства реали­ зующего процесс экстремального управления объектом по описанному методу. Здесь пунктиром обозначен эксттремальный регулятор. Логический блок, координирую­ щий работу регулятора, реализует алгоритм поиска, по­ казанный на рис. 4.1.2. Блок памяти П необходим для запоминания предыдущего значения показателя качества, а исполнительный механизм ИМ изменяет значение уп­ равляемого параметра х объекта. Логический блок обра­ зует пробные шаги + g и, наблюдая по каналу обратной связи за двумя значениями показателя качества Qt и Qi-х, организует в соответствии с алгоритмом поиска уп­ равление исполнительным механизмом, который в свою

очередь изменяет управляемый параметр х в сторону оп­ тимального значения х*.

Как видно, в алгоритме поиска четко определены сле­ дующие этапы поиска: 1) пробные шаги, 2) принятие реше­ ния, 3) рабочий шаг, 4) выдержка.

Каждый из этих этапов играет определенную роль в процессе экстремального управления. При этом затраты времени на один цикл поиска складываются соответственно

следующим образом:

 

 

Обьет

£ц =

 

“Ь

£реш “h

£раб

+ in,

 

 

где

— время одного цикла

 

 

поиска,

tn — время, необхо­

 

 

димое

для

этапа

пробных

 

 

шагов,

 

£реш — время,

необ­

 

 

ходимое

для принятия реше­

 

 

ния, ipac — временные

затра­

 

 

ты на производство рабочего

 

 

шага,L C L

I£Qв ------ ПвремяС Ш Л .

ПвыдержкиШ Д С Ш П И .

 

овг^'^ппр_---- )

Рассмотрим подробнее на-

 

значение, особенности и вре-

рис

4.1.3. Блок-схема системы

менные

затраты

каждого

экстремального управления,

этапа.

 

На этапе пробных шагов

система поиска получает

1)

 

информацию, необходимую для определения положения экстремума. Изменение положения управляемого пара­ метра х на величину пробного шага g в оба направления осуществляется с помощью подпрограммы пробных шагов. На рис. 4.1.4 для примера показаны две схемы введения пробных шагов для случаев, когда управляемым парамет­ ром являются сопротивление и емкость. Здесь среднее положение переключателя определяет собственное зна­ чение управляемого параметра, которое состоит из двух частей:

R = R 0 + ДД,

С = С0 + ДС,

(4.1.7)

где R о и Со — изменяемая

составляющая

параметра, а

ДR и ДС — const — величины пробных изменений пара­ метра. Как видно, при переключении из одного крайнего положения в другое значение параметра изменится на 2ДR и 2ДС', что и требуется.

На этом этапе временные затраты будут складывать­ ся следующим образом:

— 2 (ini ~b ^пг) “Ь ^пз»

(*4.1.8)

где in — время, затрачиваемое на выполнение этапа проб­ ных шагов; inl — время, необходимое для изменения зна­ чения параметра на величину Лж (для случаев, рассмот­ ренных на рис. 4.1.4, ini равно времени переключения); tm — время определения показателя качества в новом состоянии. Так, для динамических объектов это время со­ ответствует времени затухания переходных процессов и т. Д-i *пз — время запоминания показателя качества в блоке памяти П.

2)Этап принятия решения сводится к определению àQ и

выяснению направления

рабочего

шага

при

 

|Д (?|> 0 ,

 

 

 

т. е.

к выяснению знака

 

 

 

разности (4.1.5).

В случае

 

 

 

|Л<?| < б принимается ре­

 

 

 

шение о невыполнении ра­

 

 

 

бочего шага (АХ = 0). Оче­

 

 

 

видно, что этот этап имеет

 

 

 

чисто информационный ха­

 

 

 

рактер и при

отсутствии

 

 

 

помех практически не име­

 

 

 

ет временных затрат, т. е.

 

 

 

 

ipeux ~

0 .

( 4 .1 . 9 )

Рис. 4.1.4. Два примера органи­

3)

решении

его выпол­

зации пробпых шагов при реали­

(при

зации

управляемого параметра:

нять) заключается в пере­

а) на

сопротивлении, б)

на

ведении объекта

в новое

 

емкости.

 

 

 

 

состояние,

отстоящее от

предыдущего на величину рабочего шага а. Временные затраты ipa6 при этом целиком определяются динамиче­ скими свойствами исполнительного механизма. Если же рабочий шаг не выполняется, то ipa6 = 0.

Рассмотрим простейший случай, когда исполнитель­ ный механизм является интегратором. Тогда при наличии естественных ограничений на ускорение управляемого параметра

можно построить такую программу изменения парамет­ ра ху при которой время изменения этого параметра на величину рабочего шага было бы минимальным. Как лег­ ко заметить, в этом случае оптимальное управление обес­ печивается следующей программой: первые полпути — разгон с максимальным ускорением (х = -}- г), а осталь­ ные — торможение с максимальным замедлением (а: = —г).

В результате получаем следующее выражение для ми­ нимального времени, необходимого для выполнения ра­ бочего шага величиной а:

 

 

 

С

= 2 j / | .

 

(4.1.11)

При этом скорость £ и ускорение х изменяются так, как

показано на рис. 4.1.5.

 

 

 

4)

Выдержка является этапом, необходимым в процессе

отслеживания цели, когда положение экстремума изме­

няется

незначительно.

В этом

 

 

случае,

очевидно,

нецелесооб­

 

 

разно

«тревожить»

объект ча­

 

 

стыми

пробными

и

рабочими

 

 

шагами, для чего и вводится

 

 

этап выдержки, во

время кото­

 

 

рого экстремальное управление

 

 

не функционирует.

оптимальное

Рис. 4.1.5.

Поведение

Очевидно,

что

скорости и ускорения при

время выдержки Т зависит от

оптимальном

управлении

интенсивности «уплываиия» эк­

параметром х при осуществ­

стремума и

тем

больше, чем

лении рабочего шага.

меньше скорость этого уплывания. Однако в процессе движения к экстремуму^этап вы­

держки вводить нецелесообразно и при этом следует по­ ложить Т = 0.

Рассмотрим работу алгоритма поиска на квадратичном

объекте:

(4.1.12)

Q(x) = к { х - х * У + Q*.

Для простоты положим х* = const и Q* = const. Тогда для приращения AÇ в процессе пробных шагов получаем после преобразований

AQ — 4tkg (х х*).

(4.1.13)

дится при |A Ç |< ô , т. 0. в зоне экстремума радиусом

l * - * ' l < W -

(4-u 4 )

В противном случае делается рабочий шаг. Очевидно, что рабочий шаг не должен превышать эту зону, так как по­ является опасность при подходе к экстремуму проскочить ее, в результате чего процесс поиска не останавливается. (Под остановкой поиска здесь подразумевается режим

t

Рис. 4.1.6. Пример процесса поиска с алгоритмом парных проб.

нулевых рабочих шагов. Пробные шаги при этом продол­ жают выполняться.) Это накладывает ограничение на вы­ бор величины рабочего шага:

(4.1.15)

для чего необходимо знать величину параметра к объекта. Если это неравенство не выполняется, то возможно, что процесс поиска никогда не остановится, т. е. всегда

Ах Ф 0.

На рис. 4.1.6 показан пример процесса поиска. Здесь зона нечувствительности заштрихована. Хорошо видно, что, попав в эту зону, система остается в ней наверняка на время выдержки Т (хотя и может выходить за ее пре­ делы в процессе пробных шагов).

Теперь рассмотрим' работу этого алгоритма поиска при линейном дрейфе экстремальной характеристики (4.1.12), т. е. при Q = Q (х, t). Пусть спачала дрейфует

только Положение экстремума, т. е.

x*(t) = х*0 + et; Q* = const.

(4.4.16)

Для простоты положим Ô = 0, т. е. зона нечувствитель­ ности выродилась в точку. Тогда приближенное условие остановки алгоритма (Ах = 0) записывается в виде

Q (* -I- g, t) = Q (х — g, t + £п), (4.4.17)

где предполагается, что в течение пробного шага дрейф невелик. Это условие для квадратичной параболы (4.1.12) принимает после преобразований вид

х - я* (t + ta) = - - ÿ - .

(4.1.18)

Это означает, что вместо х* (t -f- tn) поиск стремится при­ вести систему в точку

х (t

tu) = х (t -f- tn)

2 >

(4.1.19)

т. е. имеет место систематическое отставание от действи­ тельного положения экстремума. Для минимизации этого отставания необходимо уменьшать время производства пробных шагов £п. Дрейф положения экстремума х* (t) может вызвать неустойчивость работы системы поиска. Прежде всего, определим понятие неустойчивости поис­ ка, под которой будем подразумевать ситуацию, когда рабочий шаг делается в направлении, обратном требуе­ мому. В этом случае нарушается условие устойчивости

sign [х — х* (t + £п)] =

 

 

 

 

 

= sign

К? +

g, t) Q (х g,

t

+ £п)]. (4.1.20)

Нетрудно показать,

что

неустойчивость

возникает при

et

 

 

ta)

< 0

 

 

С>0,

----------- 5 ^ 0 — Л * ( £ +

Д Л Я

 

 

 

 

 

сК

 

(4.1.21)

 

X — X* (t +

ta) <

 

С<

 

О <

----------- Д Л Я

0 .

На рис. 4.1.7 зона неустойчивости заштрихована, а стрелками показаны направления рабочих шагов. Как видно, зона неустойчивости естественно образуется -в ре­ зультате того, что система стремится не к положению эк­ стремума, а к (4.1.19).

Теперь рассмотрим вертикальный дрейф характерис­ тики

Q* (0 =

+ bt\ х* = const.

(4.1.22)

Из условия (4.1.17) найдем точку, к которой стремится система в процессе поиска:

ы„

%(f + ^п) = х* (t + ^п) Ч—

(4.1.23)

Как видно, положение цели смещается вправо при подъ­ еме характеристики 0) и влево при ее спуске (6 < 0).

______________ ;

 

 

х*ач„)-Ф - x*a*t„)

О)

 

с>0

 

— ÜT-ZT- Y M /Â W /TM J"

 

 

C < 0

ÿ)

Рис. 4.1.7. Зола неустойчивости при дрейфе цели.

Аналогично можно определить зону неустойчивости:

Ы„

0 < я — я* (г -Нп) < - щ - -Для &>0,

(4.1.24)

— x*(t + *п)<0 для Ь < 0 .

Расположение зоны неустойчивости в этом случае показа­ но на рис. 4.1.8 (она заштрихована). Для уменьшения этой зоны необходимо увеличивать величину пробных шагов g или уменьшать время tn.

Смешанный случай линейного

дрейфа

 

х* (t) = x*Q+ et, Q (f)

= Ç* -f- Ы

(4.1.25)

дает следующие результаты: система поиска стремится перевести объект в состояние

Ct„ **n

k (ig + ctn)

i 4 .2 1

смещенное относительно истинного положения экстрему­ ма в этот момент. Любопытно, что в этом случае возможна

________________, '////////////////Л------

b>0

x*lt+t„)

x*lt +tn}+fjf-

 

 

чк9 а)

 

Т

. Ш П ------

х*(Ып)+Ф

x*(t+tn)

О)

/1

Рис. 4.1.8. Зона неустойчивости при вертикальном дрейфе харак­ теристики.

компенсация, т. е. такое соотношение между вертикаль­ ным и горизонтальным дрейфом, когда зона неустойчи­ вости уменьшается или даже стягивается в точку. Для последнего необходимо выполнение условия

— =

ь

2

к (4g -|- (rtjj)

§ 4.2. Поиск с непарными пробами

Рассмотренный выше алгоритм поиска можно упрос­ тить за счет совмещения одной пробы с исходным состоя­ нием х на каждом цикле поиска. Действительно, для ор­ ганизации движения экстремума к цели достаточно заме­

рять состояние системы в точках х и х

g. В этом случае

алгоритм поиска упрощается и записывается в виде

*i+i = хг — aF [Q (х^ + g) — Q (®i)l,

(4.2.1)

где F — как обычно, релейная функция (рис. 4.1.1, б).

Если F = 0, то системавозвращается в состояние

х{, т. е.

из состояния xi -f- g делается обратный шаг Дх =

— g.

В аппаратурном исполнении этот алгоритм удобно реа­ лизовать без специальной подпрограммы пробных шагов, т. е. без возврата в исходное состояние после пробного ша­ га. Одпако при этом величина рабочего шага будет зави­ сеть от его направления. Алгоритм поиска в этом случае

записывается в следующем виде:

a — g при Q (Xi + g) — Q (х*) <

— ô,

g при I Q (Xi -f g) — Q (*i) | <

Ô, (4.2.2)

a g при Q (®c + g) — Q (x^ > ô.

Здесь рабочий шаг Д xt производится не из исходного сос­ тояния х{, а из пробного х* + g. На рис. 4.2.1 показано движение системы при отрицательном (а) и положитель­

 

 

ном (б)

наклоне харак­

 

 

теристики объекта.

Та­

 

 

кой выбор величины ра­

 

 

бочих шагов позволяет

 

 

сделать

среднюю

ско­

 

 

рость изменения управ­

 

 

ляемого

 

параметра

 

 

одинаковой в обоих ' на­

 

 

правлениях.

(Если'бы

 

 

величина рабочего шага

 

 

не зависела от направ­

 

 

ления, т.е. cti=a, то, как

 

 

легко заметить, за один

Рис.

4.2.1. Движение системы в про­

цикл

при

движении

цессе

поиска при а) х < х* и б)

вправо

система смеща­

 

х^>х*.

лась бы на

а -f- g, а

влево — на а g, в ре­ зультате чего оба направления были бы неравноправны.)

На рис. 4.2.2 показана блок-схема программы этого алгоритма. Примененные здесь новые операторы имеют следующий смысл: Оператор «7, Q (•)» является операто­ ром выдержки в течение промежутка времени Т с одно­ временным определением показателя качества в одном из состояний, указанных предыдущими на схеме оператора­ ми: «x -f- а g», «х — и «х — а g». Результат оп­ ределения показателя качества Q (х) закладывается в «память», которая обозначена здесь кружком. Направле­ ние циркуляции запоминаемой и запрашиваемой инфор­ мации показано пунктирными стрелками.

Временные затраты для этого алгоритма поиска скла­ дываются следующим образом:

1. Пробный шаг (он

один)

 

iff —

+ ^пг ~f~

(4.2.3)

Как видно, этот промежуток времени меньше, чем в пре­ дыдущем алгоритме (4.1.8).

2.Процесс принятия решения, так же как и в преды­ дущем алгоритме, практически не связан с временными затратами, т. е. имеет место (4.1.9).

3.Аналогично можно вычислить затраты на выполне­ ние рабочего шага (4.1.11), где, однако, вместо величины а следует брать aif которое за­

висит от направления движе­ ния в соответствии с (4.2.3).

4. Время выдержки Т в данном алгоритме не может быть меньше временных за­ трат на определение показа­ теля качества гП2, т. е.

Т > *П2. (4.2.4)

Рассмотрим работу этого алгоритма при оптимиза­ ции квадратичного объекта (4.1.13). В данном случае из­ менение показателя качества

врезультате проб равно AQ = 2kg (х — х*--- | - ) .

Рис. 4.2.2. Блок-схема алго­ ритма поиска с непарными про­ бами.

(4.2.5)

Зона нечувствительности в районе экстремума, где принимается решение о том, чтобы не делать рабочего шага, определяется следующими неравенствами:

- - г [ ъ +11) < х - х' < М ' Ь ~ * ) - <4-2-6)

Как видно, зона нечувствительности несимметрична от­ носительно экстремума х = х*.

Для того чтобы система поиска всегда останавливалась в районе экстремума, т. е. всегда в процессе движения к экстремуму находилось бы такое состояние х, для которо­ го |AÇ| < Ô, необходимо, чтобы зона нечувствительности (4.2.6) была не меньше величины рабочего шага, т. е.