книги / Системы экстремального управления
..pdfопределение показателя качества в точках х |
|
g. «ДQ» — |
|||||||||
оператор вычисления приращения |
|
показателя |
качества |
||||||||
AQ = Q (х + g) — Q (х — g). |
|
|
|
(4.1.5) |
|||||||
Операторами <(х+ |
я» определяется |
|
изменение |
|
управляе |
||||||
мого параметра на |
величину а в ту |
|
или |
иную |
сторону. |
||||||
|
|
Переход |
к этим |
операторам |
|||||||
|
|
условный |
и зависит от вели |
||||||||
|
|
чины AÇ. Условия соответст |
|||||||||
|
|
вующих переходов обозначе |
|||||||||
|
|
ны рядом со стрелками в виде |
|||||||||
|
|
неравенств. |
Оператором |
«21» |
|||||||
|
|
обозначена выдержка системы |
|||||||||
|
|
в течение времени Т в зафик |
|||||||||
|
|
сированном состоянии. |
|
||||||||
|
|
Кружком на схеме обозна |
|||||||||
|
|
чен |
блок |
запоминания «па |
|||||||
|
|
мять |
Q», |
необходимый |
для |
||||||
|
|
функционирования |
алгорит |
||||||||
|
|
ма. В блок запоминания за |
|||||||||
|
|
носится |
значение |
Q (х + |
g), |
||||||
|
|
которое |
после |
запоминания |
|||||||
|
|
сразу |
поступает |
на выход |
|||||||
|
|
этого |
|
блока. |
Направление |
||||||
Рис. 4.1.2. Блок-схема алго |
движения |
запоминаемой |
и |
||||||||
воспроизводимой |
|
информа |
|||||||||
ритма поиска с парными про |
|
||||||||||
бами. |
|
ции показано на схеме пунк |
тирной стрелкой.
На рис. 4.1.3 показана блок-схема устройства реали зующего процесс экстремального управления объектом по описанному методу. Здесь пунктиром обозначен эксттремальный регулятор. Логический блок, координирую щий работу регулятора, реализует алгоритм поиска, по казанный на рис. 4.1.2. Блок памяти П необходим для запоминания предыдущего значения показателя качества, а исполнительный механизм ИМ изменяет значение уп равляемого параметра х объекта. Логический блок обра зует пробные шаги + g и, наблюдая по каналу обратной связи за двумя значениями показателя качества Qt и Qi-х, организует в соответствии с алгоритмом поиска уп равление исполнительным механизмом, который в свою
очередь изменяет управляемый параметр х в сторону оп тимального значения х*.
Как видно, в алгоритме поиска четко определены сле дующие этапы поиска: 1) пробные шаги, 2) принятие реше ния, 3) рабочий шаг, 4) выдержка.
Каждый из этих этапов играет определенную роль в процессе экстремального управления. При этом затраты времени на один цикл поиска складываются соответственно
следующим образом: |
|
|
Обьет |
||||
£ц = |
|
“Ь |
£реш “h |
£раб |
+ in, |
|
|
где |
— время одного цикла |
|
|
||||
поиска, |
tn — время, необхо |
|
|
||||
димое |
для |
этапа |
пробных |
|
|
||
шагов, |
|
£реш — время, |
необ |
|
|
||
ходимое |
для принятия реше |
|
|
||||
ния, ipac — временные |
затра |
|
|
||||
ты на производство рабочего |
|
|
|||||
шага,L C L |
I£Qв ------— ПвремяС Ш Л . |
ПвыдержкиШ Д С Ш П И . |
|
овг^'^ппр_---- ) |
|||
Рассмотрим подробнее на- |
|
||||||
значение, особенности и вре- |
рис |
4.1.3. Блок-схема системы |
|||||
менные |
затраты |
каждого |
экстремального управления, |
||||
этапа. |
|
На этапе пробных шагов |
система поиска получает |
||||
1) |
|
информацию, необходимую для определения положения экстремума. Изменение положения управляемого пара метра х на величину пробного шага g в оба направления осуществляется с помощью подпрограммы пробных шагов. На рис. 4.1.4 для примера показаны две схемы введения пробных шагов для случаев, когда управляемым парамет ром являются сопротивление и емкость. Здесь среднее положение переключателя определяет собственное зна чение управляемого параметра, которое состоит из двух частей:
R = R 0 + ДД, |
С = С0 + ДС, |
(4.1.7) |
где R о и Со — изменяемая |
составляющая |
параметра, а |
ДR и ДС — const — величины пробных изменений пара метра. Как видно, при переключении из одного крайнего положения в другое значение параметра изменится на 2ДR и 2ДС', что и требуется.
На этом этапе временные затраты будут складывать ся следующим образом:
— 2 (ini ~b ^пг) “Ь ^пз» |
(*4.1.8) |
где in — время, затрачиваемое на выполнение этапа проб ных шагов; inl — время, необходимое для изменения зна чения параметра на величину Лж (для случаев, рассмот ренных на рис. 4.1.4, ini равно времени переключения); tm — время определения показателя качества в новом состоянии. Так, для динамических объектов это время со ответствует времени затухания переходных процессов и т. Д-i *пз — время запоминания показателя качества в блоке памяти П.
2)Этап принятия решения сводится к определению àQ и
выяснению направления |
рабочего |
шага |
при |
|
|Д (?|> 0 , |
||
|
|
|
т. е. |
к выяснению знака |
|||
|
|
|
разности (4.1.5). |
В случае |
|||
|
|
|
|Л<?| < б принимается ре |
||||
|
|
|
шение о невыполнении ра |
||||
|
|
|
бочего шага (АХ = 0). Оче |
||||
|
|
|
видно, что этот этап имеет |
||||
|
|
|
чисто информационный ха |
||||
|
|
|
рактер и при |
отсутствии |
|||
|
|
|
помех практически не име |
||||
|
|
|
ет временных затрат, т. е. |
||||
|
|
|
|
ipeux ~ |
0 . |
( 4 .1 . 9 ) |
|
Рис. 4.1.4. Два примера органи |
3) |
решении |
его выпол |
||||
зации пробпых шагов при реали |
(при |
||||||
зации |
управляемого параметра: |
нять) заключается в пере |
|||||
а) на |
сопротивлении, б) |
на |
ведении объекта |
в новое |
|||
|
емкости. |
|
|||||
|
|
|
состояние, |
отстоящее от |
предыдущего на величину рабочего шага а. Временные затраты ipa6 при этом целиком определяются динамиче скими свойствами исполнительного механизма. Если же рабочий шаг не выполняется, то ipa6 = 0.
Рассмотрим простейший случай, когда исполнитель ный механизм является интегратором. Тогда при наличии естественных ограничений на ускорение управляемого параметра
можно построить такую программу изменения парамет ра ху при которой время изменения этого параметра на величину рабочего шага было бы минимальным. Как лег ко заметить, в этом случае оптимальное управление обес печивается следующей программой: первые полпути — разгон с максимальным ускорением (х = -}- г), а осталь ные — торможение с максимальным замедлением (а: = —г).
В результате получаем следующее выражение для ми нимального времени, необходимого для выполнения ра бочего шага величиной а:
|
|
|
С |
= 2 j / | . |
|
(4.1.11) |
|
При этом скорость £ и ускорение х изменяются так, как |
|||||||
показано на рис. 4.1.5. |
|
|
|
||||
4) |
Выдержка является этапом, необходимым в процессе |
||||||
отслеживания цели, когда положение экстремума изме |
|||||||
няется |
незначительно. |
В этом |
|
|
|||
случае, |
очевидно, |
нецелесооб |
|
|
|||
разно |
«тревожить» |
объект ча |
|
|
|||
стыми |
пробными |
и |
рабочими |
|
|
||
шагами, для чего и вводится |
|
|
|||||
этап выдержки, во |
время кото |
|
|
||||
рого экстремальное управление |
|
|
|||||
не функционирует. |
оптимальное |
Рис. 4.1.5. |
Поведение |
||||
Очевидно, |
что |
скорости и ускорения при |
|||||
время выдержки Т зависит от |
оптимальном |
управлении |
|||||
интенсивности «уплываиия» эк |
параметром х при осуществ |
||||||
стремума и |
тем |
больше, чем |
лении рабочего шага. |
меньше скорость этого уплывания. Однако в процессе движения к экстремуму^этап вы
держки вводить нецелесообразно и при этом следует по ложить Т = 0.
Рассмотрим работу алгоритма поиска на квадратичном
объекте: |
(4.1.12) |
Q(x) = к { х - х * У + Q*. |
Для простоты положим х* = const и Q* = const. Тогда для приращения AÇ в процессе пробных шагов получаем после преобразований
AQ — 4tkg (х — х*). |
(4.1.13) |
дится при |A Ç |< ô , т. 0. в зоне экстремума радиусом
l * - * ' l < W - |
(4-u 4 ) |
В противном случае делается рабочий шаг. Очевидно, что рабочий шаг не должен превышать эту зону, так как по является опасность при подходе к экстремуму проскочить ее, в результате чего процесс поиска не останавливается. (Под остановкой поиска здесь подразумевается режим
t
Рис. 4.1.6. Пример процесса поиска с алгоритмом парных проб.
нулевых рабочих шагов. Пробные шаги при этом продол жают выполняться.) Это накладывает ограничение на вы бор величины рабочего шага:
(4.1.15)
для чего необходимо знать величину параметра к объекта. Если это неравенство не выполняется, то возможно, что процесс поиска никогда не остановится, т. е. всегда
Ах Ф 0.
На рис. 4.1.6 показан пример процесса поиска. Здесь зона нечувствительности заштрихована. Хорошо видно, что, попав в эту зону, система остается в ней наверняка на время выдержки Т (хотя и может выходить за ее пре делы в процессе пробных шагов).
Теперь рассмотрим' работу этого алгоритма поиска при линейном дрейфе экстремальной характеристики (4.1.12), т. е. при Q = Q (х, t). Пусть спачала дрейфует
только Положение экстремума, т. е.
x*(t) = х*0 + et; Q* = const. |
(4.4.16) |
Для простоты положим Ô = 0, т. е. зона нечувствитель ности выродилась в точку. Тогда приближенное условие остановки алгоритма (Ах = 0) записывается в виде
Q (* -I- g, t) = Q (х — g, t + £п), (4.4.17)
где предполагается, что в течение пробного шага дрейф невелик. Это условие для квадратичной параболы (4.1.12) принимает после преобразований вид
х - я* (t + ta) = - - ÿ - . |
(4.1.18) |
Это означает, что вместо х* (t -f- tn) поиск стремится при вести систему в точку
х (t |
tu) = х (t -f- tn) |
2 > |
(4.1.19) |
т. е. имеет место систематическое отставание от действи тельного положения экстремума. Для минимизации этого отставания необходимо уменьшать время производства пробных шагов £п. Дрейф положения экстремума х* (t) может вызвать неустойчивость работы системы поиска. Прежде всего, определим понятие неустойчивости поис ка, под которой будем подразумевать ситуацию, когда рабочий шаг делается в направлении, обратном требуе мому. В этом случае нарушается условие устойчивости
sign [х — х* (t + £п)] = |
|
|
|
|
|
||
= sign |
К? (х + |
g, t) — Q (х — g, |
t |
+ £п)]. (4.1.20) |
|||
Нетрудно показать, |
что |
неустойчивость |
возникает при |
||||
et |
|
|
ta) |
< 0 |
|
|
С>0, |
----------- 5 ^ 0 — Л * ( £ + |
Д Л Я |
||||||
|
|
|
|
|
сК |
|
(4.1.21) |
|
X — X* (t + |
ta) < |
|
С< |
|
||
О < |
----------- Д Л Я |
0 . |
На рис. 4.1.7 зона неустойчивости заштрихована, а стрелками показаны направления рабочих шагов. Как видно, зона неустойчивости естественно образуется -в ре зультате того, что система стремится не к положению эк стремума, а к (4.1.19).
Теперь рассмотрим вертикальный дрейф характерис тики
Q* (0 = |
+ bt\ х* = const. |
(4.1.22) |
Из условия (4.1.17) найдем точку, к которой стремится система в процессе поиска:
ы„
%(f + ^п) = х* (t + ^п) Ч— |
• |
(4.1.23) |
Как видно, положение цели смещается вправо при подъ еме характеристики (Ь 0) и влево при ее спуске (6 < 0).
— |
______________ ; |
|
|
х*ач„)-Ф - x*a*t„) |
О) |
|
с>0 |
|
— ÜT-ZT- Y M /Â W /TM J" |
|
|
|
C < 0 |
ÿ) |
Рис. 4.1.7. Зола неустойчивости при дрейфе цели.
Аналогично можно определить зону неустойчивости:
Ы„
0 < я — я* (г -Нп) < - щ - -Для &>0,
(4.1.24)
— x*(t + *п)<0 для Ь < 0 .
Расположение зоны неустойчивости в этом случае показа но на рис. 4.1.8 (она заштрихована). Для уменьшения этой зоны необходимо увеличивать величину пробных шагов g или уменьшать время tn.
Смешанный случай линейного |
дрейфа |
|
х* (t) = x*Q+ et, Q (f) |
= Ç* -f- Ы |
(4.1.25) |
дает следующие результаты: система поиска стремится перевести объект в состояние
Ct„ **n
k (ig + ctn)
i 4 .2 1
смещенное относительно истинного положения экстрему ма в этот момент. Любопытно, что в этом случае возможна
________________, '////////////////Л------
b>0 |
x*lt+t„) |
x*lt +tn}+fjf- |
|
|
чк9 а) |
|
Т |
. Ш П ------ |
х*(Ып)+Ф |
x*(t+tn) |
О) |
/1 |
<О |
Рис. 4.1.8. Зона неустойчивости при вертикальном дрейфе харак теристики.
компенсация, т. е. такое соотношение между вертикаль ным и горизонтальным дрейфом, когда зона неустойчи вости уменьшается или даже стягивается в точку. Для последнего необходимо выполнение условия
— = |
ь |
2 |
к (4g -|- (rtjj) |
§ 4.2. Поиск с непарными пробами
Рассмотренный выше алгоритм поиска можно упрос тить за счет совмещения одной пробы с исходным состоя нием х на каждом цикле поиска. Действительно, для ор ганизации движения экстремума к цели достаточно заме
рять состояние системы в точках х и х |
g. В этом случае |
|
алгоритм поиска упрощается и записывается в виде |
||
*i+i = хг — aF [Q (х^ + g) — Q (®i)l, |
(4.2.1) |
|
где F — как обычно, релейная функция (рис. 4.1.1, б). |
||
Если F = 0, то системавозвращается в состояние |
х{, т. е. |
|
из состояния xi -f- g делается обратный шаг Дх = |
— g. |
В аппаратурном исполнении этот алгоритм удобно реа лизовать без специальной подпрограммы пробных шагов, т. е. без возврата в исходное состояние после пробного ша га. Одпако при этом величина рабочего шага будет зави сеть от его направления. Алгоритм поиска в этом случае
записывается в следующем виде:
a — g при Q (Xi + g) — Q (х*) < |
— ô, |
— g при I Q (Xi -f g) — Q (*i) | < |
Ô, (4.2.2) |
— a — g при Q (®c + g) — Q (x^ > ô. |
Здесь рабочий шаг Д xt производится не из исходного сос тояния х{, а из пробного х* + g. На рис. 4.2.1 показано движение системы при отрицательном (а) и положитель
|
|
ном (б) |
наклоне харак |
||
|
|
теристики объекта. |
Та |
||
|
|
кой выбор величины ра |
|||
|
|
бочих шагов позволяет |
|||
|
|
сделать |
среднюю |
ско |
|
|
|
рость изменения управ |
|||
|
|
ляемого |
|
параметра |
|
|
|
одинаковой в обоих ' на |
|||
|
|
правлениях. |
(Если'бы |
||
|
|
величина рабочего шага |
|||
|
|
не зависела от направ |
|||
|
|
ления, т.е. cti=a, то, как |
|||
|
|
легко заметить, за один |
|||
Рис. |
4.2.1. Движение системы в про |
цикл |
при |
движении |
|
цессе |
поиска при а) х < х* и б) |
вправо |
система смеща |
||
|
х^>х*. |
лась бы на |
а -f- g, а |
влево — на а — g, в ре зультате чего оба направления были бы неравноправны.)
На рис. 4.2.2 показана блок-схема программы этого алгоритма. Примененные здесь новые операторы имеют следующий смысл: Оператор «7, Q (•)» является операто ром выдержки в течение промежутка времени Т с одно временным определением показателя качества в одном из состояний, указанных предыдущими на схеме оператора ми: «x -f- а — g», «х — g» и «х — а — g». Результат оп ределения показателя качества Q (х) закладывается в «память», которая обозначена здесь кружком. Направле ние циркуляции запоминаемой и запрашиваемой инфор мации показано пунктирными стрелками.
Временные затраты для этого алгоритма поиска скла дываются следующим образом:
1. Пробный шаг (он |
один) |
|
iff — |
+ ^пг ~f~ |
(4.2.3) |
Как видно, этот промежуток времени меньше, чем в пре дыдущем алгоритме (4.1.8).
2.Процесс принятия решения, так же как и в преды дущем алгоритме, практически не связан с временными затратами, т. е. имеет место (4.1.9).
3.Аналогично можно вычислить затраты на выполне ние рабочего шага (4.1.11), где, однако, вместо величины а следует брать aif которое за
висит от направления движе ния в соответствии с (4.2.3).
4. Время выдержки Т в данном алгоритме не может быть меньше временных за трат на определение показа теля качества гП2, т. е.
Т > *П2. (4.2.4)
Рассмотрим работу этого алгоритма при оптимиза ции квадратичного объекта (4.1.13). В данном случае из менение показателя качества
врезультате проб равно AQ = 2kg (х — х*--- | - ) .
Рис. 4.2.2. Блок-схема алго ритма поиска с непарными про бами.
(4.2.5)
Зона нечувствительности в районе экстремума, где принимается решение о том, чтобы не делать рабочего шага, определяется следующими неравенствами:
- - г [ ъ +11) < х - х' < М ' Ь ~ * ) - <4-2-6)
Как видно, зона нечувствительности несимметрична от носительно экстремума х = х*.
Для того чтобы система поиска всегда останавливалась в районе экстремума, т. е. всегда в процессе движения к экстремуму находилось бы такое состояние х, для которо го |AÇ| < Ô, необходимо, чтобы зона нечувствительности (4.2.6) была не меньше величины рабочего шага, т. е.