Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
7
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Рассмотрим теперь более общий случай негармониче­ ского, но периодического возбуждения/(£). В соответствии с известным положением о периодических процессах всякую периодическую функцию можно при определенных несущественных ограничениях разложить в гармониче­ ский ряд вида

/(*) =

2

gi sin mt,

(6.2.10)

 

4=1

 

 

где коэффициенты gt равны

 

 

gi =

2«/со

/ (t) sin Ш dt.

(6.2.11)

^

 

о

 

 

Производя с выражением (6.2.10) те же преобразования, что и для (6.2.5), получаем после осредпения и использо­ вания свойств ортогональности

__________

f l

 

.

-7Г при

1 = 7,

sin m t sin /oof =

j 2

(6.2.12)

 

'0

при

i =/= /

следующее выражение для В:

(6.2.13)

i=l

Этого следовало ожидать, так как В не зависит от частоты модуляции и, следовательно, каждая гармоническая составляющая / (t) дает свой «вклад» в оценку производ­ ной. Так как амплитуда модулирующих колебаний / (t) должна быть ограничена, т. е.

|/(0 к * .

(6-2.14)

интересно решить следующую задачу: найти такое оп­ тимальное возмущение / (t), удовлетворяющее условию (6.2.14), при котором величина В (6.2.13) была бы мак­ симальной, т. е.

2 S? - шах.

4=1

Можно показать, что таким свойством обладают прямо­ угольные колебания

/ (t) = g sign sin юг,

(6.2.16)

которые и являются оптимальными для синхронного детектирования [6.7].

Б. Случайная модуляция. Теперь обратимся к случай­ ной модуляции, когда / (г) является случайной функцией времени с нулевым средним значением и малой дис­ персией

 

т

 

о2 = lim тттЛ /а (0 dt.

(6.2.17)

Т~*оо

«)

 

О

Аналогично случаю гармонического возбуждения по­ лучаем

s « < ? w 7 w + а ? / %

откуда, воспользовавшись (6.2.3) и (6.2.17), имеем

(6.2.18)

ах

т. е. величина В также пропорциональна наклону ха­ рактеристики объекта. Это означает, что для целей оцен­ ки производной dQldx объекта можно воспользоваться случайными возмущениями, которые всегда имеются в реальной аппаратуре. Для этого, однако, нужно уметь их замерять, чтобы реализовать операцию умножения выхода объекта на это возмущение.

Как видно из (6.2.18), полученная оценка не зависит от автокорреляционных свойств случайного процесса

/(г )Это. получилось за счет того, что время осреднения Т

вформуле (6.2.2) было выбрано достаточно большим, что дало возможность воспользоваться выражениями (6.2.3) и (6.2.17). Если время Т брать конечным (а только это соответствует реальной ситуации), то выражение (6.2.18) имеет смысл только при выполнении условия

(6.2.19)

где тк — время корреляции, которое соответствует, на­ пример, десятикратному уменьшению автокорреляцион­ ной функции:

Здесь К (т) — автокорреляционная функция случайного модулирующего воздействия / (t).

Условие (6.2.19) соответствует условию (6.2.9) для гармонического случая. Оно требует либо увеличения времени осреднения Т, либо уменьшения времени корре­ ляции ть функции / (t).

§ 6.3. Экстремальное регулирование с применением синхронного детектирования

Применение синхронного детектирования для целей экстремального регулирования сводится к организации движения к экстремуму при наличии информации о про­ изводной dQJdx. Для этого, как нетрудно убедиться, до­ статочно скорость изменения положения управляемого параметра х сделать пропорциональной наклону харак­ теристики объекта с обратным знаком, т. е.

dx

 

dQ (а;)

 

(6.3.1)

dt

^

dx

 

где р — параметр обратной

связи

(р ]> 0). Блок-схема

устройства, работающего таким способом, показана на рис. 6.3.1.

Здесь блок управления Б У методом синхронного детек­ тирования оценивает производную dQjdx и по каналу обратной связи сообщает ее исполнительному механиз­ му ИМ с весом — р.

Исполнительный механизм в данном случае представ­ ляет собой интегратор, выход которого определяет зна­ чение управляемого параметра

t

x{t) = - p ^ d t .

(6.3.2)

о

 

Рассмотренный в предыдущем параграфе метод син­ хронного детектирования гарантирует выделение произ­

водной dQ/dt за определенный промежуток времени Т. Следовательно, движение к экстремуму с применением этого метода, строго говоря, возможно лишь шаговым образом с периодом не менее Т, так как в течение времени Т управление не определено. Действительно, именно время Т необходимо фильтру для выделения оценки произ­ водной dQ/dx.

Таким образом, управление определено лишь в дис­ кретные моменты времени и процесс поиска сводится к организации рабочего ша­ га так, как это делается в алгоритме градиентного поиска (см. § 5.1). Разница лишь в том, что в данном случае используется безынерционность объекта и наклон характеристики оп­ ределяется путем синхрон­

ного детектирования, а не

Рис. 6.3.1. Блок-схема экстре­

методом парных проб, ис­

мального регулятора с использо­

пользуемых в градиентном

ванием синхронного детектора.

 

поиске. Однако описанный выше градиентный метод не использует информации о не­

прерывности и безынерциониости объекта.

Для того чтобы воспользоваться непрерывностью объекта, выбросим из схемы синхронного детектора (см. рис. 6.2.1) причину указанных неудобств — фильтр Ф, требующий временных затрат на интегрирование. На это есть определенные основания. Действительно, в схеме поиска следом за фильтром идет исполнительный меха­ низм, реализующий операцию интегрирования, которая, как известно, сама по себе хорошо выполняет функции фильтра высоких частот. Например,

t

1

cos

d\ — (sin û)t — 1),

о

 

т. e. амплитуда колебаний после интегрирования умень­ шается в © раз.

Блок-схема экстремального регулятора с синхронным детектором без фильтра показана на рис. 6.3.2. Рас­ смотрим динамику процессов в этой схеме.

Рис.6.3.2. Блок-схема экстремаль­ ного регулятора с синхронным детектором без фильтра.

Уравнение движения этой системы (точнее, параметра х до возбуждения х + / (£)) в процессе поиска записыва­ ется в виде

л

= -!* /(* > ? 1*+/Ю 1.

(6.3.3)

где р. — параметр

обратной связи.

 

Для определенности рассмотрим случай гармоничес­

кого возбуждения

/ (t) = g sin (at. Тогда,

предполагая,

 

как обычно, Q(я) достаточ­

 

но гладкой функцией, по­

 

лучаем для малого значе­

 

ния g

 

dx

— Ц [gsinco* Q{x) +

+ g2sin2© ^ ] . (6.3.4)

Рассмотрим движение x(t) как сумму двух движений: одного медленного осред-

ненного, а другого быстрого колебательного:

х (t) = х' (t) + х" (t).

(6.3.5)

Здесь х' (t) — медленно изменяющаяся составляющая, а х" (t) — колебательная. Из (6.3.4) хорошо видно, что колебательная составляющая имеет две частоты © и 2ю, так как sin2©£ = 1/2(1 — cos 2ю). Тогда из (6.3.5) получаем

х> (*) = -£{ \ x(t)dt.

(6.3.6)

Выше предполагалось, что за период 2л/ю величиной из­ менения Q (х') и dQ/dx можно пренебрегать, т. е. Q (я') является медленно изменяющейся функцией. Исполь­ зуя (6.3.6), получаем из (6.3.4) уравнение медленно изменя­ ющейся составляющей движения

dx'

Ц/>2dQ (х>)

/с о п\

dt —

2 dx'

(D.O./)

Теперь, сопоставляя это выражение и (6.3.1), приходим к выводу, что в среднем поиск ведет себя так, как требуется.

Решим это уравнение. Получаем

)

dQ (х')

2

(6.3.8)

 

*"

dx'

 

 

Для квадратичной

характеристики объекта Q (ж) =

= к (ж — ж*)2 + Ç* имеем после преобразований следую­ щее осредненное поведение:

х ' (t) = ж* -j- (ж0 — X*) е

(6.3.9)

Как видно, при t —*■оо система стремится к цели, т. е.

lim х' (t) = х*.

(6.3.10)

t—♦оо

 

Рассмотрим теперь колебательную составляющую процесса поиска. Для этого, подставляя (6.3.5) в (6.3.4) и учитывая (6.3.7), получаем

[sin (ùt Q (ж') 2g cos 2<ùt -%■j f *j . (6.3.11)

Интегрируя, имеем следующее выражение для колеба­ тельной составляющей:

ж"(t) = ^ [(cos (ùt 1) 0 (xr)- f g sin 2(ùt ^Уг-^J

(6.3.12)

Так, в районе экстремума х* получаем х" (t) = — (cos (ùt

— 1) Q*. Как видно, амплитуда колебательной составляю­ щей обратно пропорциональна частоте модулирующего воздействия и прямо пропорциональна значению пока­ зателя качества. При Q* — 0 колебательная составляю­ щая очень мала, а в экстремуме равна нулю.

Здесь следует отметить, что речь идет о колебательной составляющей параметра х до его возбуждения. Это оз­ начает, что собственно значение управляемого параметра

х (t)

соответствует

входу

оптимизируемого объекта:

x'{t)

+ х" (0 + / (0-

Однако

так как / (t) имеет колеба­

тельный характер, то это окажет влияние только на коле­ бательную составляющую, которая для входа объекта равна ж" (t) -f- f (t).

На рис. 6.3.3 показан пример процесса поиска экстре­

мума.

Пунктиром

изображено

осредненное

поведе­

ние х' (£).

 

 

 

Рассмотрим поведение системы в процессе поиска на

фазовой

плоскости

управляемого

параметра для

случая

Рис. 6.3.3. Поведение оптимизируемого параметра в процессе экстремального регулирования с синхронным детектором.

квадратичной характеристики объекта. На рис. 6.3.4 показана траектория движения системы в процессе поис­ ка методом синхронного детектирования при различных начальных условиях. Здесь пунктиром изображено среднее движение, а эллип­

сом

Рис. 6.3.4. Поведение поиска с синхронным детектором на фазо­ вой плоскости.

Æ-f- / (f) = g*<jDcos (ùt,

x -j- f (t) = x* -f g sin at +

-f H (cos (ùt - 1 ) Ç*(6.3.13)

предельный цикл в районе экстремума х*.

Потери на рысканье

для алгоритма равны 2Я/'й>

R = ^ ^ P ( t) c L t . (6.3.14)

о

Здесь предположено, что величина © достаточно вели­ ка и составляющей х" (г) можно пренебречь по сравне­ нию с / (£).

Получаем для гармонического

возбуждения / (t) =

= g sin (ùt

 

R = 2kg2,

(6.3.15)

T. e. потери на рысканье не зависят от частоты возбуждения.

Таким образом, синхронное детектирование с гармони­ ческим возбуждением как метод поиска экстремума не­ прерывных и, в данном случае, безынерционных систем является вполне надежным и эффективным средством

экстремального

управления.

возбуждения

Рассмотрим

случай

прямоугольного

 

/ (0 =

ё sign sin (ùt.

(6.3.16)

Уравнение движения системы в процессе одного периода удобно записать в форме

J T =

-wQ(x+g) Д л я

0 <

г <

 

 

dt

 

 

 

 

 

 

(6.3.17)

da

 

 

 

я

. .

. 2я

Tt§7 = WQ (x — 8)

для — <Г t

— .

 

Ш^

 

(0

 

Смещение системы за

 

 

 

 

составляет

один период Af = —

Ах = — pg [Q (х + g) — Q {х — g)J ^

,

 

 

 

 

^

Q (» + g) — Q(s ё)

и так как при малом g имеет место d x ~

 

 

2g

получаем Ах ~

— |xg2 ^

At или

dx'

 

о dQ (ж') где

x' (t) — осредневное движение.

Сравнивая это выражение с (6.3.7), полученным для гармонического возбуждения, приходим к выводу, что средняя скорость движения к цели при прямоугольном возбуждении в два раза больше, чем при гармоническом, т. е. прямоугольное возбуждение при прочих равных условиях вдвое эффективнее синусоидального.

На рис. 6.3.5 показана блок-схема экстремального регулятора с синхронным детектором, использующим прямоугольное возбуждение. Здесь генератор Г с частотой со переключает синхронно контакты обоих реле, что и обеспечивает работоспособность поиска в соответствии с (6.3.17).

Как видно, аппаратурно эта схема значительно проще, чем схема с гармоническим возбуждением (см. рис. 6.3.2), где необходимо применение блока произведения.

+9 ~9

Рис. 6.3.5. Блок-схема экстремального регулятора с синхронным детектором и прямоугольным возбуждением.

Этими двумя обстоятельствами и объясняется тот факт, что прямоугольное возбуждение имеет более широкое распространение, чем гармоническое.

§6.4. Биологические системы поиска

Впоследнее время интерес специалистов в области автоматического управления обращен к бионике — науке об использовании принципов работы и самих биологиче­

ских систем в технических целях вообще и в целях управ­ ления в частности. Успехи этой новой и чрезвычайно пер­ спективной науки заставляют исследовать возможности применения живых систем в качестве экстремальных регуляторов или, изучив их алгоритмы поиска, исполь­ зовать эти алгоритмы в технических конструкциях эк­ стремальных регуляторов.

Известно, что животные активно избегают болевого раздражения. В этом проявляется одна из форм их адап­ тации к окружающей среде. Уклонение при болевом раз­ дражении заключается в определенной организации мы­ шечной активности, направленной на уменьшение болевого раздражения. Это свойство животных можно использовать для целей управления экстремальными объектами.

Для этого нужно болевое раздражение животного сделать пропорциональным показателю качества Q (ж),

Рис. 6.4.1. Общая схема решения экстремальной задачи с использова­ нием животного для целей управ­ ления.

а мышечную активность связать с изменением управляе­ мого параметра х. На рис. 6.4.1 это взаимодействие эк­ стремального объекта и животного показано в виде блоксхемы. Здесь преобразователь П1 трансформирует мы­ шечную активность животного, т. е. состояние его мышц, назначение управляемого параметра объекта х. Второй преобразователь П2 связывает значение показателя ка­ чества Q с болевым раз­

дражением животного (например, электриче­ ским током) [6.9].

Рассмотрим одну из возможных схем ис­ пользования животного (например, крысы) в ка­ честве экстремального регулятора.

На рис. 6.4.2 пока­ зана блок-схема такого устройства. Здесь кры­ са К зафиксирована в станке, но так, что она может поворачивать~голову и при этом двигать

рычагом Р, который изменяет положение движка потен­ циометра П. Положение движка и определяет значение управляемого параметра х. Таким образом, крыса, пово­ рачивая голову, может воздействовать на состояние эк­ стремального объекта. Обратная связь в этой схеме обра­ зуется за счет болевого воздействия на крысу переменным током, амплитуда которого пропорциональна показателю качества оптимизируемого объекта [6.9].

Схема работает следующим образом. Крыса, ощущая боль, пропорциональную величине Q, будет поворачивать голову до тех пор, пока это болевое раздражение не станет минимальным. «Убедившись» в том, что всякое отклонение от оптимального состояния х* наказывается болевым воз­ действием, крыса зафиксирует х = х* и тем самым решит задачу по отысканию экстремума. Если объект изменяется и цель х* дрейфует, то крыса будет «отслеживать» положе­ ние цели, т. е. будет решать задачу экстремальпого регу­ лирования, т.е. выполнять роль экстремального регулятора.