Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
7
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

ГЛАВАМ

ЗА ДА Ч И И ОБЪЕКТЫ ЭКСТРЕМАЛЬНОГО УПРАВЛЕНИЯ

§ 2.1. Классификация задач экстремального управления

Формулировка задачи экстремального управления как задачи достижения экстремальных целей излишне обоб­ щена и нуждается в конкретизации. Эта конкретизация связана, прежде всего, с особенностями объекта и дости­ гаемых целей.

Рассмотрим каждый из указанных аспектов в отдель­

ности.

зрения особенностей

объекта задачу

экст­

С точки

ремального

управления

обычно

подразделяют на

две

— задачу оптимизации

и задачу

экстремального

регу­

лирования.

 

 

 

 

1.Задача оптимизации, т. е. задача однократног

достижения экстремальной цели. Эта задача возникает в том случае, когда объект управления и среда, в которой он функционирует, не меняют своих свойств. Примерами задач такого рода являются задачи математического

программирования, т. е.

задачи линейного [2.1—2.6],

геометрического [2.14],

нелинейного [2.7—2.8] и сто­

хастического [2.9—2.10]

программирования. Отличитель­

ным свойством этих задач является наличие полной ин­ формации об объекте. Эта информация рафинирована в форме функций, выражающих цели управления (одни функции должны быть экстремизированы, а значения других приведены в заданную область).

Другим классом задач экстремального управления при фиксированных свойствах объекта являются задачи

планирования экстремальных экспериментов. Здесь спе­ цифичным является почти полное отсутствие априорной информации об объекте. Вся необходимая для управления информация запрашивается и получается в процессе решения задачи. При этом обычно предполагается, что объект остается неизменным.

2. Если объект управления эволюционирует, т. е. его свойства изменяются во времени, то однократная опти­ мизация не может решить задачи экстремального управ­ ления. Необходимо еще организовать процесс слежения за экстремальной целью, которая в этом случае изменяет свое положение. Такого рода объекты нуждаются в пос­ тоянной «опеке», и процессы экстремального управления,

решающие эту

задачу,

обычно

называют процессами

экстремального

регулирования.

Они и образуют другую

задачу экстремального

управления.

Задача слежения как задача экстремального управле­ ния несколько отличается от задачи оптимизации. Ал­ горитмы ее решения имеют целью поддержание объекта в экстремальном состоянии, независимо от возмущающих факторов, воздействующих на объект и изменяющих его состояние.

В зависимости от скорости эволюции объекта (скорости его дрейфа) процесс слежения может производиться спе­ циализированным автоматом (при большой скорости) или без него. В первом случае автомат, производящий про­ цедуру отслеживания, называют экстремальтлм регуля­ тором. Если скорость дрейфа мала, то применение экс­ тремального регулятора нецелесообразно и отслеживание экстремальной цели может производиться с использова­ нием методов эволюционного планирования, которые состав­ ляют ветвь планирования экстремальных экспериментов.

§ 2.2. Классификация объектов экстремального управления. Примеры

Прежде всего следует отметить, что понятие «объект экстремального управления», или проще «экстремальный объект», является производным задачи и цели. Это озна­ чает, что один и тот же объект может быть как экстремаль­ ным, так и неэкстремальным, в зависимости от целей управления, которые ставятся. Например, нагреватель­ ная печь может быть объектом регулирования по откло­ нению, если ставится задача о поддержании ее темпера­ туры на заданном уровне или выполнении определенной программы нагрева деталей. Но та же печь может выступать в качестве экстремального объекта, если цель управления экстремальна (например, поддерживать

максимальную температуру пели, независимо от воз­ действия внешних и внутренних факторов). Таким обра­ зом, экстремальные задачи порождают экстремальные объекты, классификация которых рассмотрена ниже.

X,

Q(V)

 

 

а)

Ф

6)

Рис. 2.2.1. Схематическое

изображение

экстремального объекта,

а) Однопараметрический объект, б) скалярное представление мно­ гопараметрического объекта, в) векторное представление объекта.

Объекты экстремального управления можцо класси­ фицировать по разным признакам. Среди этих признаков

целесообразно выделить следующие:

объекта.

1.

Число

оптимизируемых параметров

2.

Число

экстремумов характеристики

объекта.

3.Непрерывность или дискретность объекта.

4.Инерционность объекта.

5.Объем априорной информации об объекте. Рассмотрим каждый из признаков отдельно и проиллю­

стрируем их примерами.

1. По числу выделенных управляемых параметро различают одно- (п = 1) и многопараметрические (п ^>1) объекты. На рис. 2.2.1 показано схематическое представ­ ление таких объектов.

Примером однопараметрического (п = 1) экстремаль­ ного объекта может служить обычная нагревательная печь; температура факела в такой печи зависит от со­ отношения весовых частей воздуха и топлива, подаваемых

в единицу времени:

р

 

 

 

 

 

х

^ВОЗД

f

(2.2.1)

с

 

^топл

 

 

где <?возд [кг/сек] — весовой’ расход воздуха, а Стопл [кг/сек] — весовой расход топлива в единицу времени.

Температура факела для определенного типа топлива и при фиксированных условиях (т. е. температура и влаж­ ность подаваемого воздуха предполагаются постоянными)

зависит от величины х экстремальным образом. Эта зависимость показана иа рис. 2.2.2. Ее экстремальность образуется за счет следующих факторов. Если х мало, то воздуха недостаточно и не все топливо сгорает, что приводит к большим потерям и естественному снижению, температуры факела t°. При большом значении параметра х топливо сгорает полностью и выделяется максимальное количество тепла, но избыток воздуха охлаждает факел. Поэтому соотношение воздуха и топлива х должно быть оптимальным и равным х* (см. рис. 2.2.2). Зная состав

-U

х* х

Рис. 2.2.2. Зависимость температуры факела от соотношения рас­ ходов воздуха и топлива.

топлива и условия эксплуатации печи, можно однократно определить ж* и построить систему стабилизации пара­ метра х на уровне х*. Однако для этого нужно соблюдать все условия, для которых определено оптимальное зна­ чение х*, т. е. топливо должно быть однородным во вре­ мени и постоянным по составу, температура воздуха и его влажность должны находиться иа заданном уровне и т. д. Это означает, что стабилизация оптимального состояния х* влечет за собой стабилизацию условий, для которых было определено х*. А это далеко не всегда просто осущест­ вить. Чаще всего в реальной обстановке состав, свойства и условия функционирования объекта довольно быстро изменяются и не поддаются (или почти не поддаются) стабилизации. Именно в таких обстоятельствах целесо­ образно применять экстремальное управление.

Управляемым параметром в данном случае целесооб­ разно выбрать или расход воздуха £ Возд или расход топ­ лива Стопл) которые, как показано, экстремальным обра­ зом связаны с температурой факела. Зависимость темпера-

туры факела от расхода воздуха для различных условий (изменение температуры и химического состава топлива, влажности и подачи воздуха и т. д.) имеет различный вид. Поэтому оптимальное значение этого расхода из­ меняется с изменением условий (рис. 2.2.3). В связи с этим для эффективного управления печью целесообразно вос­ пользоваться экстремальным регулятором, который уп­ равлял бы расходом и тем самым поддерживал бы печь в

Рис. 2.2.3. Изменение экстремальной характеристики печи при изменении условий ее эксплуатации.

экстремальном состоянии (т. е. г0-»-max), независимо от изменения условий ее эксплуатации, смещающих экстре­ мальную характеристику = / (£?В0зд)-

Теперь рассмотрим пример мпогопараметрического объ­ екта. Таким объектом может служить автоматическая система совмещения изображений. Задача ставится сле­ дующим образом.

Пусть имеются два фотоизображения на пленке. Их нужно сопоставить и определить, не совпадают ли они, т. е. не являются ли они одинаковыми фотоснимками с од­ ного и того же объекта. Эта задача решается простым сов­ мещением обоих изображений. Если они совпадут, то изо­ бражения считаются идентичными. В случае несовпаде­ ния — изображения разные. Эта простая операция легко решается человеком. Использование человека для этих целей удобно прн малом количестве сопоставляемых изоб­ ражений. Если же нужно «просмотреть» десятки тысяч

снимков, как это бывает, например, при анализе данных авиафоторазведки, то человек становится «узким звеном» и необходимо создать автомат, который выполнил бы эту работу надежно и в приемлемо короткое время. Та­ ким автоматом является автоматическая система совме­ щения изображений. Объектом этой автоматики является процесс совмещения фотоизображений, который сводится

к

следующему.

 

 

 

 

 

 

 

Известно, что световой поток через совмещаемые

изображения имеет экстремальный характер, причем

максимум

потока

достигается

 

при совмещении

изображений.

 

В

данном

случае

положение

 

изображения определяется дву­

 

мя

линейными

(декартовыми)

 

координатами

хх = х,

х2 =

у

 

и

углом

поворота

х3 =

 

(рис. 2.2.4). Следовательно, све­

 

товой поток через совмещаемые

 

изображения,

измеряемый фо­

 

тоэлементом,

зависит от

трех

 

управляемых

параметров

хх,

 

х2, х3. Задача совмещения за­

 

ключается

в

отыскании

таких

Рис. 2.2.4. К задаче совме­

'значений

 

этих

 

параметров

Х^

 

 

*

 

 

*

 

 

щения изображений.

Я/ j , Х2 Х2 , Х 3 Х3 ,

п р и

 

 

которых ток фотоэлемента мак­

выполнить трехканаль­

симален.

Эту

функцию

может

ный оптимизатор, который, воздействуя на управляемые

параметры

 

х2, х31 максимизирует ток фотоэлемента.

Как видно, система совмещения изображений является

примером многопараметрической

(в данном случае трех­

параметрической)

экстремальной

системы.

 

2.

В зависимости от количества экстремумов объекты

классифицируются на одноэкстремалъные и многоэкстре­ мальные, причем в последнем случае задача управления заключается в отыскании глобального экстремума, т. е. минимального минимума или максимального максимума. Примером одноэкстремального объекта может служить рассмотренная выше факельная печь, так как в фиксиро­ ванных условиях существует только одно оптимальное соотношение расходов воздуха и топлива.

В качестве другого примера одноэкстремальиого объек­ та рассмотрим систему управления тягой жидкостного реактивного двигателя (ЖРД). Тяга F такого двигателя, помимо прочих факторов, экстремальным образом зави­ сит от весового соотношения q окислителя и горючего. При этом положение экстремума q* зависит от большого
числа внешних и внут­ ренних условий, в которых работает ЖРД (напри­ мер, температура горюче­ го и окислителя, давле­ ние и температура внеш­ ней среды и т. д.). Непо­ средственный замер тяги затруднен из конструктив­ ных соображений. Поэто­ му целесообразно измерять ускорение аппарата, на котором установлен рас­ сматриваемый ЖРД. Это ускорение w, замеряемое
акселерометром, при вер­
Рис. 2.2.5. Изменение экстремаль­ тикальном взлете связано
ной характеристики ускорения
ракеты с изменением ее массы с тягой F следующим об­ в различные моменты времени разом:
О< h < h <
где т — масса ракеты, Р — ее аэродинамическое сопро­ тивление.
Как видно из этой формулы, ускорение со временем, вообще говоря, увеличивается, так как топливо выгорает и масса т = m ( t ) уменьшается, а сопротивление Р ра­ стет не слишком быстро. При этом экстремальная харак­ теристика объекта изменяется так, как показано на рис. 2.2.5, где т0 = т (0) > тх = т (^) }> т2 = т (t2) >
т3 = т (t3) — различные массы, для которых построе­ ны характеристики. Эти характеристики имеют ярко вы­ раженный одноэкстремальпый характер.
В качестве примера задачи со многими экстремумами может служить задача отыскания самой «громкой» радио­ станции в диапазоне при настройке радиоприемника В заданном частотном диапазоне обычно име

ется много станций и каждая дает свой пик на амплитуд­ но-частотной характеристике радиосигнала (рис. 2.2.6), но лишь один максимум этой кривой имеет наибольшее значение. (Здесь А — амплитуда, / — частота сигнала.) Этот глобальный максимум характеристики достигается в точке /* и в зависимости от времени суток и условий

Рис. 2.2.6. Амплитудно-частотная характеристика радиосигналов в диапазоне.

погоды может смещаться на другие станции. Поэтому задача отыскания станции с наилучшим звучанием явля­ ется многоэкстремальной задачей на отыскание глобаль­ ного максимума, а радиоприемник, при помощи ко­ торого эта задача решается,— многоэкстремальным объектом. Примеры других многоэкстремальных объек­ тов будут рассмотрены позже, во втором разделе книги (см. § 20.2).

3. По характеру изменения показателя качества Q экстремальные объекты обычно классифицируют на не­ прерывные и дискретные. Под непрерывным экстремальным объектом будем подразумевать такой объект, выход кото­ рого изменяется непрерывно и сразу (немедленно) с изме­ нением управляемых параметров (см. кривую 2 на рис. 2.2.7). Если же значение показателя качества изме­ няется скачком спустя некоторое определенное время после изменения входных параметров, то такой объект будем называть дискретным (кривая 2). Если же скачок на выходе происходит одновременно со скачком на входе,

Рис. 2.2.8. .RC-контур как объект экстремального управ­ ления.

то объект естественно считать непрерывным. (Часто под дискретностью понимается дискретность по уровням, когда выход объекта может принимать определенное число дискретных уровней.

В данном случае рассматри­ вается дискретность по вре­ мени.)

 

 

 

Примером

непрерывного

 

 

 

объекта может служить коле­

 

 

 

бательный LC-контур, пока­

 

 

 

занный на рис. 2.2.8. В ка­

 

 

 

честве

управляемого

пара­

 

 

 

метра

выберем

емкость C(t),

 

 

 

которую будем изменять скач­

Рис. 2.2.7. К определению не­

ком (например,

путем

под-

прерывного (2) и дискретного

1{лючения или

отключения

(7)

объектов,

х (t) — вход,

небольшой параллельной ем­

Q (t)

— выход

экстремального

кости). При этом в контуре

 

объекта.

будет протекать

переходный

 

 

 

процесс, характер которого зависит от того, ближе или дальше новая собственная частота контура от частоты возбуждения и (t) (рис. 2.2.9). Однако в любом случае (1 или 2) изменение ампли­ туды А будет непрерывным и немедленным после скачка емкости (с точностью до пе­ риода, разумеется). Такой экстремальный объект естест­ венно считать непрерывным.

В качестве дискретного

объекта экстремального уп­ равления рассмотрим систему бесконтактного корреляцион­ ного измерения скорости дви­ жения тел. Этот метод возник

в связи с необходимостью определения скорости движения горячего проката, когда контактные методы измерения скорости неприменимы. Сущность этого метода состоит в следующем [2.12]. На поверхность листа металла, дви­ жущегося со скоростью V, при помощи двух лампочек Л г и Л г через оптические системы проецируются два рез­ ких световых штриха. Штрихи расположены на известном

и фиксированном расстоянии I друг от друга (рис. 2.2.10). Вследствие различных структурных неоднородностей по­ верхности металла, наличия трещин, пятен и окалины

Рис. 2.2.9. Переходный процесс в контуре при скачкообразом из­ менении параметра. 1 — при приближении к резонансу, 2 — при удалении от резонанса.

яркость штрихов изменяется. Изображения штрихов вос­ принимаются фотоэлементами Фг и ф2, с которых снима­ ются сигналы fi (t) и /2 (t), пропорциональные яркости

ф -

Ü

4 l >

 

Э

А(EH

 

 

 

Г

 

Аг

 

 

 

,,

Ç (t)

,

&(t)

!

 

r — i - >

t

- ;x - ж г Л -

1

1_

Экстремальный

оЁввкт

_|

Рис. 2.2.10. Блок-схема системы бесконтактного измерения скоро­ сти движения полосы.

каждого из отраженных штрихов. Сигнал от первого фото­ элемента fi (t) поступает на блок транспортного запазды­ вания т, который задерживает этот сигнал на величину т, и на его выходе получается величина Д (t — т). Это зна­ чение, как показано на рисунке, умножается на /2 (J),