Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
9
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

с изменением функции качества, изменяется лишь опти­ мальное состояние, запоминаемое системой поиска. Это значительно облегчает реализацию алгоритма в аппаратуре или в программе.

Другой особенностью сканирования является циклич­ ность процедуры поиска — поиск производится периоди­ чески, после каждого цикла поиска система фиксируется и некоторое время пребывает в глобально-экстремальном состоянии, после чего снова совершается цикл сканиро­ вания с целью проверки, не изменил ли положение гло­ бальный экстремум. Недостатком сканирования является его огромная трудоемкость, которая выражается в боль­ ших временных затратах. Поэтому все модификации этого метода направлены на устранение «тупого» перебора пу­ тем использования априорной информации.

Б. Модификации сканирования. Всякая модификация сканирования связана с необходимостью знать нечто боль­ ше об объекте, чем его многоэкстремальность. Так, весьма полезными являются априорные сведения о величине зоны притяжения глобального экстремума S* (эти зоны показаны стрелками на рис. 10.1.1 и 10.1.3). Часто помо­ гает знание максимально возможного наклона экстре­ мальной характеристики. И так далее.

Рассмотрим несколько естественных модификаций ска­

нирования.

априорная плотность

1)

Предположим, что известна

распределения глобального экстремума р (х) в зоне поиска

а ^ . х ^ . Ь . Очевидно, что при организации

процесса

сканирования следует учесть эти априорные сведения.

Сделать это можно так.

 

экспери­

Пусть в нашем распоряжении находится N

ментов, которые следует расположить на оси х. Будем оп­

ределять xt так, чтобы вероятность попадания глобального

экстремума в промежуток с* < xt ^

с*+1 не зависела от

номера i. Это означает, что априорная вероятность обнару­ жить глобальный экстремум в каждом из промежутков

[с„ Cf+1]

(i =

1,

., N) одинакова

и равна 1/N.

Значения

с2,

.,

в этом случае

определяются из

следующих уравнений:

 

 

 

 

 

 

р (х) dx.

(10.2.4)

Эту задачу очень просто решить графически. Для этого следует построить функцию распределения

X

F (х) = ^р (х) dx

(10.2.5)

а

 

и «рассечь» ее N равноотстоящими горизонтальными пря­ мыми. Абсцисса каждого из пересечений определяет гра­ ницу промежутков. Теперь нетрудно определить поло­ жение экспериментов для сканирования. Они располо­ жатся в центре тяжести:

 

ci+i

xi —

§ xp(x)dx.

 

С.

 

г

При большом N получаем

 

x i ~

Эта процедура проиллюстрирована на примере, пока­

занном на рис.

1 0 .2 . 2

для

 

 

 

 

треугольного

закона

рас­

 

 

 

 

пределения р (х) для7У=4.

 

 

 

 

Заметим,

что при

от­

 

 

 

 

сутствии

априорных

све­

 

 

 

 

дений в

виде распределе­

 

 

 

 

ния р(х) его можно считать

 

 

 

 

равномерным. В этом слу­

 

 

 

 

чае указанная

процедура

 

 

 

 

приведет

к равномерному

 

 

 

 

разбиению всего интерва­

 

 

 

 

ла, т. е. к простому

ска­

 

 

 

 

нированию (1 0 .2 .1 ).

 

 

 

 

 

2) Сканирование с уточ­

Рис. 10.2.2. Пример учета априор­

нением. Эта модификация

ного распределения

при органи­

заключается

в

том,

что

зации сканирования.

 

после грубого

сканирова­

выделяется район, где может

ния объекта

шагом Дх)

располагаться глобальный экстремум. В

этом районе

де­

лается более тщательное сканирование с шагом Д2 <

Дх.

После этого

снова определяется зона,

где

возможно

найти глобальный экстремум. В этой зоне можно произ­ вести дальнейшее уточнение с шагом Д8 < Д2 и т. д.

Как видно, такой метод глобального поиска опирается на предположение о том, что глобальный экстремум не слишком острый и его можно нащупать грубой сеткой. Если же зона притяжения глобального экстремума (5*) мала, то поиск таким методом не приводит к результату,

т.е. глобальный экстремум «теряется».

3)Комбинация сканирования и локального поиска. Поиск разбивается на два этапа. В первом этапе произво­ дится равномерное сканирование всей зоны поиска с целью выявления точек, подозреваемых в том, что они располагаются поблизости от глобального экстремума. Второй этап сводится к определению положения локальных экстремумов (например, методом поиска с совмещенными пробными и рабочими шагами) из исходных состояний,

получаемых в результате сканирования. Эти исходные

состояния,

выбранные в процессе сканирования, соот­

ветствуют наименьшим и близким к ним значениям пока­

зателя

качества

из

полученных при

сканировании.

Глобальный экстремум

в данном случае

определяется

как наименьший

из локальных, полученных на втором

этапе поиска.

 

 

 

Случайный поиск является наи­

В. Случайный поиск.

более эффективным методом отыскания глобального экстре­

мума в обстановке, когда о характере поведения функции,

качества Q (х) почти

ничего не

известно.

Именно такой

информационный «голод» характерен для реальных много­

экстремальных объектов. Поэтому случайный поиск и

претендует на роль универсального средства решения

многоэкстремальных

задач.

заключается во введении

Смысл

случайного

поиска

элемента случайности в процесс определения точки х,

где измеряется (или

 

вычисляется) показатель качества

Q (х). Рассмотрим несколько алгоритмов случайного поис­

ка глобального экстремума.

 

 

1)

Слепой поиск. Этот вид случайного поиска строится

следующим образом. В зоне поиска задается априорная

плотность

распределения

глобального экстремума р (х).

Точки х, в которых определяется значение показателя качества, «разыгрываются» случайно в соответствии с за­ данным законом распределения р (х). Если априорных

сведений о законе распределения не имеется, то естест­ венно каждую точку в равной мере «подозревать» в гло­ бальности и поэтому считать р (х) равномерным законом, т. е. р (х) = const. Этот метод не без основания иногда называют методом Монте-Карло, подчеркивая тем самым его статистический характер.

Пусть | — случайное число. Тогда алгоритм слепого поиска записывается в виде

Xi = l (i = 1, ., N), (10.2.6)

где случайное число £ имеет заданную плотность распреде­ ления р(£), N — число экспериментов, выделенное для отыскания глобального экстремума. При этом процесс за­ поминания остается прежпим (1 0 .2 .2 ).

2) Поиск с уточнением. Этот алгоритм является анало­ гом рассмотренного выше алгоритма сканирования с уточ­ нением. Поиск сводится к следующему.

На первом этапе осуществляется слепой поиск на базе

Ni экспериментов во всей зоне поиска

выде­

ляется отрезок длиной к (Ь — а), где 0

к ■< 1 , с центром

в точке с наименьшим показателем качества. Следующие N 2 экспериментов распределяются в указанном отрезке и определяется точка, показатель качества которой мини­ мален. Далее, вокруг этой точки выделяется отрезок дли­ ной к2 (Ь а), в котором делается третий этап слепого поиска, и т. д. Как видно, зона поиска на каждом этапе уменьшается в 1 раз, что позволяет уточнить положение глобального экстремума. Однако с уменьшением зоны поиска увеличивается и вероятность утери глобального экстремума, т. е. вероятность того, что он окажется вне пределов зоны поиска очередного этапа. Поэтому подобное измельчение нецелесообразно продолжать слишком дол­ го. Вполне достаточно ограничиться двумя-тремя этапами такого поиска.

Развитием й обобщением поиска с уточнением является следующий алгоритм поиска.

3) Поиск с разведкой. Смысл этого глобального поиска заключается в следующем. Априорно (т. е. заранее) пред­ полагается известным вид плотности распределения пока­ зателя качества Q (х) при равномерном случайном располо­ жении проб х. Эта плотность распределения известна

с точностью до т неизвестных параметров

А (%) Й2 ) ч От)*

(10.2.7)

Обозначим эту плотность в виде

р (Q/A) = р {Q/ax,

., ат).

(1 0 .2 .8 )

Вид этой функции и есть необходимая априорная инфор­ мация. Разобьем всю зону поиска на две равные части:

Dx и D2;

01 = (а ,-^ Г -),

=

(Ю.2.9)

Пусть в нашем распоряжении имеется всего N испытаний, которые нужно распределить в одной или другой зоне поиска (не важно как) с целью определения глобального экстремума. Для того чтобы выбрать одну из зон, нужно сделать разведку, на которую затрачивается N 0 испыта­ ний, причем в каждой из обеих зон делается N J 2 экспери­ ментов.

Разведка заключается в определении значений показа­ теля качества в N 0 случайных точках, равномерно рас­ пределенных по зонам Qi=Q(x{). Полученные значения

Q (я0,.. •, Q (жд^), Q ( х ^ ),...,<? (xNo)

(10.2.10)

~2 "*"1

являются исходной информацией для определения парамет­

ров Ai и А 2 в каждой из зон. Здесь хх, . . . , х N<>^

^

 

2

 

w

, . . . , XN0. Это м о ж ет б ы ть с д е л а н о , н а п р и м е р ,

~ Г + 1

методом максимума правдоподобия. В соответствии с ука­ занным методом нужно решить уравнения

 

 

N0I2

 

 

 

 

да^

:П P(Q}IAl) = 0

(Î =

1, • . ч т ) .

 

 

No

 

 

 

 

да™

П

Р (^ /Л ) = о

( 1 =

1 .........т)

(1 0 .2 .1 1 )

No

 

 

 

 

; =

2

+ 1

 

 

 

относительно Ах = (а(р , а{р, ., a(nV)n А* = (а(х}. а£\...

ч ciïn)- Определив из этих уравнений А хи А 2, получаем

оценки плотности распределения в первой и второй зонах

 

р (Q/Aj) для х е

А ,

 

 

P (Q/A2) для х Œ Dx.

(10.2.12)

Теперь,

зная эти распределения,

можно вычислить, где

следует

распределить оставшиеся

N N 0

испытаний.

Для этого достаточно определить математическое ожида­ ние наименьшего из N N 0 случайных чисел, распреде­ ленных по первому (Mj) и второму (М2) законам (10.2.12). Если Мх < М2, то оставшиеся испытания следует распре­ делять в первой зоне Dx. При Мх М2 предпочтение следует отдать зоне D2.

Поступая таким образом, можно быть уверенным, что в среднем будет получено наименьшее в данных условиях значение показателя качества, которое можно считать оценкой глобального экстремума на базе N эксперимен­ тов. Очевидно, что результат во многом зависит от величи­ ны N 0. Действительно, при малом N 0 оценки математиче­ ских ожиданий наименьших значений М г и М 2 будут слишком грубыми, что повышает вероятность ошибочного выбора одной из зон. Если же N 0 велико, то Мг и М2, а вместе с ними и зона определяются правильно. Но остав­ шееся число экспериментов N N 0 слишком мало, чтобы достаточно точно оценить глобальный экстремум. В этом случае результат также будет слишком приближенным. Следовательно, N 0 должно быть оптимальным.

Рассмотрим пример. Пусть априорно известно, что значение показателя распределено по экспоненциальному

закону:

 

 

 

 

1

aa— Q

если x >

a2,

 

— exp

ai

(10.2.13)

p(Q/A) = ai r

если x

a2.

0 ,

 

 

Здесь m = 2 и A = (ax, a2). Математическое

ожидание

наименьшего из N реализаций экспоненциального закона

равно [1 0 .1 ]

 

 

М = а2+

.

(10.2.14)

Теперь задача свелась к оценке

параметров ах и а2 для

одной и другой зои и подстановке их в формулу (10.2.14) С последующим определением Мх ^ М%.

§ 10.3. Глобальный поиск в обстановке помех

Рассмотрим следующую задачу глобального поиска. Пусть значения показателя качества наблюдаются в N фиксированных состояниях хх, ., XN (рис. 10.3.1), при­ чем измерения производятся с дискретными независимыми

Рис. 10.3.1. Пример глобальной харак­ теристики объекта в обстановке помех.

помехами, дисперсия которых, вообще говоря, может зави­ сеть от состояния. Это означает, что

<?' (*i) = Q (*i) + е (а*),

(10.3.1)

где о\ — известная дисперсия помехи в состоянии

(по­

меха, как обычно, предполагается нормальной и центриро­ ванной). Задача заключается в отыскании такого состоя­

ния Xj — х*, показатель

качества которого

был бы ми­

нимален, т. е.

 

 

Q (х*) =

min Q (xj.

(10.3.2)

 

/V

 

Для того чтобы определить искомое состояние х* с мини­ мальным значением показателя качества в обстановке помех, следует, например, повторять измерения во всех точках последовательно до тех пор, пока дисперсия оце­ нок не станет достаточно малой, чтобы с заданной вероят­ ностью выбрать положение экстремума. Однако подобная стратегия многократного полного перебора явно неопти­ мальна, так как она предполагает повторные измерения в точках, либо заведомо не претендующих на экстремумы,

либо с малой дисперсией оценки показателя качества, где располагать очередные испытания явно нецелесообразно. Рассмотрим процедуру оптимального назначения состоя­ ния, где должен быть замерен показатель качества. Преж­ де всего необходимо сказать несколько слов о критерии поиска, т. е. выяснить чему следует удовлетворять при синтезе алгоритма поиска.

Одним из таких критериев можно считать вероятность того, что Xi является глобальным экстремумом, т. е.

Pt = Вер (xt = х*) (i = 1,

., N).

(10.3.3)

Однако это не один, а N критериев. Их можно объединить в один — энтропию, которая в данном случае будет харак­ теризовать уровень неопределенности в положении гло­ бального экстремума:

N

 

Э = - 2 PilgPi.

(10.3.4)

г= 1

Очевидно, что стратегия поиска должна строиться так, чтобы энтропия (10.3.4) уменьшалась быстрейшим обра­ зом, т. е. на каждом шаге получать максимальную инфор­ мацию. Прекращение поиска естественно связать с опре­ деленным уровнем энтропии Э0, т. е. критерием останова считать удовлетворение неравенства

Э <

Э0.

(10.3.5)

Энтропия Э зависит, прежде всего, от количества на­

блюдений (i = 1, . ., N),

сделанных в каждом состоя­

нии (дисперсии of наблюдений в каждой точке предпола­ гаются неизвестными):

Э = Э (пц щ, ., nN). (10.3.6)

Среднее значение показателя качества на базе и* измере­ ний в £-й точке xt равно

П.

<1о-з л >

г }=1

где / — номер измерения в этом состоянии, Q,- (xî) — /-е наблюдение в i-м состоянии. Дисперсия этого среднего

значения, как известно, равна

0 ($ = -£ •

(ю.з.8)

i

Для определения вероятности P f (10.3.3) необходимо сна­ чала вычислить вероятность того, что из двух состояний (х, и Xj) t-e имеет меньшее значение функции качества, чем /:е:

Рц = Вер [Q (хО < Q (*;)].

(10.3.9)

Так как помеха е нормальна и центрирована, то для Ри имеет место следующее очевидное выражение:

(10.3.10)

где Ф — функция Лапласа [8.1].

Действительно, математическое ожидание разности Qi Qj можно приближенно оценить лишь по имеющим­ ся замерам:

Q\ — Qj = Q (*i)

Q (*j)

Q'j, (10.3.11)

причем эта оценка имеет дисперсию

 

2

i l

+

i .

(10.3.12)

ог;

п.

п .

При N = 2, когда имеется всего два состояния, величи­ на Рц равна Р^ a Pj = 1 P ti. Для N > 2 эта вероят­ ность равна

N

 

р , = i —П(1 —/>«)•

(10.3.13)

Mi

 

Подставляя полученное значение Pi в выражение для энтропии (10.3.4), получим ее аналитическую зависимость от чисел пх, п2, ., щу (10.3.6), причем числа nt входят явным образом через выражение для дисперсии (10.3.12). Теперь нетрудно выработать стратегию глобального поис­ ка. Будем последующие измерения располагать в том состоянии, которое обеспечит наибольшее снижение энт­ ропии. Для этого вычислим величину энтропии при уве­

личении числа наблюдений в каждом состоянии на едини­ цу. Для этого достаточно изменить в формуле (10.3.12) rai-bni+l, подставить ее в (10.3.10), а последнюю — в (10.3.4). Получаем N значений энтропии:

9i = Э (п1}

., П ц,

п{-И ,

п|+1,

., nlV) (i =

1,

., N).

Минимальное значение из них

 

 

 

(10.3.14)

 

 

 

 

 

Эj = min

{Э*}

(i =

1 ,

., N)

 

(10.3.15)

и определит номер состояния Xj, где следует делать оче­ редной замер показателя качества, так как именно в этом состоянии эксперимент снижает энтропию наибольшим образом. Далее, измеряя значение показателя качества в точке Xj, получаем Q' (жД. Теперь следует произвести коррекцию среднего значения показателя качества в этой точке. Это делается по очевидной формуле:

й'—-н-тгй+ -^рт <?>;>•

(ю-3.16)

Как легко видеть, действуя таким образом, мы будем уменьшать неопределенность на одном шаге наибольшим образом. Это и обеспечивает оптимальность выбранной стратегии глобального поиска в обстановке помех.

Для того чтобы запустить изложенную процедуру, необходимо сделать сначала эксперименты во всех N точ­ ках Xi. Полученные значения показателя качества Q\ дают возможность вычислить матрицу (10.3.10), при помо­ щи которой определяются вероятности (10.3.13), которые образуют энтропию (10.3.4). Далее необходимо «разыг­ рать» эффект от постановки эксперимента в одном из N состояний, т. е. оценить значение энтропии при измерении показателя качества в каждой из точек жг. Расчет позво­ ляет определить номер того состояния, где следует ставить эксперимент. Определив значение показателя качества в этой точке (с помехой измерений), необходимо сделать коррекцию среднего значения показателя в этой точке. Таким образом, на каждом этане поиска для каждого i-ro состояния Xi необходимо хранить следующую инфор­

мацию:

1 ) число

экспериментов щ, произведенных

в xi и 2 ) оценку

среднего значения показателя качества

в xi по

(10.3.7).