Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы в системах поддержки принятия решений

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
16.41 Mб
Скачать

Теперь для выпуклой функции <р(х) как функции, определенной на /Р, запишем необходимое условие ее минимума

<р(х) - ф(х°) > О

 

где х® — точка минимума, т.е. ф(х) — ф(х°) > (0, х -

х°),

откуда

 

О € Эф(х°) = ЭДх°) + Э5(х°|Л),

(3)

или

 

ЭДх°) п Э5Чх°|А) * 0 -

(4)

Это условие при выпуклой <р(х) является и достаточным для оптималь­ ности х°; здесь допустимое множество X в точке х° аппроксимировано

обобщенным градиентным (субградиентным) множеством. Эквивалентность выражений (3) и (4) устанавливается достаточно

просто:

ЭДх°) и -Э 6(х°[Л) = Э8*(х°|*)

есть множества, но тогда для принадлежности нуля сумме этих мно­ жеств достаточно принадлежности нуля их пересечению.

Если функция Дх) дифференцируема в точке х° € X, то

ЭДх°) =Л(х°),

и необходимое условие оптимальности решения х° записывается в виде Л(х°) = Э5'(х°1А).

Выражение (3) можно записать в более развернутой форме, для этого учитывается, что

5(х°да = 8(х°1Аг1) + 8(х°|Л^> + 8(х°[Аг3) + ... + 8(х°1А;),

где Хь Хъ ..., Х„ — выпуклые множества, образованные соответственно

ограничивающими условиями ф,(х) < 0, i = \,к,

ф,(х) = 0, i = k+l,m, т.е.

Хх= (х1ф,(х) < 0}, Х2= {х|ф2(х) < 0}, ...,

Хт = (х|фт(х) < 0},

а также то, что Э8(х|А^), / =l,/w, — опорные функции множеств Хь Хъ ...

..., Хт в точке х однозначно определяются {Эф,(х)} — опорными функ­

циями соответствующих ограничивающих условий

4*

51

 

М фД х),

если

X, > 0

и

ф,(х) = 0,

Э8*

0

если

X, = 0

и

ф((х )< 0,

= ' { },

 

 

 

 

 

0,

если

ф ,(х)> 0.

 

Таким образом, когда Эф(х) не пусто, т.е. ф,(х) < 0, / = 1, 2,..., т, условие

(3) преобразуется к виду

Эф(х0) = Э/(х°)+^Ч,.Эф(.(х0) VX>0, таких, что Х ф (х°) = 0, / = 1 /и;

/»I

при этом необходимое условие оптимальности решения х°, 0 е Эф(х°) имеет место только в том случае, когда коэффициенты Х„ i= l,m и х®

удовлетворяют известной теореме Куна—Таккера [22;23].

Теорема. Для того чтобы вектор был вектором Куна— Таккера, о т ­ решением рассматриваемой условной экстремальной задачи, необходимо и

достаточно, чтобы пара (х°, А0) была седловой точкой функции Лагранжа

ш

L(X,x) = f ( x ) + ' £ x lф,(х). Это условие выполняется тогда и только то-

/=1

гда, когда вектор х° и компоненты вектора X удовлетворяют следующим условиям:

1) Х,ф,<х°) - 0, X,>0, фХх») < 0 ,/= 1, 2 , к;

2) Ф/С*°) = 0, / = к + 1, к + 2,..., т;

3) 0 е Э/(х°) + £ X , Э ф (х °) = Эф(х°).

/«1

Для выпуклых условных задач выбора решений имеется и двой­ ственно-сопряженная форма [23;24;20].

Задача. Найти оптимальное решение (х^х® )> Доставляющее максимальное значение

критериальной

функции J(xb х2) = -(xj - х 2)2

при ограничении — равенстве

ф (*1 , ^2> " Р *1 “

* 2 “ 6 1> *1» х 2 R 2

 

Р е ш е н и е .

1. Проверим выполнение условия вогнутости функции Дхь х2). Для это­

го выпишем матрицу вторых производных А = ^

^ j;эта матрица отрицательно опре­

деленная: условие вогнутости выполнено.

2.Составим функцию Лагранжа

А(х,, х2, X) = -(х , - х 2)2 + Х|2х, - х2 - 6|, X > 0.

3.Выпишем необходимое условие экстремума для функции Лагранжа

0 € ЭА(х,, х2, X) « Э/Ц, х2) + ХЭф(х1, х2),

где ЭДх!, х2) = { -2(х, - х 2), 2(х, - х2)},

52

{2 ,- 1},

если

2xt - х 2 - 6 > 0,

Эф(х,,х2)= (о „ о 2 ) б [{2,-2 M -U » ,

если

2 х , - х 2 - 6 = 0,

{-2 ,1},

если

2*1 - х 2 - б < О

должны быть вычислены в точке (х®,х®), подозреваемой на экстремум; если щ > 0 , то

а2 < 0.

4.Согласно необходимому условию рассмотрим следующие системы:

4.1) -2(х® - х ? ) + 2Л = 0 ,2(х® - x j ) - X = 0, если 2х® - х £ - 6 > 0;

4.2) -2(х® -х® )-2Х = 0, 2(х® - х £ )+ Х = 0, если 2х® - x j - 6 < 0 ;

4.3) -2(х® -х® ) + 2Ха, =0, 2(х® -х® ) - Ха2 = 0, если 2х® -х® - 6 = 0, 2 > Oj > -2 ,

-1 < а , < 1.

Из 4.3 следует, что Oj = —2а , и, очевидйо, для систем 4.1 и 4.2 решений не существу­ ет, так как строки матриц Л41 = ^ ” 2 ) ’ / *4-2 = (2 ~2 ) лине^но зависимы; система 4.3

имеет единственное решение х® =х® =6 при а® =а® = 0 как значений компонент субгра­

диента, взятого из субдифференциала (at, <Х2)=[{—1, 1},{2, —2}].

Таким образом, в рассмотренной негладкой экстремальной задаче оптимальное ре­ шение представляется точкой (х® = х® = 6) и т а х /(х ° ,х 2) - 0 (в этой точке по терминоло­

гии (128] имеет место «слипание» функций ,Дх1(х2) и <p(xi,x2)).

Установим необходимые и достаточные условия оптимальности ре­ шения х® для условно-экстремального механизма (2), реализуемого в ва­

риационных задачах. При этом будем считать, что искомое решение У°(х), a< x< tb, должно удовлетворять ограничивающим условиям, за­

данным в виде конечных или дифференциальных уравнений — связей, или дифференцируемых функционалов, или кривых, по которым могут перемещаться концы у {а), у(Ь) кривой у(х) е е в процессе выбора наи­ лучшего решения у°(х). Так, если требуется осуществить наилучший вы­

бор решения у°(х) посредством минимизации функционала

Ь

F(y(x)) = jf(x ,y (x ),y '(x ))d x

при ограничении в виде уравнения связи <р(х, у(х)) и граничных услови­

ях у(а)9у(Ь), то необходимое условие оптимальности решения принима­

ет вид [16]

Э /(х,у,у0

ЭЛх,у,у О

 

Эф(х,у(х))

dy

dx Ъу'

'

Эу

ф(*, А х)) = 0, у(а), у(Ь).

Аналогичным образом при фиксированных у (а), у(Ь) записываются

необходимые условия оптимальности решения у°(дс) и при ограничениях

53

в виде дифференциальных связей <р(х, у(х), /(х )) = 0 или в виде диффе­

ренцируемого функционала

Ь

G(y(x)) = Jg(x,y(x),y'(x))dx = l,

а

где / — заданная константа.

Для задачи выбора решения с подвижными левой и правой граница­ ми, описываемыми функциями у(х, у(х)) = 0U , и 0(х, у(х)) = ОU , необ­

ходимое условие оптимальности решения у°(х) записывается в виде дифференциального уравнения Эйлера

b f(x ,y ,y ’)

d

Э /(х ,у ,/) _ 0

Эу

dx

3у '

с граничными условиями, называемыми условиями трансверсальности,

/ ( w o - 0 ', - ' i o / ; v „ =о,

f( x ,y ,y ') - ( y '- Q ') f; ,lxmi = 0,

согласно которым определяются постоянные интегрирования решения из уравнения Эйлера.

Проиллюстрируем применение условий трансверсальности в кон­ кретной простой за д а ч е: найти минимальное расстояние между двумя непересекающимися выпуклыми множествами с гладкими границами

У = Л(х) и у = / 2(х).

Очевидно, соответствующее расстояние есть

minJ-y/l + j/ 2dx, если у0 =/,(хо) и у { = / 2(х,).

*0

Искомое решение следует из уравнения Эйлера

/ уУ (у Г у " = 0= *у " = 0, / , у ( / ) * 0 =>;у'' = 0 =>;у = С *+А

т.е. минимальное расстояние есть длина отрезка прямой , соединяюще­ го заданные множества. Неизвестные константы С и /) определяются из условий трансверсальности, которые в рассматриваемой задаче записы­ ваются в виде

y 'J u = ~ 1 и y ' f 2'x = - 1,

где у ', / ,' , f 2'x — угловые коэффициенты отрезка прямой , соединяю­

щего множества и касательных к множествам в точках их соединения.

54

Уравнение Эйлера может иметь вид и интегродифференциального уравнения. В связи с этим рассмотрим задачу вычисления функции и(х) как решение интегрального уравнения Фредгольма первого рода

к

J K(x,y)u(y)dy = /(* ), с < x £ d , a < y< b ,

в котором К (х,у) — заданная функция, а функция Дх) установлена не­

точно — по результатам эксперимента с погрешностью. Поэтому задача вычисления функции и(х) некорректна в смысле Тихонова. Для ее ре­

шения перейдем к регуляризованной задаче

 

d ' b

I 2

1 Ь /

 

Л(и (у)) = min

J jK(x,y)u(y)dy-f(x)

_

йЬс+a^JIfd ku(y) V dy

•и'{у),

{«(У)}

с La

Л*Оа \ dyk )

 

где a — параметр регуляризации, например, a = 0,1 ; 0,0 1;

 

1

dy — стабилизатор первого порядка с весовой функ-

2 1 dyk

)

 

 

 

цией pk(y) = 1 .

Регуляризованная задача корректна, и для отыскания ее решения

необходимо приравнять нулю первую вариацию 5А(и(у)) по и(у), т.е.

воспользоваться выражением

а Г»

8Л(м(у)) = 2 |- jK (x ,y )u (v )d v -f(x ) | K(x,y)&u(ydy) ■dx+

1к

+2a X j « (*, (y)8« w (y)rfy=0.

М а

Проинтегрировав в этом выражении интегралы под знаком суммы по частям, получим интегродифференциальное уравнение Эйлера [117]

, , d ku k(y) Jf

^X {x,y)X (x,v)dx u(v)dv = jK (x,y)f(x)dx.

dyk

 

Это уравнение относится к классу интегродифференциальных, не со­ держащих производных под знаком интеграла. Его решение отыскива­ ется при заданных краевых условиях и(а), и(Ь), и'(а), и\Ь), например

при помощи преобразования Фурье-Лапласа [118].

55

2.3. Необходимые и достаточные условия оптимальности для условно-экстремального механизма

в динамических задачах

Условно-экстремальный механизм в динамических задачах вводится для выбора лучшего решения ы0(0 € U по функционалу качества инте­

грального вида

т

/(«(О) = j f a(t,x(t),u(t))dt+4Kx(T),T),

заданному в каком-то бесконечномерном функциональном пространст­ ве Е, при ограничениях в виде дифференциальных связей

МО = f(t,x (0 A 0 ), t0< t< T , и{0 U, МО е R"

и недифференциальных

x(t0) € G(t0), х(7) е Д 7 ),

где Г0, Т могут быть фиксированными или неизвестными моментами

времени и подлежат определению; и(0 — кусочно-непрерывная функция на [/„, Т\, или это элементы

замкнутого множества U, или непрерывные функции на [/„, 7], — эле­

менты открытого множества допустимых управлений

U -C ([tо, 71, Я"), т < п ;

МО — фазовая переменная.

Механизмы выбора лучшего решения

А. При открытом м нож естве управлений и°(/) = aig min/(«(/)), tied

и условиях

МО = f(*,M0M0)> t0< t< T , и(0 € С([Г0, 71,

х(0 е R", т < п,

х(/0) е Л"|£, ,/0)<0, i = 1,/и,

£,(х,/0)- 0 ,

x(/0)eG(/0) =

 

/ = /я+1

 

x (T )e R ',\hi { x ,T )^ 2 J = U ,

Ау(х,70=0,1

Д Г ) € Д Г ) = -

J

y = / + U

 

А)6 ®о» Т

56

Необходимые условия оптимальности решения согласно этому меха­ низму представляются (пусть t0= const) соотношениями [19; 25; 26]

dH (t,x(t),u(t)M 0 ) = 0, если и е int U, ди

Н (Т ,х (Т )М Т )М Т ))

= 0,

М Т )

 

где

 

H(t, x(t), u(t), V(0 = -/o(f, X(t), u(t)) +

X(t), u m

функция Гамильтона, в которую вектор управления u(t) не входит ли­

нейным членом, т.е. предполагается, что - — зависит от и((), иначе ва­

ди риационная задача принятия решений не может быть решена при

открытом множестве управлений, когда вектор управления н(Г) входит в функцию Щ , x(t), u(t), \|f(/)) линейно;

ц — векторы множителей Лагранжа;

\|f(t) — вектор функций множителей Лагранжа.

Необходимые условия непосредственно выписываются из выражения для первой вариации функционала Лагранжа

т

K{x(t),u(t),y(t),t) = v)/# I(u(t))+ 1(\|/г(t),f(t, x(t) ,u(t))) - x(t))dt + *0

+oi T,g(x,t0) ) + a r M x ,T »

при приравнивании ее нулю для произвольных вариаций &с, 5\|Г, 5и, 5ц,

5Х, Sg и 5Л; у 0 - —1.

Если в рассматриваемой задаче множество допустимых управлений замкнуто и включает только непрерывные функции u(t) и оптимальное

57

управление может быть на границе U, то условие — = 0 должно быть

Эи

заменено на условие вида (gгad((Я ,и - и 0)> 0 , где и — и# — направление, не выводящее из U С([/0) 7], очевидно при этом, что когда и0 —

внутренняя точка U, условие - — =0 сохраняется.

Эи Выражения, указанные звездочкой, составляют условия трансвер­

сальности на правом и левом концах оптимальной траектории движе­ ния управляемой системы, когда эти концы свободны и момент време­ ни /0 фиксирован. В случае закрепления концов и момента t0 условия

трансверсальности имеют вид

* ('.)= *о, х (Т )= х т, Н(Т, х(Т), и(7), у(7)) + ЭФ^ 2 ,Г) = °-

М Т )

В названных и всех других случаях условия трансверсальности пред­ ставляют дополнительные условия для интегрирования системы диффе­ ренциальных уравнений относительно основной x(t) и сопряженной \у(0 переменных, а также для определения оптимального времени Т.

Они имеют достаточно простую геометрическую интерпретацию: векто­ ры у(/0) и \у(7) ортогональны к плоскостям многообразий соответствен­ но на моменты времени t0 и Т и направлены во внутрь этих многообра­

зий. Последние формируются согласно ограничениям для левого и правого концов траектории и терминальным членам критериального функционала.

Б. П р и з а м к н у т о м м н о ж е с т в е U и содержащем кусочно­ непрерывные функции u(t), ta< t< ,T, вид механизма выбора лучшего

решения формально не изменяется по сравнению с приведенной записью в а), но необходимые условия оптимальности^решения

имеют принципиальное отличие [27]:

вместо условия — = 0 или

(grad„tf,ы -и°)>0 имеет место условие

Эи

 

т ахН ((ух((),и (0 ,у Ш

h < t< T ,

UG.U

 

где Н — функция Понтрягина—Гамильтона.

В. Приведем здесь упрощенные варианты принципа максимума. Пусть

N

I(u(t)) = ^ a lul + 0 О где Ф0 — const.

/=1

Требуется найти и0, доставляющее m ax/(«(/)) при ограничениях \и\ < С/. В этом варианте выражение для функции Понтрягина—Гамиль­

тона представляется первым слагаемым заданной критериальной функ­ ции и оптимальное управление и® = с,.signa,.

58

Если же требуется найти u°(t), при котором

т

max/(«(/)) = max f/ , (t,u(t))dt,

u(t) J

где /(«(/)) принадлежит пространству непрерывных функций на [/„, Л . а f 0(t, u(t)) — непрерывно дифференцируемая функция и -во < u(f) < °°, то

необходимое условие принципа максимума для отыскания искомого

u°(t) записывается в виде

= 0.

Эи Отметим, что выписанные в А и Б необходимые условия для выпук­

лых задач выбора наилучших решений являются и достаточными. Однако при этом в общем случае решения, полученные согласно изло­ женным необходимым условиям могут быть оптимальными или неоп­ тимальными в зависимости от свойств исходных функций и данных, со­ ставляющих механизм выбора решений. Имеют место также задачи, для которых такие решения совсем не могут быть получены, это задачи с так называемыми (см.[28;29]> особыми (сингулярными), скользящими оптимальными управлениями и с четеринг-режимами. Соответствую­ щие им необходимые условия оптимальности изложены также вJ28;29].

Так, в скалярном по управлению случае при особом режиме — = 0 и Эи

э2н

— — = 0 на некотором промежутке времени из [Г0, 7], т.е. функция Га- Эи 2

мильтона стационарна и при этом ее второй дифференциал по управле­ нию не является отрицательно определенным; максимум функции раз­ мыт на допустимом множестве U. Это характерно для задач

оптимального управления, в которых - — явно не зависит от u(t), функ-

Эи

ции / 0(х(0, u(t), t) и Дх(/), «(0. 0 — линейные от управления и условие

max Н не позволяет вычислить оптимальное особое управление. Дока- u(t)eU

зано, например в [25], что необходимое условие оптимальности особого управления представляется обобщением условия Лежандра-Клебша и

записывается в виде неравенства (

э Гэ2к эя Ь о .

 

Эи ,d t2k Эи

Заметим, что в математической экономике особые решения называ­ ют магистральными.

Рассмотрим задачу, при решении которой возникает особый режим.

Задача 1. Найти оптимальное управление u{t) е [-1, 1] и соответствующую ему траек­ торию движения системы из начального состояния х(/0) * *i в конечное х(Т) * х2, при ко­

тором достигается минимальное значение критериального функционала

Пусть дви-

о

жение системы описывается уравнением x(t) = u(t)t 0

59

Р е ш е н и е . Согласно изложенным необходимым условиям поступаем следующим образом:

1.Составим гамильтониан

0, «(/), 0 = *2(0 + V(0w(r).

2.Найдем оптимальное управление u°(t) из min Я:

l«l$i

« °(0 ■» sign у (0 при у (0 0.

Если же у(/) = 0 , то конкретное w°(0 € (-1 ,1 ) по функции Гамильтона не определяется — имеет место режим особого управления. В этом случае воспользуемся отмеченным выше условием оптимальности такого режима:

(-1)

)£ ОЛИ), 1,2,..,

 

dudt2k

(известны и другие подходы к исследованию режима особого управления, изложенные в [129, 135]).

2. Вычислим

^ - 1

и для выбора w°(f) € (-1 ,1 ) при у(г) = 0 воспользуемся усло-

d t\

ди )

 

 

 

 

вием

 

 

 

 

 

 

d_

, тогда — f ^ * 1

= у (0

= 0.

 

dt

0

 

 

d t\ ди )

 

 

При этом из сопряженной системы уравнений принципа максимума на отрезке времени, соответствующем режиму особого управления, имеем

у(0 =М . а»у =2JC=0 =*х= О

но выражение для вычисления оптимального управления не выявлено (оно выявляется только при вычислении производных четного порядка).

4. Вычислим * [

—^ | = 2JC= 0= ^JC= 0, (необходимое условие оптимальности выпол-

dt2 V Эи )

нено:>: ( - 1)1— (-^r-f —

1) = 2 > 0) отсюда следует, что при у(/) = 0 получаем и°(0 и, таким

ди dt2 V <*и )

образом, вычислено оптимальное управление

ч

если

V<0,

«°(0 = 0,

если

V=0,

+1,

если

хр> 0.

5. Проинтегрируем уравнение x (t) - u { t\ 0 £ t £ T

при u°(t) и найдем отрезки непре­

рывной оптимальной траектории движения системы.

 

 

 

 

5.1)

i(f) = -l=>x(f) = - f + с или дс(г) ~ ^ + jcj, где Q £ t£ t'n, ?п — первый момент вре­

мени переключения управления с u°(t) = - 1 на и°(/) = 0.

 

 

 

5.2) х(г) = 1 =>дс(* )= -/+

d или х{Т) - х 2 ~ Т+ d

d = х2 -

Т и x(t) -

1-

Т+ х2, где

1 й Т ,

— последний

момент времени переключения

управления

с

w°(f) = 0 на

|/ъ(0 * 1.

 

 

 

 

 

 

60

Соседние файлы в папке книги