Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Математические методы в системах поддержки принятия решений

..pdf

Скачиваний:

Добавлен:

12.11.2023

Размер:

16.41 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 326 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Теперь для выпуклой функции <р(х) как функции, определенной на /Р, запишем необходимое условие ее минимума

<р(х) - ф(х°) > О
где х® — точка минимума, т.е. ф(х) — ф(х°) > (0, х -	х°),
откуда
О € Эф(х°) = ЭДх°) + Э5(х°\|Л),	(3)
или
ЭДх°) п Э5Чх°\|А) * 0 -	(4)

Это условие при выпуклой <р(х) является и достаточным для оптималь ности х°; здесь допустимое множество X в точке х° аппроксимировано

обобщенным градиентным (субградиентным) множеством. Эквивалентность выражений (3) и (4) устанавливается достаточно

просто:

ЭДх°) и -Э 6(х°[Л) = Э8*(х°|*)

есть множества, но тогда для принадлежности нуля сумме этих мно жеств достаточно принадлежности нуля их пересечению.

Если функция Дх) дифференцируема в точке х° € X, то

ЭДх°) =Л(х°),

и необходимое условие оптимальности решения х° записывается в виде Л(х°) = Э5'(х°1А).

Выражение (3) можно записать в более развернутой форме, для этого учитывается, что

5(х°да = 8(х°1Аг1) + 8(х°|Л^> + 8(х°[Аг3) + ... + 8(х°1А;),

где Хь Хъ ..., Х„ — выпуклые множества, образованные соответственно

ограничивающими условиями ф,(х) < 0, i = \,к,	ф,(х) = 0, i = k+l,m, т.е.
Хх= (х1ф,(х) < 0}, Х2= {х\|ф2(х) < 0}, ...,	Хт = (х\|фт(х) < 0},

а также то, что Э8(х|А^), / =l,/w, — опорные функции множеств Хь Хъ ...

..., Хт в точке х однозначно определяются {Эф,(х)} — опорными функ

циями соответствующих ограничивающих условий

	М фД х),	если	X, > 0	и	ф,(х) = 0,
Э8*	0	если	X, = 0	и	ф((х )< 0,
Э8*	= ' { },
	0,	если	ф ,(х)> 0.

Таким образом, когда Эф(х) не пусто, т.е. ф,(х) < 0, / = 1, 2,..., т, условие

(3) преобразуется к виду

Эф(х0) = Э/(х°)+^Ч,.Эф(.(х0) VX>0, таких, что Х ф (х°) = 0, / = 1 /и;

/»I

при этом необходимое условие оптимальности решения х°, 0 е Эф(х°) имеет место только в том случае, когда коэффициенты Х„ i= l,m и х®

удовлетворяют известной теореме Куна—Таккера [22;23].

Теорема. Для того чтобы вектор был вектором Куна— Таккера, о т решением рассматриваемой условной экстремальной задачи, необходимо и

достаточно, чтобы пара (х°, А0) была седловой точкой функции Лагранжа

L(X,x) = f ( x ) + ' £ x lф,(х). Это условие выполняется тогда и только то-

/=1

гда, когда вектор х° и компоненты вектора X удовлетворяют следующим условиям:

1) Х,ф,<х°) - 0, X,>0, фХх») < 0 ,/= 1, 2 , к;

2) Ф/С*°) = 0, / = к + 1, к + 2,..., т;

3) 0 е Э/(х°) + £ X , Э ф (х °) = Эф(х°).

/«1

Для выпуклых условных задач выбора решений имеется и двой ственно-сопряженная форма [23;24;20].

Задача. Найти оптимальное решение (х^х® )> Доставляющее максимальное значение

критериальной	функции J(xb х2) = -(xj - х 2)2	при ограничении — равенстве
ф (1 , ^2> " Р 1 “	* 2 “ 6 1> *1» х 2 € R 2 •
Р е ш е н и е .	1. Проверим выполнение условия вогнутости функции Дхь х2). Для это
го выпишем матрицу вторых производных А = ^		^ j;эта матрица отрицательно опре

деленная: условие вогнутости выполнено.

2.Составим функцию Лагранжа

А(х,, х2, X) = -(х , - х 2)2 + Х|2х, - х2 - 6|, X > 0.

3.Выпишем необходимое условие экстремума для функции Лагранжа

0 € ЭА(х,, х2, X) « Э/Ц, х2) + ХЭф(х1, х2),

где ЭДх!, х2) = { -2(х, - х 2), 2(х, - х2)},

{2 ,- 1},	если	2xt - х 2 - 6 > 0,
Эф(х,,х2)= (о „ о 2 ) б [{2,-2 M -U » ,	если	2 х , - х 2 - 6 = 0,
{-2 ,1},	если	2*1 - х 2 - б < О

должны быть вычислены в точке (х®,х®), подозреваемой на экстремум; если щ > 0 , то

а2 < 0.

4.Согласно необходимому условию рассмотрим следующие системы:

4.1) -2(х® - х ? ) + 2Л = 0 ,2(х® - x j ) - X = 0, если 2х® - х £ - 6 > 0;

4.2) -2(х® -х® )-2Х = 0, 2(х® - х £ )+ Х = 0, если 2х® - x j - 6 < 0 ;

4.3) -2(х® -х® ) + 2Ха, =0, 2(х® -х® ) - Ха2 = 0, если 2х® -х® - 6 = 0, 2 > Oj > -2 ,

-1 < а , < 1.

Из 4.3 следует, что Oj = —2а , и, очевидйо, для систем 4.1 и 4.2 решений не существу ет, так как строки матриц Л41 = ^ ” 2 ) ’ / *4-2 = (2 ~2 ) лине^но зависимы; система 4.3

имеет единственное решение х® =х® =6 при а® =а® = 0 как значений компонент субгра

диента, взятого из субдифференциала (at, <Х2)=[{—1, 1},{2, —2}].

Таким образом, в рассмотренной негладкой экстремальной задаче оптимальное ре шение представляется точкой (х® = х® = 6) и т а х /(х ° ,х 2) - 0 (в этой точке по терминоло

гии (128] имеет место «слипание» функций ,Дх1(х2) и <p(xi,x2)).

Установим необходимые и достаточные условия оптимальности ре шения х® для условно-экстремального механизма (2), реализуемого в ва

риационных задачах. При этом будем считать, что искомое решение У°(х), a< x< tb, должно удовлетворять ограничивающим условиям, за

данным в виде конечных или дифференциальных уравнений — связей, или дифференцируемых функционалов, или кривых, по которым могут перемещаться концы у {а), у(Ь) кривой у(х) е е в процессе выбора наи лучшего решения у°(х). Так, если требуется осуществить наилучший вы

бор решения у°(х) посредством минимизации функционала

F(y(x)) = jf(x ,y (x ),y '(x ))d x

при ограничении в виде уравнения связи <р(х, у(х)) и граничных услови

ях у(а)9у(Ь), то необходимое условие оптимальности решения принима

ет вид [16]

Э /(х,у,у0	ЭЛх,у,у О		Эф(х,у(х))
dy	dx Ъу'	'	Эу

ф(*, А х)) = 0, у(а), у(Ь).

Аналогичным образом при фиксированных у (а), у(Ь) записываются

необходимые условия оптимальности решения у°(дс) и при ограничениях

в виде дифференциальных связей <р(х, у(х), /(х )) = 0 или в виде диффе

ренцируемого функционала

G(y(x)) = Jg(x,y(x),y'(x))dx = l,

где / — заданная константа.

Для задачи выбора решения с подвижными левой и правой граница ми, описываемыми функциями у(х, у(х)) = 0U , и 0(х, у(х)) = ОU , необ

ходимое условие оптимальности решения у°(х) записывается в виде дифференциального уравнения Эйлера

b f(x ,y ,y ’)	d	Э /(х ,у ,/) _ 0
Эу	dx	3у '

с граничными условиями, называемыми условиями трансверсальности,

/ ( w o - 0 ', - ' i o / ; v „ =о,

f( x ,y ,y ') - ( y '- Q ') f; ,lxmi = 0,

согласно которым определяются постоянные интегрирования решения из уравнения Эйлера.

Проиллюстрируем применение условий трансверсальности в кон кретной простой за д а ч е: найти минимальное расстояние между двумя непересекающимися выпуклыми множествами с гладкими границами

У = Л(х) и у = / 2(х).

Очевидно, соответствующее расстояние есть

minJ-y/l + j/ 2dx, если у0 =/,(хо) и у { = / 2(х,).

Искомое решение следует из уравнения Эйлера

/ уУ (у Г у " = 0= *у " = 0, / , у ( / ) * 0 =>;у'' = 0 =>;у = С *+А

т.е. минимальное расстояние есть длина отрезка прямой , соединяюще го заданные множества. Неизвестные константы С и /) определяются из условий трансверсальности, которые в рассматриваемой задаче записы ваются в виде

y 'J u = ~ 1 и y ' f 2'x = - 1,

где у ', / ,' , f 2'x — угловые коэффициенты отрезка прямой , соединяю

щего множества и касательных к множествам в точках их соединения.

Уравнение Эйлера может иметь вид и интегродифференциального уравнения. В связи с этим рассмотрим задачу вычисления функции и(х) как решение интегрального уравнения Фредгольма первого рода

J K(x,y)u(y)dy = /(* ), с < x £ d , a < y< b ,

в котором К (х,у) — заданная функция, а функция Дх) установлена не

точно — по результатам эксперимента с погрешностью. Поэтому задача вычисления функции и(х) некорректна в смысле Тихонова. Для ее ре

шения перейдем к регуляризованной задаче

	d ' b	I 2	1 Ь /
Л(и (у)) = min	J jK(x,y)u(y)dy-f(x)	_	йЬс+a^JIfd ku(y) V dy	•и'{у),
{«(У)}	с La	_	Л*Оа \ dyk )
где a — параметр регуляризации, например, a = 0,1 ; 0,0 1;
1	dy — стабилизатор первого порядка с весовой функ-
2 1 dyk	dy — стабилизатор первого порядка с весовой функ-
2 1 dyk	)

цией pk(y) = 1 .

Регуляризованная задача корректна, и для отыскания ее решения

необходимо приравнять нулю первую вариацию 5А(и(у)) по и(у), т.е.

воспользоваться выражением

а Г»

8Л(м(у)) = 2 |- jK (x ,y )u (v )d v -f(x ) | K(x,y)&u(ydy) ■dx+

1к

+2a X j « (*, (y)8« w (y)rfy=0.

М а

Проинтегрировав в этом выражении интегралы под знаком суммы по частям, получим интегродифференциальное уравнение Эйлера [117]

, , d ku k(y) Jf	^X {x,y)X (x,v)dx u(v)dv = jK (x,y)f(x)dx.
dyk

Это уравнение относится к классу интегродифференциальных, не со держащих производных под знаком интеграла. Его решение отыскива ется при заданных краевых условиях и(а), и(Ь), и'(а), и\Ь), например

при помощи преобразования Фурье-Лапласа [118].

2.3. Необходимые и достаточные условия оптимальности для условно-экстремального механизма

в динамических задачах

Условно-экстремальный механизм в динамических задачах вводится для выбора лучшего решения ы0(0 € U по функционалу качества инте

грального вида

/(«(О) = j f a(t,x(t),u(t))dt+4Kx(T),T),

'о

заданному в каком-то бесконечномерном функциональном пространст ве Е, при ограничениях в виде дифференциальных связей

МО = f(t,x (0 A 0 ), t0< t< T , и{0 € U, МО е R"

и недифференциальных

x(t0) € G(t0), х(7) е Д 7 ),

где Г0, Т могут быть фиксированными или неизвестными моментами

времени и подлежат определению; и(0 — кусочно-непрерывная функция на [/„, Т\, или это элементы

замкнутого множества U, или непрерывные функции на [/„, 7], — эле

менты открытого множества допустимых управлений

U -C ([tо, 71, Я"), т < п ;

МО — фазовая переменная.

Механизмы выбора лучшего решения

А. При открытом м нож естве управлений и°(/) = aig min/(«(/)), tied

и условиях

МО = f(*,M0M0)> t0< t< T , и(0 € С([Г0, 71,	х(0 е R", т < п,
х(/0) е Л"\|£, (х,/0)<0, i = 1,/и,	£,(х,/0)- 0 ,
x(/0)eG(/0) =
/ = /я+1,Л
x (T )e R ',\hi { x ,T )^ 2 J = U ,	Ау(х,70=0,1
Д Г ) € Д Г ) = -	J
y = / + U	J
	А)6 ®о» Т €

Необходимые условия оптимальности решения согласно этому меха низму представляются (пусть t0= const) соотношениями [19; 25; 26]

dH (t,x(t),u(t)M 0 ) = 0, если и е int U, ди

Н (Т ,х (Т )М Т )М Т ))	= 0,
М Т )
где
H(t, x(t), u(t), V(0 = -/o(f, X(t), u(t)) +	X(t), u m

— функция Гамильтона, в которую вектор управления u(t) не входит ли

нейным членом, т.е. предполагается, что - — зависит от и((), иначе ва

ди риационная задача принятия решений не может быть решена при

открытом множестве управлений, когда вектор управления н(Г) входит в функцию Щ , x(t), u(t), \|f(/)) линейно;

ц — векторы множителей Лагранжа;

\|f(t) — вектор функций множителей Лагранжа.

Необходимые условия непосредственно выписываются из выражения для первой вариации функционала Лагранжа

K{x(t),u(t),y(t),t) = v)/# I(u(t))+ 1(\|/г(t),f(t, x(t) ,u(t))) - x(t))dt + *0

+oi T,g(x,t0) ) + a r M x ,T »

при приравнивании ее нулю для произвольных вариаций &с, 5\|Г, 5и, 5ц,

5Х, Sg и 5Л; у 0 - —1.

Если в рассматриваемой задаче множество допустимых управлений замкнуто и включает только непрерывные функции u(t) и оптимальное

управление может быть на границе U, то условие — = 0 должно быть

Эи

заменено на условие вида (gгad((Я ,и - и 0)> 0 , где и — и# — направление, не выводящее из U С([/0) 7], очевидно при этом, что когда и0 —

внутренняя точка U, условие - — =0 сохраняется.

Эи Выражения, указанные звездочкой, составляют условия трансвер

сальности на правом и левом концах оптимальной траектории движе ния управляемой системы, когда эти концы свободны и момент време ни /0 фиксирован. В случае закрепления концов и момента t0 условия

трансверсальности имеют вид

* ('.)= *о, х (Т )= х т, Н(Т, х(Т), и(7), у(7)) + ЭФ^ 2 ,Г) = °-

М Т )

В названных и всех других случаях условия трансверсальности пред ставляют дополнительные условия для интегрирования системы диффе ренциальных уравнений относительно основной x(t) и сопряженной \у(0 переменных, а также для определения оптимального времени Т.

Они имеют достаточно простую геометрическую интерпретацию: векто ры у(/0) и \у(7) ортогональны к плоскостям многообразий соответствен но на моменты времени t0 и Т и направлены во внутрь этих многообра

зий. Последние формируются согласно ограничениям для левого и правого концов траектории и терминальным членам критериального функционала.

Б. П р и з а м к н у т о м м н о ж е с т в е U и содержащем кусочно непрерывные функции u(t), ta< t< ,T, вид механизма выбора лучшего

решения формально не изменяется по сравнению с приведенной записью в а), но необходимые условия оптимальности^решения

имеют принципиальное отличие [27]:	вместо условия — = 0 или
(grad„tf,ы -и°)>0 имеет место условие	Эи
(grad„tf,ы -и°)>0 имеет место условие
т ахН ((ух((),и (0 ,у Ш	h < t< T ,
UG.U

где Н — функция Понтрягина—Гамильтона.

В. Приведем здесь упрощенные варианты принципа максимума. Пусть

I(u(t)) = ^ a lul + 0 О где Ф0 — const.

/=1

Требуется найти и0, доставляющее m ax/(«(/)) при ограничениях \и\ < С/. В этом варианте выражение для функции Понтрягина—Гамиль

тона представляется первым слагаемым заданной критериальной функ ции и оптимальное управление и® = с,.signa,.

Если же требуется найти u°(t), при котором

max/(«(/)) = max f/ , (t,u(t))dt,

u(t) J

где /(«(/)) принадлежит пространству непрерывных функций на [/„, Л . а f 0(t, u(t)) — непрерывно дифференцируемая функция и -во < u(f) < °°, то

необходимое условие принципа максимума для отыскания искомого

u°(t) записывается в виде

= 0.

Эи Отметим, что выписанные в А и Б необходимые условия для выпук

лых задач выбора наилучших решений являются и достаточными. Однако при этом в общем случае решения, полученные согласно изло женным необходимым условиям могут быть оптимальными или неоп тимальными в зависимости от свойств исходных функций и данных, со ставляющих механизм выбора решений. Имеют место также задачи, для которых такие решения совсем не могут быть получены, это задачи с так называемыми (см.[28;29]> особыми (сингулярными), скользящими оптимальными управлениями и с четеринг-режимами. Соответствую щие им необходимые условия оптимальности изложены также вJ28;29].

Так, в скалярном по управлению случае при особом режиме — = 0 и Эи

э2н

— — = 0 на некотором промежутке времени из [Г0, 7], т.е. функция Га- Эи 2

мильтона стационарна и при этом ее второй дифференциал по управле нию не является отрицательно определенным; максимум функции раз мыт на допустимом множестве U. Это характерно для задач

оптимального управления, в которых - — явно не зависит от u(t), функ-

Эи

ции / 0(х(0, u(t), t) и Дх(/), «(0. 0 — линейные от управления и условие

max Н не позволяет вычислить оптимальное особое управление. Дока- u(t)eU

зано, например в [25], что необходимое условие оптимальности особого управления представляется обобщением условия Лежандра-Клебша и

записывается в виде неравенства (	э Гэ2к эя Ь о .
	Эи ,d t2k Эи

Заметим, что в математической экономике особые решения называ ют магистральными.

Рассмотрим задачу, при решении которой возникает особый режим.

Задача 1. Найти оптимальное управление u{t) е [-1, 1] и соответствующую ему траек торию движения системы из начального состояния х(/0) * *i в конечное х(Т) * х2, при ко

тором достигается минимальное значение критериального функционала

Пусть дви-

жение системы описывается уравнением x(t) = u(t)t 0

Р е ш е н и е . Согласно изложенным необходимым условиям поступаем следующим образом:

1.Составим гамильтониан

#М 0, «(/), 0 = *2(0 + V(0w(r).

2.Найдем оптимальное управление u°(t) из min Я:

l«l$i

« °(0 ■» sign у (0 при у (0 0.

Если же у(/) = 0 , то конкретное w°(0 € (-1 ,1 ) по функции Гамильтона не определяется — имеет место режим особого управления. В этом случае воспользуемся отмеченным выше условием оптимальности такого режима:

(-1)	)£ ОЛИ), 1,2,..,
	dudt2k

(известны и другие подходы к исследованию режима особого управления, изложенные в [129, 135]).

2. Вычислим	^ - 1	и для выбора w°(f) € (-1 ,1 ) при у(г) = 0 воспользуемся усло-
d t\	ди )
вием
	d_		, тогда — f ^ * 1	= у (0	= 0.
	dt	0	, тогда — f ^ * 1	= у (0	= 0.
	dt		d t\ ди )

При этом из сопряженной системы уравнений принципа максимума на отрезке времени, соответствующем режиму особого управления, имеем

у(0 =М . а»у =2JC=0 =*х= О

но выражение для вычисления оптимального управления не выявлено (оно выявляется только при вычислении производных четного порядка).

4. Вычислим * [	—^ \| = 2JC= 0= ^JC= 0, (необходимое условие оптимальности выпол-
dt2 V Эи )
нено:>: ( - 1)1— (-^r-f —	1) = 2 > 0) отсюда следует, что при у(/) = 0 получаем и°(0 и, таким

ди dt2 V <*и )

образом, вычислено оптимальное управление

ч	если	V<0,
«°(0 = 0,	если	V=0,
+1,	если	хр> 0.

5. Проинтегрируем уравнение x (t) - u { t\ 0 £ t £ T			при u°(t) и найдем отрезки непре
рывной оптимальной траектории движения системы.
5.1)	i(f) = -l=>x(f) = - f + с или дс(г) ~ ^ + jcj, где Q £ t£ t'n, ?п — первый момент вре
мени переключения управления с u°(t) = - 1 на и°(/) = 0.
5.2) х(г) = 1 =>дс(* )= -/+		d или х{Т) - х 2 ~ Т+ d	d = х2 -	Т и x(t) -	1-	Т+ х2, где
1 й Т ,	— последний	момент времени переключения		управления	с	w°(f) = 0 на
\|/ъ(0 * 1.

<<< < Предыдущая 1 2 3 4 56 / 326 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке книги