Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Zhadan_lektsii_6_semestr

.pdf
Скачиваний:
23
Добавлен:
03.06.2015
Размер:
10.08 Mб
Скачать

В качестве внешних свертывающих функций могут использоваться,например, следующие функции:

 

 

 

B(g) = g+ p,

 

1

g+ pp,

 

(113)

 

 

 

B(g) =

 

 

 

 

 

p

 

где á p p-я гельдеровская норма, 1 ≤ p < ∞,

и

 

 

 

 

 

 

 

 

g+ = [g+1 , . . . , g+m], g+i

= max[0, gi],

 

1 ≤ i ≤ m.

 

 

Обе функции(113)являются неубывающими на

 

R

m

,

т . е . из ≥

g1

следует,что

B(g2m

1

 

 

 

 

 

 

 

g2

 

)

.Вторая из них является непрерывно дифференцируемой функцией

)

B(g

 

 

 

 

 

 

 

 

 

 

на R .Параметр p у первой функции можно полагать также равным +∞.

Беря внешнюю свертывающую функцию B(g), получаем внешний штраф ψ(x) =

B(g(x)).Подставляя этот внешний штраф в(112),приходим к

внешней штрафной

функции

(114)

P (x, t) = f(x) + tB(g(x)).

Обозначим через X (t) множество точек,доставляющих минимум функции P (x, t) на Rn при фиксированном значении коэффициента штрафа t, т . е . множество

X (t) = Arg minn P (x, t).

x R

Определение16. Функция P (x, t) называется точной внешней штрафной функцией для задачи(109),если существует такое множество T значений коэффициента штрафа t, что X (t) = X при t T .

Составим для задачи(109)функцию Лагранжа

 

L(x, u) = f(x) + g(x), u , u R+m.

 

Точка [x , u ] является седловой точкой функции Лагранжа,если

(115)

L(x , u) ≤ L(x , u ) ≤ L(x, u ) x Rn, u R+m.

Как следует из утверждения теоремы ??,если у функции Лагранжа существует седловая точка [x , u ], то точка x является решением задачи(109).При этом f =

L(x , u ).

Теорема10. Пусть в задаче(109)существует седловая точка

[x , u ] функции

Лагранжа.Пусть,кроме того,внешняя свертывающая функция

B(g) такова,что

0 < B0(u ) < +∞.

 

Тогда P (x, t) точная штрафная функция для задачи (109) и

 

T = {t R : t > B0(u )}.

 

61

Доказательство. Имеем из правого неравенства в определении(115)седловой точки

f = f(x ) = L(x , u ) ≤ L(x, u ) = f(x) + g(x), u .

(116)

Воспользуемся неравенством Минковского-Малера( ??),чтобы оценить скалярное произведение в правой части(116).Тогда

f ≤ f(x) + g(x), u ≤ f(x) + B(g(x))B0(u ).

Так как функция B(g(x)) неотрицательна на Rn, то беря t ≥ t = B0(u ) получаем f ≤ f(x) + B(g(x))B0(u ) ≤ f(x) + tB(g(x)) = P (x, t).

Таким образом, P (x, t) ≥ f для всех x Rn и любого t ≥ t .

Но B(g(x )) = 0, так как x X. В этом случае ,P (x , t) = f(x ) = f . Отсюда заключаем,что x X (t) и,стало быть, X X (t) для любого t ≥ t .Это в частности означает,что

P (x, t) = f x X (t), t ≥ t .

(117)

Покажем,что при t > t множества X и X (t) совпадают.Доказательство проведем от противного:предположим,что существует t1 > t и x¯ X (t1) такие,что x¯ / X . Точка x¯ не может принадлежать допустимому множеству X, так как иначе из(117)следовало бы,что f(¯x) = f .Поэтому обязательно x¯ / X.Но тогда

f = f(¯x) + t1B(g(¯x)),

(118)

причем B(g(¯x)) > 0.

Возьмем теперь t < t2 < t1. Так как t1 > t , то такое t2 всегда найдется.Тогда на основании(118

P (¯x, t2) = f(¯x) + t2B(g(¯x)) < f(¯x) + t1B(g(¯x)) = f ,

что противоречит сказанному выше.Таким образом,действительно имеет место совпадение множеств X (t) и X при t > t .

Если внешняя штрафная функция P (x, t) имеет вид

P (x, t) = f(x) + t g+(x) p, 1 ≤ 1 < ∞,

то B(g) = g+ p. Тогда , как следует из (16),B0(u ) = u p , где числа p и p связаны соотношением p−1 + p−1 = 1. Таким образом ,P (x, t) является точной внешней

штрафной функцией при t > B0(u ).

Отметим также,что для того,чтобы внешняя штрафная функция P (x, t) вида (114)была бы точной для задачи(109),в общем случае требуется,чтобы она была негладкой.

Опишем теперь основной вариант метода внешней штрафной функции,не предполагая,что P (x, t) является обязательно точной внешней штрафной функцией.

62

Алгоритм метода внешних штрафных функций. Задаем монотонно возрастаю -

щую последовательность коэффициентов штрафа tk → +∞ и полагаем k = 1. Шаг 1. Решая задачу безусловной минимизации

min P (x, tk),

(119)

x Rn

 

находим точку xk X (tk).

Шаг 2.Полагаем k := k + 1 и идем на шаг 1.

Если все задачи безусловной минимизации(119)имеют решения,то в результате работы алгоритма получается последовательность точек {xk}. Желательно , чтобы эта последовательность имела предельные точки и чтобы каждая предельная точка x была бы решением задачи(109).

Рассмотрим вопрос о сходимости метода внешних штрафных функций.Предположим,что все множества X (t) при t ≥ 0 принадлежат ограниченному множеству W . Данное условие заведомо будет выполняться,если существует такая точка x¯ Rn, что множество L(¯x) = {x Rn : f(x) ≤ f(¯x)} ограничено.Тогда последовательность {xk} принадлежит W и,следовательно,имеет предельные точки.

Теорема11. Пусть x предельная точка последовательности {xk}. Тогда

x X и

lim P (xk, tk) = f(x ) = f .

 

 

(120)

 

 

 

 

k→∞

 

 

 

 

 

 

 

Доказательство. Не умаляя общности,считаем,что сама последовательность

{xk} является сходящейся,т.е.

x = limk→∞ xk.

 

 

 

Учтем,что P (x, t) = f(x),

когда x X. Учтем также , чтоP (x, tk) → ∞,

когда

x / X и tk → ∞. Тогда

 

 

 

 

 

 

 

 

minx Rn limtk→∞ P (x, tk)

=

minx X limtk→∞ P (x, tk) =

 

 

 

=

minx X f(x) = limtk→∞ minx X f(x) =

 

 

 

=

limtk→∞ minx X P (x, tk) ≥

 

Отсюда,в частности,следует

≥ limtk→∞ minx Rn P (x, tk) = limk→∞ P (xk, tk).

 

 

 

 

 

x X

 

 

(121)

 

k→∞

k

k

)

.

 

lim P (x

, t

min f(x) = f

 

Покажем,что

x X.Действительно,в противном случае ψ(x ) > 0 и,в си-

лу непрерывности,найдется такое

c > 0, что ψ(xk) ≥ c для достаточно больших

номеров k.Но последовательность

{|f(xk)|} ограничена,поскольку ограничена по-

следовательность {xk} и функция f(x) непрерывна.Поэтому

 

klim P (xk, tk) = klim [f(xk) + tkψ(xk)] ≥ klim [f(xk) + ctk] = +∞.

 

→∞

→∞

 

 

 

 

→∞

 

 

 

63

Но это противоречит неравенству(121).

Наконец,из неотрицательности функции ψ(x) и непрерывности f(x) следует

klim P (xk, tk) = klim [f(xk) + tkψ(xk)] ≥ klim f(xk) = f(x ).

→∞

→∞

→∞

Таким образом,

f ≥ lim P (xk, tk) ≥ f(x ).

k→∞

Но x X. Отсюда , посколькуf(x ) ≥ f , заключаем , чтоf(x ) = f и имеет место предельное равенство(120).

Предположим,что в задаче(109)имеется седловая точка.Тогда,используя функцию,сопряженную к функции B(g), получаем с помощью неравенства Юнга - Фенхеля

f = f(x ) = L(x , u ) ≤ L(x, u ) =

 

=

f(x) + g(x), u ≤

(122)

≤ f(x) + tB(g(x)) + (tB) (u ) =

 

=

P (x, t) + (B t)(u ).

 

Здесь (B t)(u) функция B (u), умноженная справа на константу t > 0.По определению такой операции (B t)(u) = tB (u/t).

Неравенство(122)справедливо для любого x Rn.Перепишем его в виде

(123)

P (x, t) ≥ f − (B t)(u ).

Обозначим правую часть этого неравенства через q(t). Так как она не зависит от x, то из(123)получаем

min P (x, t)

 

f

(B t)(u

) = q(t).

 

x Rn

 

 

≥ −

 

 

 

 

 

 

 

Возьмем в качестве B(g) функцию

 

 

 

 

 

 

 

B(g) =

1

g+ pp, 1 < p < ∞.

 

 

 

 

p

 

Тогда

1

 

 

 

 

 

 

 

 

 

B (u) =

 

u pp , p−1 + p−1 = 1

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и,поскольку 1 < p < ∞, то для оценки снизу q(t) имеем: q(t) < f и

 

q(t) = f −

u pp

 

→ f

 

 

p t(p −1)

 

 

при t → ∞.

 

 

 

 

 

 

 

 

 

 

 

 

В частном случае , когдаp = 2, функция P (x, t) принимает вид

 

P (x, t) = f(x) +

t m

 

g+i (x)

2 ,

(124)

 

i

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

64

а оценка q(t) с учетом того , чтоp = 2 при p = 2, становится равной

q(t) = f

1

u 22

.

 

 

2 t

Функция(124)носит название квадратичной штрафной функции. Она являет - ся одной из основных вспомогательных функций,применяемой в методах внешних штрафных функции.

К достоинствам метода внешних штрафных функций следует отнести также то, что он применим для решения задач,содержащих помимо ограничений типа нера-

венства также ограничения типа равенств

: g(x) ≤ 0m, h(x) = 0l},

(125)

x X

X = {x R

n

min f(x),

 

 

 

 

где h : Rn → Rl.Для этой задачи квадратичная штрафная функция принимает вид

 

 

m

 

 

 

l

 

 

t

i

2

 

 

P (x, t) = f(x) +

2

=1

g+i (x)

 

 

+ j=1

|hj(x)|2 .

Заметим также,что если в задаче дополнительно присутствуют ограничения простого вида x Π, например , допустимое множествоX задается следующим образом:

X = {x Π : g(x) ≤ 0m, h(x) = 0l},

то целесообразно не включать это ограничение в число общих функциональных ограничений,а вспомогательную задачу минимизации функции P (x, tk) на всем пространстве Rn заменить на задачу ее минимизации на множестве Π, т . е . вместо (119) решать задачу

min P (x, tk).

x Π

Все основные свойства алгоритма метода внешних штрафных функций при этом сохраняются.

Методы внутренних штрафных функций.

Методы внутренних штрафных функций(называемые также методами барьерных функций)применяются только для решения задач с ограничениями типа неравенства,т.е.для задач вида(109).Пусть

X0 = {x Rn : g(x) < 0m} .

Считаем,что множество X0 не пусто и что X0 = intX.Из этого предположения следует,чтоcl X0 = X.

Относительно последовательности функций {δk(x|X)} теперь будем предполагать,что каждая функция δk(x|X) является непрерывной и определена на Rn, но конечные значения принимает только на X0. Таким образом ,

65

1.δk(x|X) < +∞ для всех x X0;

2.δk(x|X) = +∞ для всех x / X0;

Кроме того,наложим на {δk(x|X)} следующие требования:

3. limk→∞ k(x|X)| = 0 для всех x X0;

4. если {δk(x)} последовательность неотрицательных на X0 функций,то δk(x|X) > δk+1(x|X) для любого x X0.

Согласно этим условиям δk(¯x|X) = +∞ для всех x¯ ∂X,причем выполняется предельное равенство

lim δk(x|X) = +∞.

x→x,¯ x X0

Поэтому аппроксимация функции δ(x|X) последовательностью функций {δk(x|X)} осуществляется только с точностью до границы,так как

lim δk(x|X) = δ(x|X), x X \ X0.

k→∞

Определение17. Внутренним штрафом или барьером будем называть непрерывную функцию ψ(x) такую,что ψ(x) < +∞ тогда и только тогда,когда x X0

и limx→x,¯ x X0 ψ(x) = +∞, если x¯ ∂X.

Используя барьер,можно построить внутреннюю штрафную функцию(барьерную функцию) в виде

P (x, t) = f(x) + tψ(x),

где t > 0 коэффициент внутреннего штрафа . Обозначим теперь

X (t) = Arg min P (x, t).

x X0

Алгоритм метода внутренних штрафных функций(метода барьерных функ-

ций).Задаем монотонно убывающую последовательность коэффициентов tk → +0 и полагаем k = 1.

Шаг 1.

Решаем вспомогательную задачу

min P (x, tk)

(126)

x X0

 

и находим точку xk X (tk).

Шаг 2.Полагаем k := k + 1 и идем на шаг 1.

В результате работы алгоритма получаем последовательность точек {xk} X0. Если она ограничена,то имеет предельные точки x X.

66

Далее будем предполагать,что X компактное множество . Тогда точкиxk X (tk) существуют и xk X0.Считаем также для простоты,что ψ(x) ≥ 0 для всех

x X0.

Теорема12. Любая предельная точка x последовательности {xk} есть решение задачи(109)и

lim P (xk, tk) = f(x ) = f .

k→∞

Доказательство. Не ограничивая общности,считаем,что последовательность {xk} является сходящейся.Тогда xk → x . Так как X замкнутое множество,то x

X.

Если x / X , то из предположения clX0 = X следует,что найдется y X0 такое, что f(y) < f(x ) и,стало быть,

f(y) < lim f(xk).

 

k→∞

 

Поэтому можно указать такое δ > 0, что

 

f(y) < f(xk) − δ

(127)

для k достаточно больших.Поскольку ψ(x) ≥ 0,то из(16)вытекает

 

f(y) < f(xk) − ε + tkψ(xk) = P (xk, tk) − δ

 

для этих же k.

 

Но для y X0 в силу того , что

 

lim tkψ(y) = 0,

 

k→∞

 

имеет место равенство

(128)

lim P (y, tk) = f(y).

k→∞

 

Отсюда получаем,что для достаточно больших k выполняются неравенства

 

P (y, tk) < P (xk, tk),

(129)

что противоречит определению точки xk X (tk), поскольку y X0. Таким образом ,

x X .

Далее,опять же в силу определения точек xk X (tk)

P (xk+1, tk+1) = f(xk+1) + tk+1ψ(xk+1) ≤

f(xk) + tk+1ψ(xk) ≤

f(xk) + tkψ(xk) = P (xk, tk),

т.е.последовательность {P (xk, tk)} является монотонно невозрастающей.Но она ограничена снизу,поэтому существует предел

lim P (xk, tk) = P ≥ f .

k→∞

67

Покажем,что строгое неравенство P > f невозможно и на самом деле имеет место равенство P = f .Действительно,иначе нашлись бы такие ε > 0 и δ > 0, что

y ∆ε(X ) ∩ X0 и

P (xk, tk) > f(y) + δ

для k достаточно больших.Но согласно(128)

δ

P (y, tk) = f(y) + tkψ(y) ≤ f(y) + 2,

если k достаточно большое.Отсюда и из(129)

δ

P (xk, tk) > P (y, tk) + 2

для этих k, что невозможно в силу определения точек xk.

Встает вопрос,как строить внутренние штрафы ψ(x)? Будем поступать аналогич - но,тому,как это делалось в методе внешних штрафных функций,используя аппарат свертывающих функций.

Пусть Rm−− обозначает внутренность ортанта Rm.Пусть,кроме того, Rø обозначает расширенную прямую,т.е.прямую R, пополненную элементами ±∞.

Определение18. Функция B(g) : Rm → Rø называется внутренней свертываю-

щей функцией,если она непрерывна на Rm и B(g) < +∞ при g Rm−− и B(g) = +∞ при g / Rm−−.

В качестве примера внутренних свертывающих функций приведем следующую функцию

1

g− pp, g R−−m ,

(130)

B(g) = −p

где −∞ < p < 0 и gотрицательная срезка вектора g Rm, т . еgi. = min[gi, 0]

для всех 1 ≤ i ≤ m.Когда g / Rm−−, полагаем :B(g) = +∞. Разумеется функция g p при p < 0 уже нормой не является,однако для однообразия обозначений знак нормы здесь сохранен.

Если воспользоваться функцией g 0, определенной как

 

=

 

 

m

|gi|

1/m

 

 

 

 

 

g 0

 

 

, g Rm,

(131)

m

=1

 

 

 

 

i

 

 

то приходим к внутренней свертывающей функции,дополняющей семейство функции(130)при значении параметра p = 0:

B(g) = −ln ( g− 0) − 12, g Rm−−.

Здесь опять же считается,что B(g) = +∞ при g / Rm−−.

68

Использую внутренние свертывающие функции,строим внутренние штрафные функции в виде

P (x, t) = f(x) + tB(g(x)).

В частном случае,беря внутреннюю свертывающую функцию(130)при значении параметра p = −1, приходим к внутренней штрафной функции

m

 

 

 

i

1

 

, x X0,

P (x, t) = f(x) + t

 

g(x)

=1

 

 

 

 

которая носит название обратной барьерной функции.

Аналогичным образом,используя внутреннюю свертывающую функцию(131),то получаем другую внутреннюю штрафную функцию

 

t

m

 

 

 

t

1

 

 

 

 

i

 

 

 

 

 

 

 

(132)

P (x, t) = f(x) −

m

=1

ln −gi(x)

 

2

ln m −

2

, x X0.

 

 

 

 

 

 

 

 

 

 

Если опустить константы,которые не влияют на решение вспомогательных задач мининимизации(126),то функция(132)перепишется как

m

 

 

i

P (x, t) = f(x) − t

ln −gi(x) , x X0.

=1

 

 

Данную функцию принято называть логарифмической барьерной функцией.

Получим оценки оптимального значения

вспомогательной функции M(x, y)

в задаче минимизации (126) в предположении , что в задаче нелинейного программи - рования(109)существует седловая точка [x , u ] функции Лагранжа.Вновь применяя неравенство Юнга-Фенхеля,как и в(122)приходим к оценке

min P (x, t)

f

(B mt)(u

) = q(t).

x X0

 

 

R

 

 

 

Пусть функция B(g) имеет вид(130),где

−∞ < p < 0. Тогда имеем

 

t

 

u

 

p

 

t1−p

p

q(t) = f +

 

 

 

p

= f +

 

u p ,

p

t

p

 

 

 

 

 

 

 

 

 

 

 

 

(133)

(134)

где p−1 + p−1 = 1. Так как p < 0, то 0 < p < 1.Поэтому,в силу(134),нижняя оценка превышает f и стремится к f при p → 0. В частном случае при p = −1 для обратной барьерной функции P (x, t) получаем,что

m

 

q(t) = f + 2t ui .

(135)

i=1

В случае , когдаp = 0, для общей логарифмической барьерной функции (132)

69

имеем соответственно

 

 

 

 

m

 

 

 

 

 

x X0

 

i

 

(136)

=1

min q(t) = f

+ t

(ln m + 1) /2 +

 

 

ln ui

/m

 

ln t

 

и,следовательно,нижняя оценка q(t) опять стремится к f при t → +0. Оценка (136) в отличие от (135) справедлива только если u > 0m, т . е . если в решении задачи (109)

точке x все ограничения активны.

Восновном методы внутренних штрафных функций применяются в тех случаях, когда целевая функция f(x) не определена за пределами допустимого множества X. В последнее время идеи методов внутренних штрафных функций нашли широкое применение в так называемых методах внутренних точек,разработанных для решения задач линейного программирования,а также для решения более общих задач выпуклой минимизации.

1.6.2.Метод параметризации целевой функции

Метод параметризации целевой функции(называемый также методом нагруженного функционала,методом вешних центров,методом Моррисона)близок по своим свойствам к методу внешних штрафных функций.Рассмотрим опять для простоты задачу нелинейного программирования с ограничениями типа неравенства

f = x X

X = {x R

n

: g(x) ≤ 0n} .

(137)

min f(x),

 

 

 

 

Считаем,что задача имеет решение и обозначим через X множество ее решений. Пусть η оценка снизу оптимального значения целевой функции f .Если η < f ,

то система неравенств

f(x) − η ≤ 0, g(x) ≤ 0m

не имеет решения.Поэтому,беря произвольный внешний штраф ψ(x), например , ψ(x) = B(g(x)), где B(g) внешняя свертывающая функция,а также квадратичный внешний штраф для первого неравенства (f(x) −η)2+, приходим к тому , что функция

M1(x,η ) = (f(x) − η)+2 + B(g(x))

(138)

принимает для всех x Rn только положительный значения как,впрочем,и функция

M2(x,η ) = (f(x) − η)2+ + B+2 (g(x)) > 0.

Введем сначала в рассмотрение вспомогательную функцию

 

 

 

M(x,η ) = (f(x) − η)+2 + B+2 (g(x)),

(139)

где x Rn и η R.Для данной вспомогательной функции поставим задачу без-

70

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]