Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
10л-Гл.7-КЛАССИЧЕСКИЕ МЕТОДЫ ОПТИМИЗАЦИИ.doc
Скачиваний:
26
Добавлен:
20.11.2019
Размер:
10.42 Mб
Скачать

§7.2. Условный экстремум.

Определение условного экстремума

Первый метод нахождения условного экстремума.

Второй метод нахождения условного экстремума (метод Лагранжа)

Геометрическая интерпретация необходимых условий условного экстремума

Окаймленный гессиан

Последовательность действий при отыскании условных экстремумов функции двух переменных

Определение условного экстремума

Определение. Условным экстремумом функции называется максимум или минимум функции, достигнутый при условии, что ее аргументы связаны некоторым уравнением :

В дальнейшем экстремумы, не являющиеся условными, будем называть безусловными.

П ри нахождении условных экстремумов функции аргументы и уже нельзя рассматривать как независимые переменные. Они связаны между собой соотношением , которое называется уравнением связи.

Для пояснения различия между локальным (безусловным) и условным экстремумом рассмотрим функцию

.

Она описывает так называемый параболоид вращения и имеет безусловный минимум в точке, указанной темной стрелкой (рис. 7.7). Добавим уравнение связи (ограничение в виде равенства)

,

описывающее плоскость. Задача теперь формулируется так: найти экстремум функции , рас­смат­ри­вая среди всех значений только те, которые в совокупности образуют плоскость . Другими словами, экстремум следует искать среди точек, принадлежащих одновременно обеим поверхностям, изображенным на рис. 7.7. Эти точки образуют красную линию. Минимальное значение (условный минимум) достигается в точке, указанной белой стрелкой.

З амечание. Условный экстремум может существовать не в одной точке. В частном случае это может быть линия, как представлено на рис. 7.8. Здесь стрелкой указан дос­тигаемый на отрезке прямой условный минимум функции при дополнительном условии связи . Ло­каль­ный минимум функции также существует. Он находится в точке с координатами .

Опишем два метода поиска условного экстремума.

Первый метод нахождения условного экстремума

Пусть уравнение связи может быть разрешено относительно зависимой переменной: . Подставим функцию в исследуемую на экстремум функцию . Получим функцию одного аргумента

,

в которой учтено условие связи. Далее надо исследовать функцию на локальный экстремум, который будет являться для функции условным экстремумом.

ПРИМЕР 1. Исследовать на условный экстремум функцию при условии .

Решение. Из уравнения связи найдем и подставим в исследуемую функцию

.

Исследуем ее на экстремум:

.

Критическая точка . Вторая производная . Поэтому в точке существует минимум функции , соответственно в точке с координатами , - условный минимум функции . Его значение . На рис. 7.9 представлены описываемые обеими функциями пересекающиеся поверхности. На точку условного минимума указывает стрелка.

ПРИМЕР 2. Исследовать на условный максимум функцию при условии .

Решение. Подставим в исследуемую функцию величину из уравнения связи. Получим .

1. Если , то .

2 . Если , то , причем значение больше либо равно значению в любой точке при условии . Следовательно, 1 будет макси­мальным значением функции , аргу­менты которой связаны урав­не­нием , т.е. . Условный минимум равен нулю при . Поверхность и плоскость представлены на рис. 7.10. Линии их пересечения, где функция достигает максималь­ного значения, выделены белым цветом.

Непосредственная подстановка используется в простейших случаях. Часто подобная подстановка приводит к громоздким выражениям для исследуемой функции, или бывает невозможно решить уравнение связи относительно зависимой переменной. В этих случаях используется эффективный метод, предложенный французским математиком Жозефом Луи Лагранжем (1736-1813).

Замечание. Рассмотренная нами в последнем примере функция является обобщением двухфакторной (зависящей от двух переменных) производственной функции Леонтьева, которая имеет вид:

.

Здесь переменные полагаются неотрицательными и обозначают соответственно затраты капитала и затраты труда, параметры являются положительными и отвечают соответственно за фондоемкость продукции и трудоемкость продукции.

Второй метод нахождения условного экстремума (метод Лагранжа)

Идея метода состоит в замене функции , исследуемой на условный экстремум, на функцию, которая может быть исследована на локальный экстремум. Эта функция , называемая функцией Лагранжа, составлена из функции , функции ограничения и некоторого коэффициента , их соединяющего (множителя Лагранжа)

Варьируя величину , можно добиться совпадения условного экстремума функции со стационарной точкой функции Лагранжа.

Д ля иллюстрации сказанного рассмотрим задачу,

На рис. 7.11. изображены функции Лагранжа при различных значениях коэффициента ( ). Это параболоиды враще­ния. Кроме того, изображено множество точек в виде плоскости, а также функция (частный случай функции Лагранжа при ). Меняя , находим ту из функций , локальный экстремум которой совпадает с условным экстремумом функции .

Как видно из рисунка, это достигается при . Для лучшего обзора картины на рисунке вырезаны части параболоидов.

Перейдем к обоснованию метода. Уравнение связи определяет величину как функцию от переменной . При подстановке в исследуемую функцию получим функцию одной переменной , производная которой в точке возможного условного экстремума равна нулю, или, что равносильно этому, должен быть равен нулю дифференциал функции:

, (2)

причем отличны от нуля.

Из уравнения связи соотношение между дифференциалами аргумента и функции в любой точке, а следовательно, и в точке , определяется равенством

. (3)

Умножим равенство (3) на некоторое число (множитель Лагранжа), которое определим позже, и сложим с равенством (2)

. (4)

Слева в равенстве (4) стоит дифференциал функции , которую называют функцией Лагранжа. Равенство при изучении нами локального экстремума получалось исходя из того, что . Это давало необходимые условия локального экстремума. В рамках логической цепочки рассуждений о локальном экстремуме функции , потребуем выполнения условий в точке . С этой целью выберем множитель так, чтобы было выполнено равенство

. (5)

Тогда из соотношения получим

. (6)

Теперь можно сказать, что равенства (5) и (6) выражают необходимые условия локального экстремума в точке функции Лагранжа . Иногда говорят, что система

определяет условия первого порядка при нахождении условного экстремума.

Геометрическая интерпретация необходимых условий локального экстремума

Интересна геометрическая интерпретация решений системы. Введем векторы

и .

Из системы легко получить равенство

,

откуда следует коллинеарность векторов и . Построим фрагмент карты линий уровня функции (рис. 7.12). Пунктиром обозначен график функции . Градиенты и перпендикулярны линиям уровня в точках и соответственно. Векторы и перпендикулярны к линии также в точках и . При движении справа налево вдоль кривой пересекаются линии уровня функции , причем каждое следующее пересечение происходит с линией более низкого уровня. Градиенты и в каждой точке направлены под разными углами, как это имеет место, например, в точке . Коллинеарность векторов и возникает в точке . Следовательно, в этой точке выполнены необходимые условия локального экстремума функции Лагранжа. При дальнейшем движении вдоль кривой уравнения связи пересекаются линии более высокого уровня. Можно заключить, что в точке имеется минимум. Если бы кривая уравнения связи, выйдя из точки , продолжала пересекать линии все более низкого уровня, точка оказалась бы седловой (или точкой минимакса).

Окаймленный гессиан

Для функции Лагранжа получены необходимые условия локального экстремума. Теорема о достаточных условиях локального экстремума функции подобна ранее сформулированной теореме о достаточных условиях локального экстремума для функции , но между ними существуют отличия.

Замечание. Следует учитывать, что условный минимум функции может и не соответствовать безусловному минимуму функции Лагранжа в той же точке. Условному экстремуму с ограничением типа равенства соответствует лишь стационарность функции Лагранжа.

(об исследовании на экстремум по окаймленному гессиану)

Пусть всюду в окрестности точки :

1. определена функция ;

2. обе частные производные первого порядка непрерывны, причем ;

3. все частные производные второго порядка непрерывны;

4. дифференциалы и связаны между собой соотношением , причем ;

5. второй дифференциал в точке является знакоопределенной квадратичной формой.

Тогда функция имеет в точке локальный экстремум, а функция условный экстремум:

а) при локальный минимум,

б) при локальный максимум.

◄ Доказательство теоремы заключается в обосновании использования в данной теореме выводов ранее рассмотренной теоремы о достаточных условиях для функции при исследовании на локальный экстремум.

Уравнение связи приводит к существованию зависимости между дифференциалами и . Как известно, второй дифференциал не обладает инвариантностью формы. Поэтому выражение для требует уточнения. Найдем дифференциал от дифференциала в точке , считая зависимой переменной:

.

Здесь в силу непрерывности вторых производных, в стационарной точке . Поэтому второй дифференциал функции Лагранжа в точке будет совпадать со вторым дифференциалом функции Лагранжа двух независимых переменных

.

Следовательно, можно воспользоваться выводами о знакоопределенности и соответственно знаке по знакам угловых миноров матрицы Гессе:

1. если , функция имеет в точке минимум;

2. если , функция имеет в точке максимум.

Если сделать вывод о наличии экстремума невозможно при произвольных и , найдем из равенства и подставим в :

.

Вынесем за скобки множитель :

.

Эта формула может быть приведена к удобному для использования виду. Второй сомножитель в произведении вычисляется как определитель матрицы в точке

.

Матрица называется окаймленной матрицей Гессе, а определитель - окаймленным гессианом. Если гессиан , то , что указывает на безусловный максимум функции и условный максимум функции . Если , то . Это соответствует безусловному минимуму функции и условному минимуму функции . Обоснование закончено. ►

Замечание 1. Если , метод не работает. Поскольку точка является стационарной для функции Лагранжа, в этой точке возможен уcловный экстремум функции .

Замечание 2. Метод Лагранжа не указывает условий, при которых условный экстремум отсутствует.

Замечание 3. При составлении функции Лагранжа можно брать неопределенный множитель с любым знаком. Выбор определяется соображениями удобства.

З амечание 4. Вычисляемый неопреде­лен­ный множитель может оказаться любым действительным числом, включая иррацио­нальное число. В частном случае при условный экстремум исследуемой функции совпадает с ее локальным экстре­мумом, если таковой существует. На рис. 7.13 представлено графическое решение задачи на условный экстремум функции с уравнением связи . Линия пересечения изображена красным цветом. Стрелкой указан условный экстремум функции , совпадающий с ее локальным максимумом. Вычисленное значение множителя .

Последовательность действий при отыскании условных экстремумов функции двух переменных

Задача. Найти условный экстремум функции при наличии уравнения связи . Краткая формулировка:

(7)

Решение.

1) Составляем функцию Лагранжа .

2) Находим производные функции и приравниваем их нулю. Присоединяем уравнение связи, получая систему из трех уравнений для определения координат возможных точек экстремума и множителя Лагранжа .

3) Строим окаймленную матрицу Гессе, вычисляем окаймленный гессиан в точке и делаем вывод о наличии условного экстремума. Находим значение функции в точке условного экстремума.

ПРИМЕР. Провести исследование на условный экстремум

Решение. Составим функцию Лагранжа

и запишем систему уравнений из первых производных и уравнения связи:

(8)

Из первых двух уравнений получаем

(9)

Очевидно, что точка с координатами является решением системы (9), но не удовлетворяет последнему уравнению системы (8). Полагая теперь , разделим первое уравнение системы (9) на второе

и решим полученное уравнение. Корни уравнения . Подставив в первое или второе уравнения системы (8), найдем связь между переменными и : . Подстановка выражения в третье уравнение системы (7) дает . Соответственно . Для получим . Итак, получены четыре стационарные точки , :

, , , .

Найдем все вторые производные функции Лагранжа:

.

Составим матрицу Гессе из вторых производных

.

Подстановка любого значения множителя из приводит к равенству нулю минора . Поэтому обратимся к окаймленной матрице Гессе

.

Рассмотрим последовательно четыре стационарные точки.

1) . .

В точке достигается условный минимум .

2) . .

Здесь условный минимум .

3) . .

В точке достигается условный максимум .

4) . .

Здесь условный максимум .

Н а рисунках 7.14 и 7.15 представлено графическое решение задачи на условный экстремум.

Пересечения поверхностей изображены с двух точек обзора, отличающихся приблизительно на . Стрелками показан один из минимумов (рис. 7.14) и один из максимумов (рис. 7.15).

Для случая трех переменных исследование функции на условный экстремум при одном уравнении связи

методом Лагранжа приводит к окаймленной матрице Гессе 4-го порядка

В стационарной точке рассматриваются окаймленные гессианы 3-го и 4-го порядков, где

и .

Условия , являются достаточными для достижения в данной точке условного минимума.

Условия , являются достаточными для достижения в данной точке условного максимума.

Условие является достаточным для утверждения об отсутствии в данной точке экстремума.

Условный экстремум может существовать при наличии нескольких уравнений связи. Задача нахождения условного экстремума функции 3-х переменных с 2-мя уравнений связи формулируется следующим образом

Если решение системы из уравнений связи с последующей подстановкой результатов в исследуемую функцию затруднено, строится функция Лагранжа в виде

Необходимые условия содержат 5 уравнений c 5-ю переменными

Решив систему уравнений и найдя стационарные точки, исследуем окаймленный гессиан

.

Если в рассматриваемой стационарной точке, то достигается минимум, если , то максимум.

Условный экстремум функции n переменных с m уравнениями связи

Найдем экстремум скалярной функции векторного аргумента , аргумент которой удовлетворяет уравнению связи , представляющему собой равенство нулю векторной функции векторного аргумента. Здесь

, , причем

Задача на условный экстремум формулируется так

Будем полагать, что производные , непрерывно дифференцируемы по вектору , градиенты функции линейно независимы

при одновременно, где

Составим функцию Лагранжа

.

где , скалярное произведение вектор-множителя Лагранжа на вектор-функцию ограничений.

Рассмотрим векторную систему

которая состоит из двух векторных равенств с двумя векторными переменными и и содержит в координатах векторов равенств с переменными. Из первых n равенств с переменными выберем m соотношений (например, первые m равенств) и подберем для них m координат вектора так, чтобы правые части равенств обратились в нуль.

Подобрать соответствующие m значений можно, используя правило Крамера

Определитель в силу линейной независимости столбцов определителя (независимости градиентов функции ).

Значения подставим в следующие соотношений 1-го векторного равенства и потребуем обращения их в нуль. Эти равенства составят уравнений для переменных Добавим m уравнений связи. Получится система из n уравнений с n переменными для нахождения координат вектора

Подобный алгоритм нахождения позволяет утверждать, что в формуле разложения функции Лагранжа в ряд Тейлора в окрестности точки

1-й дифференциал функции Лагранжа обращается в нуль. Действительно,

Поведение приращения функции Лагранжа будет определяться вторым дифференциалом . Следовательно, в точке разыскивается локальный экстремум функции Лагранжа, а значит, условный экстремум функции .