- •1.1.2. Условия лежандра
- •1.1.5. Функционалы со многими неизвестными
- •1.1.9. Задачи нл условный экстремум
- •1.1.10. О решении задач оптимального управления вариационными методами
- •1.2. Метод динамического программирования
- •1.2.1. Принцип оптимальности
- •1.2.2. Одномерная дискретная задача и вычислительные аспекты метода
- •1.2.3. Метод динамического программирования в непрерывной задаче. Уравнение беллмана
- •1.3. Принцип максимума понтрягина
- •1.3.1. Игольчатая вариация и условия оптимальности
- •1.3.2. Система сопряженных уравнений
- •1.3.3. Обобщения. Обсуждение результатов
- •Неавтономный объект с закрепленными концами траектории и фиксированным временем управления
- •Неавтономный объект с закрепленными концами траектории и нефиксированным временем управления
- •Неавтономный объект со свободным правым концом траектории и нефиксированным временем управления
- •Оптимальное управление автономными объектами
- •1.3.4. Вычислительные аспекты принципа максимума
1.1.5. Функционалы со многими неизвестными
В ряде задач критерием оптимальности является функционал вида
(1.11)
зависящий от функций одного аргумента и их производных. Заданы координаты граничных точек . Требуется в классе найти функции , проходящие через граничные точки и доставляющие минимум функционалу, т. е. удовлетворяющие вариационной задаче
(1.12)
При выводе необходимого условия минимума варьируется одна из неизвестных функций, а остальные считаются фиксированными. Тогда, используя операции, применяемые при выводе уравнения Эйлера, приходим к уравнению Эйлера относительно варьируемой функции. Если такие же рассуждения повторить относительно каждой остальной неизвестной функции, получим систему уравнений Эйлера
(1.13)
которая формирует совокупность необходимых условий решения задачи (1.12). Экстремали, соответствующие системе (1.13), содержат постоянных интегрирования, находящихся из заданных граничных условий.
Условия Лежандра формулируются следующим образом. Составляется матрица
Для достижения на некоторой совокупности экстремалей минимума необходимо, чтобы все угловые миноры этой матрицы были неотрицательны, т. е.
(1.14)
где — символ определителя. Для достижения максимума неравенства должны иметь противоположный знак. Функционал (1.11) может содержать производные высших порядков. В этом случае система (1.13) будет содержать в своем составе уравнения Эйлера — Пуассона, а граничные условия должны быть заданы в соответствии с числом постоянных интегрирования, входящих в решение этой системы.
Пример 1.5. Пусть в трехмерном пространстве заданы две точки: и . Требуется найти уравнения кривой , которая соединяла бы эти две точки и имела наименьшую длину (интуитивно ясно, что получим прямую линию).
Длина кривой в трехмерном пространстве
Минимизируем последнее выражение по в соответствии с (1.13). Система уравнений Эйлера сводится к виду
где — некоторые константы. Разделив одно уравнение на другое, выразим , что позволяет первое уравнение преобразовать к виду . Аналогично . Следовательно, экстремали , т. е. экстремали действительно являются прямыми. Постоянные интегрирования находятся из условия прохождения экстремалей через заданные граничные точки.
Элементы матрицы Г, участвующие в формировании условий Лежандра, будут
В результате в соответствии с (1.14) устанавливаем
Таким образом, необходимые условия показывают, что найденные экстремали действительно имеют наименьшую длину.
1.1.9. Задачи нл условный экстремум
В вариационных задачах, возникающих при решении различных технических проблем, минимизируемый функционал, как правило, зависит от нескольких неизвестных функций, связанных друг с другом некоторыми соотношениями (уравнениями связей). Поэтому такие задачи принято называть задачами на условный экстремум.
Изучаемая в вариационном исчислении задача на условный экстремум формулируется следующим образом. Рассматривается функционал
(1.32)
зависящий от выбора функций . Заданы граничные условия и уравнения связей между переменными. Последние могут быть заданы тремя формами: алгебраическими и дифференциальными уравнениями и интегральными соотношениями соответственно:
(1.33)
(1.34)
(1.35)
Во всех случаях , причем в (1.33) и (1.34) число ограничений в уравнениях связи меньше числа неизвестных, . Это нужно для того, чтобы часть общего потенциала, которым обладает система функций , можно было использовать для удовлетворения уравнений связей, а оставшуюся часть направить па минимизацию функционала (1.32). Вариационная задача сводится к поиску в классе таких проходящих через заданные граничные точки функций , при которых функционал достигает наименьшего значения и удовлетворяются уравнения связей, т. е. среди всевозможных решений уравнений связей нужно отыскать то, на котором функционал достигает минимума. Граничные условия при этом не должны противоречить уравнениям связей. Задачу при ограничениях в форме алгебраических уравнений (1.33) называют геодезической. Если уравнения связей являются дифференциальными [случай (1.34)], то имеем общую задачу Лагранжа. Задачу при ограничениях в форме интегральных соотношений (1.35) называют изопериметрической. Из всех трех наиболее общей является задача Лагранжа, а остальные могут быть получены как частный случай задачи Лагранжа.
Решение задач на условный экстремум проводят с использованием метода неопределенных множителей Лагранжа, который мы изложим без доказательства. Составляется вспомогательный функционал
(1.36)
где — неопределенные множители Лагранжа.
Этот функционал, зависящий от функций и функций , исследуется на безусловный экстремум. Последнее возможно потому, что функции благодаря введению неизвестных функций могут варьироваться независимо. Для решения задачи относительно переменных составляется система уравнений Эйлера
(1.37)
которая решается совместно с уравнениями связей (1.33) в случае геодезической задачи, (1.34) в случае общей задачи Лагранжа, (1.35) в изопериметрической ситуации. В результате образуется замкнутая система из уравнений, содержащая такое же количество неизвестных . Этой системы совместно с имеющимися граничными условиями достаточно для нахождения всех неизвестных.
Заметим, что в случае изопериметрической задачи множители Лагранжа являются не функциями аргумента , а неизвестными величинами. Для этой задачи свойствен принцип взаимности: если функция доставляет экстремум функционалу при заданном значении функционала , то та же функция доставляет экстремум функционалу при фиксированном значении функционала .