- •Элементы выпуклого анализа.
- •Начальные сведения о численных методах оптимизации.
- •4.Сходимость методов оптимизации.
- •5.Метод покоординатного спуска.
- •6.Метод случайного поиска. Алгоритм с возвратом при неудачном шаге.
- •7. Метод случайного поиска. Алгоритм наилучшей пробы.
- •8. Метод случайного поиска. Алгоритм статистического градиента.
- •9. Метод случайного поиска. Алгоритм покоординатного обучения.
- •10. Градиентный метод. Метод с постоянным шагом.
- •11. Градиентный метод. Метод с дроблением шага.
- •12. Градиентный метод. Метод наискорейшего спуска.
- •13. Метод Ньютона
- •14. Численные методы решения задач линейного программирования. Прямой симплекс-метод. Базис и базисное решение.
- •15. Численные методы решения задач линейного программирования. Прямой симплекс-метод. Элементарные преобразования. Симплекс-таблицы.
- •16. Численные методы решения задач линейного программирования. Прямой симплекс-метод. Алгоритм симплекс-метода.
- •17. Численные методы решения задач линейного программирования. Модифицированный симплекс-метод.
- •18. Численные методы решения задач линейного программирования. Лексикографический прямой симплекс-метод
- •19. Численные методы решения задач линейного программирования. Двойственный симплекс-метод.
- •20. Численные методы решения задач линейного программирования. Двойственный симплекс-метод.
- •22. Численные методы решения задач линейного программирования. Геометрическая интерпретация задач линейного программирования
- •23. Численные методы решения задач линейного программирования. Геометрическая интерпретация прямого симплекс-метода.
- •24. Численные методы условной оптимизации. Метод возможных направлений.
- •25. Численные методы условной оптимизации. Метод Келли и метод секущих плоскостей.
- •26. Численные методы условной оптимизации. Первый (циклический) алгоритм Гомори.
- •27. Численные методы условной оптимизации. Метод ветвей и границ
- •28. Численные методы условной оптимизации. Метод ветвей и границ для решения задач нелинейного программирования
- •29. Численные методы условной оптимизации. Метод внешних штрафов
- •30.Численные методы условной оптимизации. Метод внутренних штрафов или метод барьерных функций
- •31.Муравьиный алгоритм.
- •32.Генетические алгоритмы.
- •33.Задачи классического вариационного исчисления. Постановка задачи классического вариационного исчисления
- •Сильный и слабый экстремум в задачах классического вариационного исчисления.
- •Допустимые управления и управляемые процессы в задачах оптимального управления. Оптимальные процессы
- •Элементарный вывод необходимых условий экстремума для простейших задач классического вариационного исчисления
- •Задачи оптимального управления. Постановка задачи оптимального управления
- •Формулировка принципа максимума для линейной задачи быстродействия
- •Доказательство принципа максимума для линейной задачи быстродействия.
- •Достаточность принципа максимума
Задачи оптимального управления. Постановка задачи оптимального управления
В середине прошлого века в вариационном исчислении появился новый класс экстремальных задач – задачи оптимального управления. Одно из отличий этих задач от задач классического вариационного исчисления – наличие переменных, которые не обладают необходимой гладкостью и могут быть разрывными. Необходимое условие экстремума для задач этого класса имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа. В качестве обязательного условия в решение задачи оптимального управления входит решение вспомогательной задачи на максимум. Отсюда и возникло название этого необходимого условия экстремума – принцип максимума.
Приведем формальную постановку задачи оптимального управления:
Найти среди всех допустимых управлений, переводящих фазовую точку из положения х0 в положение x1 , такое, для которого функционал
принимает наименьшее значение.
Функция f0 непрерывная по переменным x и u, непрерывно дифференцируемая по переменной x.
Управление u(·) , на котором достигается оптимальное значение данной задачи, называется оптимальным управлением, а соответствующая траектория x(t) – оптимальной траекторией. В этом смысле основная задача – найти оптимальные управления и соответствующие оптимальные траектории, другими словами, найти оптимальный управляемый процесс.
Для J = t1 – t0 оптимальность управления u(t) эквивалентна минимизации времени перехода из положения x0 в положение x1. Задача отыскания оптимальных управлений и траекторий в этом случае называется задачей об оптимальном быстродействии.
Формулировка принципа максимума для линейной задачи быстродействия
Пусть H(x,u,P) = (P, f(x,u)) – функция Понтрягина, а
сопряженная система уравнений для соответствующей пары (x(t), u(t)). Эта система линейна и однородна. Поэтому при любых начальных условиях для Pk, k=1,…,n, существует единственное решение этой системы, определенное на всем отрезке, на котором определены управление u(t) и траектория x(t). Функции P1(t),…,Pn(t) непрерывны и имеют всюду, кроме конечного числа точек разрыва управления u(t), непрерывные производные по t.
Теорема 1 (принцип максимума). Пусть
это оптимальный управляемый процесс. Тогда существует ненулевая непрерывная вектор-функция P(t)= (P1(t),…,Pn(t)) такая, что справедливы следующие утверждения:
Теорема 2 (принцип максимума для линейной задачи быстродействия). Пусть
это оптимальный управляемый процесс. Тогда существует такое непрерывное нетривиальное решение P(t) сопряженной системы = - PA, что справедливо
Доказательство принципа максимума для линейной задачи быстродействия.
Введем понятие сферы достижимости. Пусть 0 > T – верхняя граница на длины интервалов, на которых будут рассматриваться управления. Будем говорить, что точка x принадлежит сфере достижимости, если на интервале [t0, t1] существует допустимое управление u(t) и соответствующая ему траектория x(t) такие, что x(t0) = , x(t1) = 0, t1 – t0 ≤ T.
Лемма 1. Сфера достижимости VТ является выпуклым множеством.
Доказательство. Пусть , VT. По определению это означает, что существует допустимое управление , t [t0, ] , где ≤ t0 + T, которое переводит фазовую точку x из положения в точку 0. Аналогично, существует допустимое управление , t [t0, ], где ≤ t0 + T, которое переводит фазовую точку x из положения в точку 0.
Можно считать, что = t0 + T . В противном случае решим систему = f(x, u(t)) с начальным условием ( ) = 0, доопределив управление (t) как показано на рисунке.
Получим, что (t) = 0 на интервале [ t0 + T]. Аналогично, для (·) и (·) можно считать, что = t0 + T. Пусть y0 = λ + (1-λ) , 0≤λ≤1. Тогда управление u*(t)= λ (t) + (1-λ) (t), определенное на интервале [t0, t0 + T], является допустимым управлением. Ему соответствует траектория x*(t) = λ (t) + (1-λ) (t), по которой фазовая точка переходит из начального положения x*(t0) = λ + (1-λ) = y0 в конечное положение x*(t0 + T) = 0.
Лемма 2. Если x0 – внутренняя точка VT , то из x0 можно перейти в точку 0 за время строго меньше T .
Доказательство. Рассмотрим произвольную точку x0 IntVT. Из определения внутренней точки следует, что существует шар B(x0, r) VT. Так как из леммы 1 следует, что множество VT выпукло, то по лемме Каратеодори существуют (n+1) точки z1,…,zn+1, расположенные внутри шара и такие, что симплекс, образованный ими, содержит x0 строго внутри. Следовательно, в силу непрерывности расстояния найдутся достаточно малые окрестности точек zj из VT, такие, что симплекс, образованный этими точками из сферы достижимости, содержит x0. Тогда по определению множества VТ cуществуют допустимые управления us(t) на интервале [t0, t0 + T] такие, что xs(t0) = ys, xs(t0 + T) = 0, s=1,…,n+1. Так как функции xs(t) непрерывны, то существует ɛ > 0, для которого x0 IntCo{x1(t0 +ɛ),…,xn+1(t0 + ɛ)}. Но все точки xs(t0 + ɛ), s=1,…,n+1 лежат в сфере достижимости VT-ɛ. Это означает, что x0 VT-ɛ.
Лемма 3. Пусть u(t) – допустимое управление на интервале [t0 ,t1], x(t) – соответствующее решение, P(t) – произвольное решение сопряженной системы = - PA на данном интервале. Тогда во всех точках непрерывности управления u(t) справедливы следующие равенства:
P(t1)x(t1) – P(t0)x(t0) = .
Доказательство. = (t)x(t) + P(t) (t) = -P(t)(Ax(t)+Bu(t)) = P(t)Bu(t). Перейдем к доказательству принципа максимума, то есть докажем, что оптимальное управление удовлетворяет P(τ)Bu*(τ) = , τ [to,t1].
Пусть u(t) – оптимально управление на интервале [t0, t1], x(t0) = x0, x(t1) = 0. Положим, T = t1 – t0. Из леммы 2 следует, что x0 – граничная точка сферы достижимости VT. Следовательно, по теореме отделимости существует вектор d ≠ 0, такой, что для всех векторов х из множества VT выполняется неравенство d(x-x0) ≥ 0.
Пусть P – решение = - PA с начальным условием P(t0) = . Для него выполняется равенство P(t)Bu(t) = для всех t из интервала [t0, t1]. Действительное, допустим противное: пусть существует [to,t1] такое, что P( )Bu( )< . Это означает, что существует такое v U, что P( )Bu( )< P( )Bv. Из непрерывности управления следует, что существует интервал [τ0 , τ1] [t0, t1] такой, что P(τ)Bu(τ)<P(τ)Bv для всех τ [τ0 , τ1]. Пусть
u*(t) =
Очевидно, что u* - допустимое управление. Пусть x*(t) – соответствующая ему траектория и x*(t1) = 0. Пусть x*0 = x*(t0). Имеем, что x*0 VT, и, следовательно, d(x*0 – x0) ≥0. Из леммы 3 имеем:
d(x*0 – x0) = P(t0)(x*(t0)-x(t0))=(P(t1)x(t1)-P(t0)x(t0)) – (P(t1)x*(t1)-P(t0)x*(t0)) = = . Противоречие с неравенством, которое следует из теоремы отделимости.