Задачи оптимального управления. Постановка задачи оптимального управления

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский национальный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Шпоры прихожий.docx

Скачиваний:

Добавлен:

21.09.2019

Размер:

4.94 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2019 20 > Следующая >>>

Задачи оптимального управления. Постановка задачи оптимального управления

В середине прошлого века в вариационном исчислении появился новый класс экстремальных задач – задачи оптимального управления. Одно из отличий этих задач от задач классического вариационного исчисления – наличие переменных, которые не обладают необходимой гладкостью и могут быть разрывными. Необходимое условие экстремума для задач этого класса имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа. В качестве обязательного условия в решение задачи оптимального управления входит решение вспомогательной задачи на максимум. Отсюда и возникло название этого необходимого условия экстремума – принцип максимума.

Приведем формальную постановку задачи оптимального управления:

Найти среди всех допустимых управлений, переводящих фазовую точку из положения х₀ в положение x₁ , такое, для которого функционал

принимает наименьшее значение.

Функция f⁰ непрерывная по переменным x и u, непрерывно дифференцируемая по переменной x.

Управление u(·) , на котором достигается оптимальное значение данной задачи, называется оптимальным управлением, а соответствующая траектория x(t) – оптимальной траекторией. В этом смысле основная задача – найти оптимальные управления и соответствующие оптимальные траектории, другими словами, найти оптимальный управляемый процесс.

Для J = t₁ – t₀ оптимальность управления u(t) эквивалентна минимизации времени перехода из положения x₀ в положение x₁. Задача отыскания оптимальных управлений и траекторий в этом случае называется задачей об оптимальном быстродействии.

Формулировка принципа максимума для линейной задачи быстродействия

Пусть H(x,u,P) = (P, f(x,u)) – функция Понтрягина, а

сопряженная система уравнений для соответствующей пары (x(t), u(t)). Эта система линейна и однородна. Поэтому при любых начальных условиях для P_k, k=1,…,n, существует единственное решение этой системы, определенное на всем отрезке, на котором определены управление u(t) и траектория x(t). Функции P₁(t),…,P_n(t) непрерывны и имеют всюду, кроме конечного числа точек разрыва управления u(t), непрерывные производные по t.

Теорема 1 (принцип максимума). Пусть

это оптимальный управляемый процесс. Тогда существует ненулевая непрерывная вектор-функция P(t)= (P₁(t),…,P_n(t)) такая, что справедливы следующие утверждения:

Теорема 2 (принцип максимума для линейной задачи быстродействия). Пусть

это оптимальный управляемый процесс. Тогда существует такое непрерывное нетривиальное решение P(t) сопряженной системы = - PA, что справедливо

Доказательство принципа максимума для линейной задачи быстродействия.

Введем понятие сферы достижимости. Пусть 0 > T – верхняя граница на длины интервалов, на которых будут рассматриваться управления. Будем говорить, что точка x принадлежит сфере достижимости, если на интервале [t₀, t₁] существует допустимое управление u(t) и соответствующая ему траектория x(t) такие, что x(t₀) = , x(t₁) = 0, t₁ – t₀ ≤ T.

Лемма 1. Сфера достижимости V_Т является выпуклым множеством.

Доказательство. Пусть , V_T_. По определению это означает, что существует допустимое управление , t [t₀, ] , где ≤ t₀ + T, которое переводит фазовую точку x из положения в точку 0. Аналогично, существует допустимое управление , t [t₀, ], где ≤ t₀ + T, которое переводит фазовую точку x из положения в точку 0.

Можно считать, что = t₀ + T . В противном случае решим систему = f(x, u(t)) с начальным условием ( ) = 0, доопределив управление (t) как показано на рисунке.

Получим, что (t) = 0 на интервале [ t₀ + T]. Аналогично, для (·) и (·) можно считать, что = t₀ + T. Пусть y₀ = λ + (1-λ) , 0≤λ≤1. Тогда управление u*(t)= λ (t) + (1-λ) (t), определенное на интервале [t₀, t₀ + T], является допустимым управлением. Ему соответствует траектория x*(t) = λ (t) + (1-λ) (t), по которой фазовая точка переходит из начального положения x*(t₀) = λ + (1-λ) = y₀ в конечное положение x*(t₀ + T) = 0.

Лемма 2. Если x₀ – внутренняя точка V_T , то из x₀ можно перейти в точку 0 за время строго меньше T .

Доказательство. Рассмотрим произвольную точку x₀ IntV_T. Из определения внутренней точки следует, что существует шар B(x₀, r) V_T. Так как из леммы 1 следует, что множество V_T выпукло, то по лемме Каратеодори существуют (n+1) точки z₁,…,z_n₊₁, расположенные внутри шара и такие, что симплекс, образованный ими, содержит x₀строго внутри. Следовательно, в силу непрерывности расстояния найдутся достаточно малые окрестности точек z_j из V_T_,такие, что симплекс, образованный этими точками из сферы достижимости, содержит x₀. Тогда по определению множества V_Тcуществуют допустимые управления u_s(t) на интервале [t₀, t₀ + T] такие, что x_s(t₀) = y_s, x_s(t₀ + T) = 0, s=1,…,n+1. Так как функции x_s(t) непрерывны, то существует ɛ > 0, для которого x₀ IntCo{x₁(t₀ +ɛ),…,x_n₊₁(t₀ + ɛ)}. Но все точки x_s(t₀ + ɛ), s=1,…,n+1 лежат в сфере достижимости V_T_-ɛ. Это означает, что x₀ V_T_-ɛ.

Лемма 3. Пусть u(t) – допустимое управление на интервале [t₀ ,t₁], x(t) – соответствующее решение, P(t) – произвольное решение сопряженной системы = - PA на данном интервале. Тогда во всех точках непрерывности управления u(t) справедливы следующие равенства:

P(t₁)x(t₁) – P(t₀)x(t₀) = .

Доказательство. = (t)x(t) + P(t) (t) = -P(t)(Ax(t)+Bu(t)) = P(t)Bu(t). Перейдем к доказательству принципа максимума, то есть докажем, что оптимальное управление удовлетворяет P(τ)Bu*(τ) = , τ [t_o,t₁].

Пусть u(t) – оптимально управление на интервале [t₀, t₁], x(t₀) = x₀, x(t₁) = 0. Положим, T = t₁ – t₀. Из леммы 2 следует, что x₀ – граничная точка сферы достижимости V_T_.Следовательно, по теореме отделимости существует вектор d ≠ 0, такой, что для всех векторов х из множества V_T выполняется неравенство d(x-x₀) ≥ 0.

Пусть P – решение = - PA с начальным условием P(t₀) = . Для него выполняется равенство P(t)Bu(t) = для всех t из интервала [t₀, t₁]. Действительное, допустим противное: пусть существует [t_o,t₁] такое, что P( )Bu( )< . Это означает, что существует такое v U, что P( )Bu( )< P( )Bv. Из непрерывности управления следует, что существует интервал [τ₀ , τ₁] [t₀, t₁] такой, что P(τ)Bu(τ)<P(τ)Bv для всех τ [τ₀ , τ₁]. Пусть

u*(t) =

Очевидно, что u* - допустимое управление. Пусть x*(t) – соответствующая ему траектория и x*(t₁) = 0. Пусть x*₀ = x*(t₀). Имеем, что x*₀ V_T, и, следовательно, d(x*₀ – x₀) ≥0. Из леммы 3 имеем:

d(x*₀ – x₀) = P(t₀)(x*(t₀)-x(t₀))=(P(t₁)x(t₁)-P(t₀)x(t₀)) – (P(t₁)x*(t₁)-P(t₀)x*(t₀)) = = . Противоречие с неравенством, которое следует из теоремы отделимости.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2019 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
21.07.201961.53 Кб1шпоры по экономики.docx
#
16.04.20191.83 Mб18Шпоры по ЭЛект.docx
#
22.09.201928.07 Mб2шпоры по ЭМ.docx
#
27.10.2018284.67 Кб4Шпоры ПОП.doc
#
23.04.20191.14 Mб8шпоры почти пиздатые.doc
#
21.09.20194.94 Mб22Шпоры прихожий.docx
#
31.05.201532.34 Кб16шпоры Расчет припусков на обработку Базирование.docx
#
25.09.2019457.05 Кб4Шпоры сапром (готовый вариант).docx
#
22.09.20191.6 Mб5Шпоры сети хорошие.doc
#
08.11.20192.05 Mб14шпоры стацу (1).docx
#
27.09.2019159.23 Кб4шпоры термех.doc

Задачи оптимального управления. Постановка задачи оптимального управления

Формулировка принципа максимума для линейной задачи быстродействия

Доказательство принципа максимума для линейной задачи быстродействия.