Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры прихожий.docx
Скачиваний:
22
Добавлен:
21.09.2019
Размер:
4.94 Mб
Скачать
  1. Задачи оптимального управления. Постановка задачи оптимального управления

В середине прошлого века в вариационном исчислении появился новый класс экстремальных задач – задачи оптимального управления. Одно из отличий этих задач от задач классического вариационного исчисления – наличие переменных, которые не обладают необходимой гладкостью и могут быть разрывными. Необходимое условие экстремума для задач этого класса имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа. В качестве обязательного условия в решение задачи оптимального управления входит решение вспомогательной задачи на максимум. Отсюда и возникло название этого необходимого условия экстремума – принцип максимума.

Приведем формальную постановку задачи оптимального управления:

Найти среди всех допустимых управлений, переводящих фазовую точку из положения х0 в положение x1 , такое, для которого функционал

принимает наименьшее значение.

Функция f0 непрерывная по переменным x и u, непрерывно дифференцируемая по переменной x.

Управление u(·) , на котором достигается оптимальное значение данной задачи, называется оптимальным управлением, а соответствующая траектория x(t) – оптимальной траекторией. В этом смысле основная задача – найти оптимальные управления и соответствующие оптимальные траектории, другими словами, найти оптимальный управляемый процесс.

Для J = t1 – t0 оптимальность управления u(t) эквивалентна минимизации времени перехода из положения x0 в положение x1. Задача отыскания оптимальных управлений и траекторий в этом случае называется задачей об оптимальном быстродействии.

  1. Формулировка принципа максимума для линейной задачи быстродействия

Пусть H(x,u,P) = (P, f(x,u)) – функция Понтрягина, а

сопряженная система уравнений для соответствующей пары (x(t), u(t)). Эта система линейна и однородна. Поэтому при любых начальных условиях для Pk, k=1,…,n, существует единственное решение этой системы, определенное на всем отрезке, на котором определены управление u(t) и траектория x(t). Функции P1(t),…,Pn(t) непрерывны и имеют всюду, кроме конечного числа точек разрыва управления u(t), непрерывные производные по t.

Теорема 1 (принцип максимума). Пусть

это оптимальный управляемый процесс. Тогда существует ненулевая непрерывная вектор-функция P(t)= (P1(t),…,Pn(t)) такая, что справедливы следующие утверждения:

Теорема 2 (принцип максимума для линейной задачи быстродействия). Пусть

это оптимальный управляемый процесс. Тогда существует такое непрерывное нетривиальное решение P(t) сопряженной системы = - PA, что справедливо

  1. Доказательство принципа максимума для линейной задачи быстродействия.

Введем понятие сферы достижимости. Пусть 0 > T – верхняя граница на длины интервалов, на которых будут рассматриваться управления. Будем говорить, что точка x принадлежит сфере достижимости, если на интервале [t0, t1] существует допустимое управление u(t) и соответствующая ему траектория x(t) такие, что x(t0) = , x(t1) = 0, t1 – t0 ≤ T.

Лемма 1. Сфера достижимости VТ является выпуклым множеством.

Доказательство. Пусть , VT. По определению это означает, что существует допустимое управление , t [t0, ] , где ≤ t0 + T, которое переводит фазовую точку x из положения в точку 0. Аналогично, существует допустимое управление , t [t0, ], где ≤ t0 + T, которое переводит фазовую точку x из положения в точку 0.

Можно считать, что = t0 + T . В противном случае решим систему = f(x, u(t)) с начальным условием ( ) = 0, доопределив управление (t) как показано на рисунке.

Получим, что (t) = 0 на интервале [ t0 + T]. Аналогично, для (·) и (·) можно считать, что = t0 + T. Пусть y0 = λ + (1-λ) , 0≤λ≤1. Тогда управление u*(t)= λ (t) + (1-λ) (t), определенное на интервале [t0, t0 + T], является допустимым управлением. Ему соответствует траектория x*(t) = λ (t) + (1-λ) (t), по которой фазовая точка переходит из начального положения x*(t0) = λ + (1-λ) = y0 в конечное положение x*(t0 + T) = 0.

Лемма 2. Если x0 – внутренняя точка VT , то из x0 можно перейти в точку 0 за время строго меньше T .

Доказательство. Рассмотрим произвольную точку x0 IntVT. Из определения внутренней точки следует, что существует шар B(x0, r) VT. Так как из леммы 1 следует, что множество VT выпукло, то по лемме Каратеодори существуют (n+1) точки z1,…,zn+1, расположенные внутри шара и такие, что симплекс, образованный ими, содержит x0 строго внутри. Следовательно, в силу непрерывности расстояния найдутся достаточно малые окрестности точек zj из VT, такие, что симплекс, образованный этими точками из сферы достижимости, содержит x0. Тогда по определению множества VТ cуществуют допустимые управления us(t) на интервале [t0, t0 + T] такие, что xs(t0) = ys, xs(t0 + T) = 0, s=1,…,n+1. Так как функции xs(t) непрерывны, то существует ɛ > 0, для которого x0 IntCo{x1(t0 +ɛ),…,xn+1(t0 + ɛ)}. Но все точки xs(t0 + ɛ), s=1,…,n+1 лежат в сфере достижимости VT. Это означает, что x0 VT.

Лемма 3. Пусть u(t) – допустимое управление на интервале [t0 ,t1], x(t) – соответствующее решение, P(t) – произвольное решение сопряженной системы = - PA на данном интервале. Тогда во всех точках непрерывности управления u(t) справедливы следующие равенства:

P(t1)x(t1) – P(t0)x(t0) = .

Доказательство. = (t)x(t) + P(t) (t) = -P(t)(Ax(t)+Bu(t)) = P(t)Bu(t). Перейдем к доказательству принципа максимума, то есть докажем, что оптимальное управление удовлетворяет P(τ)Bu*(τ) = , τ [to,t1].

Пусть u(t) – оптимально управление на интервале [t0, t1], x(t0) = x0, x(t1) = 0. Положим, T = t1 – t0. Из леммы 2 следует, что x0 – граничная точка сферы достижимости VT. Следовательно, по теореме отделимости существует вектор d ≠ 0, такой, что для всех векторов х из множества VT выполняется неравенство d(x-x0) ≥ 0.

Пусть P – решение = - PA с начальным условием P(t0) = . Для него выполняется равенство P(t)Bu(t) = для всех t из интервала [t0, t1]. Действительное, допустим противное: пусть существует [to,t1] такое, что P( )Bu( )< . Это означает, что существует такое v U, что P( )Bu( )< P( )Bv. Из непрерывности управления следует, что существует интервал [τ0 , τ1] [t0, t1] такой, что P(τ)Bu(τ)<P(τ)Bv для всех τ [τ0 , τ1]. Пусть

u*(t) =

Очевидно, что u* - допустимое управление. Пусть x*(t) – соответствующая ему траектория и x*(t1) = 0. Пусть x*0 = x*(t0). Имеем, что x*0 VT, и, следовательно, d(x*0 – x0) ≥0. Из леммы 3 имеем:

d(x*0 – x0) = P(t0)(x*(t0)-x(t0))=(P(t1)x(t1)-P(t0)x(t0)) – (P(t1)x*(t1)-P(t0)x*(t0)) = = . Противоречие с неравенством, которое следует из теоремы отделимости.