Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Начатая переделка ТАУ.docx
Скачиваний:
4
Добавлен:
27.04.2019
Размер:
1.16 Mб
Скачать

Вариационное исчисление в оптимальном управлении

Задача Лагранжа имеем интегр-й критерий оптимизации вида

(6.6)

при ограничениях типа системы дифференциальных уравнений

. (6.7)

В задаче Майера критерий оптимизации имеет вид

(6.8)

при ограничениях (6.7) и системе конечных условий

. (6.9)

Задача Больца включает задачи Лагранжа и Майера.

Рассмотрим задачу Лагранжа в виде минимизации интеграла

. (6.10)

Требуется найти функцию x(t), минимиз-щую интеграл (6.10).

Пусть x(t)  функция обесп-щая минимум, а   функция близкая к x(t). Тогда x(t) и связаны соотношением

(6.11)

где e  малый пар-тр; (t)  произвольная функция, для которой . (6.12)

Заменяя и в интегр-м критерии соотв-но на и , имеем .

Разлагая подынтегральное выражение в ряд Тейлора и пренебрегая нелинейными составляющими ряда, имеем

.

Интегральный критерий перепишем в виде . (6.13)

Необх-м условием для нахожд-я экстремума функции J является

, (6.14)

откуда следует . (6.15)

Интегрирование по частям второго члена в этом интеграле

(6.15а) прив-т к выр-ю:

. (6.15б)

Используя данную зав-сть в условии для экстремума, имеем

. (6.15в)

Откуда следует уравнение Эйлера-Лагранжа , (6.16)

решение, кот-го опр- функцию, доставляющую экстремум J. Данное условие соответствует задаче с закрепленными точками x(t0) и x(tf). Если закреплена точка x(t0), а точка x(tf) лежит на кривой с(t), то ур-ние Эйлера-Лагранжа доп-ся усл-м трансверсал-сти . (6.17)

Рассмотрим примеры исп-ния ур-ния Эйлера-Лагранжа. Пусть требуется найти ф-цию x(t), которая минимизирует функционал

.

Находим производные .

Подставляя произв-е в ур-ние Эйлера-Лагранжа, имеем ур-ние

, решение, которого запишем в виде .

Если процесс в системе затухает, то при с2 = 0, с1 = х(0) переходный процесс минимизирующий функционал, описывается уравнением x(t) = x0e-t/T.

Изменим критерий качества .

В этом случае уравнение Эйлера-Лагранжа выражается в алгебраическое уравнение

.

Если х(0)  0, то обеспечить в системе управления мгновенное устранение отклонения можно лишь при использовании чрезмерных управляющих воздействий.

Вариационные методы применимы, если переменные, обеспечивающие экстремум можно дифференцировать. Управляющие воздействия современных систем могут изменяться, например, по релейному закону, что исключает в этом случае использование методов вариационного исчисления для решения таких задач.

25. Вывод основ-х соотн-й пр-па максимума. Проблемы его исп-ния.

Рассмотрим основные соотн-я данного пр-па на основе реш-я задачи о быстрод-и системы управления. Пусть модель движения объекта управления имеет вид (6.18)

и критерий оптимизации равен . (6.19)

ОУ необх-о перевести из нач-го состояния х0 в фиксир-е конеч-е xf. Предположим, что известна оптим-я траектория движения объекта рис.6.1 и оптимальный закон управления рис. 6.2.

Рис. 6.1 Оптим-я траектория Рис. 6.2 Оптим-й закон упр-ния дв-ния

Пусть при реализации оптим-го закона упр-ния в теч-е кор-го времени  произошло имп-е отклон-е от оптим-й траектории, начиная с момента   , а в момент  упр-ние возвр-ся к старой траектории. Траектории, приведенные на рис. 6.1, 6.2 трансформируются (рис. 6.3, 6.4)

Рис. 6.3 Траектория движения Рис. 6.4 Закон управления системы траектория

Обозначим неоптим-ю часть траектории дв-я объекта через , а неоптим-й ур-нь упр-ния через . Запишем траектории дв-я неоптим-й и оптим-ой систем на интервале : ; (6.20)

. (6.21)

Найдем вариацию траектории системы относительно оптимальной траектории

(6.22)

Пусть  равна произвед-ю положит-го целого числа М на малое е. На интервале времени [, tf] движения неоптимальной и оптимальной систем запишем в виде 6.23) .

Если разложить в ряд Тейлора правую часть уравнения и ограничиться линейными членами разложения, то получим

. (6.24)

В рез-те имеем зав-мость для скорости изменения вариации траектории в виде

. (6.25)

Проведем плоскость через N т.о., чтобы ни одна неоптим-я траектория не доходила до данной пл-сти. Местополож-е данной пл-сти х-тся вектором , который соотв-т нормали к данной плоскости в точке N. Отрезок NL соотв-т (  х) вариации неоптим-й траектории относ-но оптим-й в момент времени tf.

Между вектором  и NL расположен угол, что соответствует негативному значению скалярного произведения этих векторов

(6.26)

Можно записать составляющие данного неравенства

(6.27)

Или . (6.28)

Данное нер-во может превр-ся в рав-во при максим-м знач-и произведения . (6.29)

Из этого условия и имеем наименование «принципа максимума». Для оценки взаимосвязи координат объекта и вектора  примем, что . (6.30)

Продифференцировав выражение (6.30), имеем ; (6.31)

.

Откуда следует (6.32)

или, используя выражение (6.29), запишем . (6.33)

Система ДУ-ний получила наименование сопряженностей и ее реш-е возможно совместно с основной моделью дв-я объекта:

(6.34)

при условии задания начальных или граничных условий на координаты х и . Поскольку вектор  введен искусственно, то одна из основных проблем при использовании данного метода заключается в неопределенности начальных или граничных координат . Для критериев качества, отличных от критерия быстродействия, используется процедура замены критерия новой координатой объекта управления. Например, имеем интегральный критерий качества вида

. (6.35)

Обозначив J через дополнительную координату x­n+1, получим

, (6.36)

которую присоединяем к основной модели динамики движения объекта управления:

(6.37)

или в виде

.

Относительно расширенной модели формируется функция

. (6.38)

Функцию Н часто называют функцией Гамильтона. Если ищется минимум J, то n+1 = 1, а при поиске максимума J1 принимаем n+1 = 1.

26. ДИНАМ-Е ПРОГРАММИР-Е. Рекуррентное ур-ние. Ур-ние оптимальности. Проблемы исслед-я.

Динамич-е програм-ние. В основу положен пр-п, получивший наимен-е пр-па оптимальности. Согласно этому пр-пу оптим-ное ур-ние опр-ся конечной целью упр-ния и сост-м системы в рассм-мый момент времени, независимо от того, каким образом система пришла в это состояние. Для любой оптим-й траектории каждый её участок, связывающий любую промежуточную точку этой траектории с конечной, также является оптимальной траекторией.

Пусть имеем дискретную модель объекта

(6.45)

и необх-о найти упр-щие возд-вия , которые обесп-т минимум кр-рия . (6.46)

Следовательно, критерий оптим-сти явл-ся ф-цией (n+1) перем-х U(k), каждая из кот-х действует на своем временном интервале, что позв-т задачу расчленить на n-подзадач, св-х на соседних врем-х инт-лах. В рез-те имеем пос-ную цепочку простых задач, каждая из которых требует найти лишь одно упр-щее возд-е для фиксир-го интервала времени. При таком подходе, участки процесса рассм-ся в пос-сти обратной их номеру  от конца процесса к его началу. Пусть структура процесса в виде отдельных участков имеет вид рис. 6.5.

Рис. 6.5 Структура дискретного процесса управления

Для последнего интервала времени, из допустимого диапазона , при возможных значениях , можно выбрать такие , которые минимизируют величину Jn.

Обозначим минимальное значение Jn через

. (6.47)

Затем переходим к предпоследнему интервалу времени n1. Знач-я вх-й коорд-ты и упр-щего возд-я здесь соотв-но равны x(n2) и u(n2). Теперь минимизацию Jn-1 будем осущ-ть с пом-ю упр-я u(n2), дополняя получ-е решения рез-ми n для последнего участка. Вводя обозначения

или с учетом модели движения объекта

,

расчеты, производимые ан-ным образом для произв-го инт-ла времени, можно записать в виде рекуррентной формулы

(6.48)

До тех пор, пока не приходим к 1му инт-лу с зад-м знач-м х(0), что позволяет, исп-я модель динамики дв-я объекта для каждого такта, находить из ранее зафиксир-х табличных значений оптимальные значения (Uопт(0), Uопт(1), Uопт(2), …).

Идея динам-го прогр-ния для оптимизации упр-ния в непрер-х проц-х. Пусть треб-ся выбрать x(t) т.обр., чтобы интеграл

(6.49)

принял минимальное значение при движении из точки x(t0) в точку x(tf). Пусть  (x, t) есть функция, соответствующая минимуму интеграла J с нижним пределом t:

. (6.50)

Минимизацию можно производить и по

. (6.51)

Для исп-ния ранее рассм-го принципа оптим-сти разобьем траекторию дв-я системы на два интервала времени [t, t + ] и [t + , tf]. 1й интервал времени  выбираем малым. Для этого интервала нач-м условием является x(t), а для второго  x(t+).

Перепишем функцию  (x, t) к виду

. (6.52)

Восп-шись принципом оптим-сти, можем считать, что для интервала [t + , tf] сущ-т оптим-е реш-е. Это позволяет записать

, (6.53)

где .

Так как  очень мало, то можно переписать

.

Разложим в ряд Тейлора

и ограничимся линейными членами разложения. Тогда можно записать  (x, t) следующим образом

. (6.54)

Выражение можно привести к виду:

(6.55)

В пределе, когда  стремится к нулю, запишем уравнение в виде

. (6.56)

Если бы х был вектором, тогда уравнение записывается в виде

. (6.57)

Назовем полученное уравнение уравнением Беллмана для непрерывных систем.