Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpory_v_gotovom_videYeMMM.docx
Скачиваний:
12
Добавлен:
22.04.2019
Размер:
1.06 Mб
Скачать

46. Постановка зад.Динам.Прогр. Та її геометрична інтерпретація

Геометрична інтерпретація задач динамічного програмування .

Дадим геометрическую интерпретацию этой задачи. Предположим, что состояние системы характеризуются некоторой точкой S на плоскости х1Ох2 (рис. 1) и эта точка благодаря осуществляемому управлению ее движением перемещается вдоль линии, начальных состояний изображенной на рис. 1, из области возможных S0 в область допустимых конечных состояний SR. Каждому управлению U движением точки, т. е. каждой траектории движения точки, поставим в соответствие значение некоторой функции W (U) (например, длину пути, пройденного точкой под воздействием данного управления). Тогда задача состоит в том, что бы из всех допустимых траекторий движения точки S найти U*, обеспечивающего экстремальное значение функции W (U*). К определению такой «траектории» сводится и задача динамического программирования в случае, когда допустимые состояния системыS определяются точками n-мерного пространства.

Поставимо задачу динамічного програмування в загальному вигляді.

Нехай аналізується деякий керований процес, подання якого допускає декомпозицію на послідовні етапи (кроки), кількість яких n задана. Ефективність всього процесу Z може бути подана як сума ефективностей окремих кроків, тобто:

,

що має назву адитивного критерію (або як добуток ефективностей окремих кроків у вигляді: , що має назву мультиплікативного критерію).

З кожним етапом (кроком) задачі пов’язане прийняття певного рішення, так званого крокового управління що визначає як ефективність даного етапу, так і всього процесу в цілому.

Розв’язування задачі динамічного програмування полягає в знаходженні такого управління процесом у цілому, яке максимізує загальну ефективність: (max ).

Оптимальним розв’язком цієї задачі є управління що складається з сукупності оптимальних покрокових управлінь:

і уможливлює досягнення максимальної ефективності:

47.Принцип оптимальності та алгоритм динамічного програмування.

опишемо алгоритм розв’язування задач динамічного програмування, який складається з послідовності таких операцій:

  1. Визначають специфічні показники стану досліджуваної керованої системи і множину параметрів, що описують цей стан. Стан системи описується у такий спосіб, щоб можна було забезпечити зв’язок між послідовними етапами розв’язання задачі і мати змогу одержати допустиме рішення задачі в цілому як результат оптимізації на кожному кроці окремо, а крім того, приймати оптимальні рішення на наступних етапах без урахування впливу майбутніх рішень на ті, що були прийняті раніше.

  2. Поділяють процес на етапи (кроки), які, як правило, відповідають певним періодам планування динамічних процесів, або окремим об’єктам (підприємствам, видам продукції, устаткуванню тощо) у разі підготовки рішень стосовно керування ними.

  3. Формулюють перелік управлінь для кожного кроку і відповідні обмеження щодо них.

  4. Визначають ефект, який забезпечує управління на j–му кроці, якщо перед тим система була у стані S, у вигляді функції ефективності:

.

  1. Визначають, як змінюється стан S системи під впливом управління на j-му кроці, тобто як здійснюється перехід до нового стану:

.

  1. Будують рекурентну залежність задачі динамічного програмування, що визначає умовний оптимальний ефект починаючи з j–го кроку і до останнього, через вже відому функцію

.

Цьому ефекту відповідає умовне оптимальне управління на j-му кроці Зауважимо, що у функції необхідно замість врахувати змінений стан системи, тобто

  1. Використовують умовну оптимізацію останнього n-го кроку, визначаючи множину станів S, з яких можна за один крок дійти до кінцевого стану. Умовно-оптимальний ефект на n-му кроці обчислюють за формулою:

Потім знаходять умовно-оптимальне управління в результаті реалізації якого цей максимум буде досягнуто.

  1. Проводять умовну оптимізацію -го, -го та інших кроків за рекурентними залежностями (див. п. 6) і визначають для кожного кроку умовно-оптимальне управління:

  1. Проводять безумовну оптимізацію управління у «зворотному» напрямку від початкового стану до кінцевого. Для цього з урахуванням визначеного оптимального управління на першому кроці змінюють стан системи згідно з пунктом 5. Потім для цього нового стану знаходять оптимальне управління на другому кроці і аналогічно ці дії повторюють до останнього етапу (кроку).

В результаті знаходять оптимальне покрокове управління , що забезпечує максимальну ефективність Z*.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]