Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Обрезков, В. И. Гидроэлектрические станции в электроэнергетических системах

.pdf
Скачиваний:
9
Добавлен:
22.10.2023
Размер:
14.15 Mб
Скачать

Д и H а м и ч е с к о е п р о г р а м м -и р о в а и и е

Метод динамического программирования предназна­ чен в основном для управления системами, решение ко­ торых связано с задачами многошагового выбора. Тео­ ретические основы метода были разработаны Р. Беллманом [Л- 4]. В основе метода лежит принцип оптимально­ сти Беллмана, согласно которому «оптимальное управчение обладает тем свойством, что какое бы ни было начальное состояние и управление, последующее управ­ ление должно быть оптимальным по отношению к со­ стоянию, получающемуся в результате действия началь­ ного управления». Или, иначе говоря, общее поведение системы не зависит «от предыстории», т. е. поведения системы в прошлом, и определяется лишь ее начальным состоянием.

Идея метода заключается в том, что отыскание экс­ тремума функции многих переменных заменяется много­ кратным отысканием экстремума функции одного или малого числа переменных [Л. 8]. Другими словами, вме­ сто того, чтобы 1 раз решать сложную задачу, много­ кратно решается задача более простая. Для этого осу­ ществляется поэтапное планирование процесса, при ко­ тором на каждом этапе (шаге) на основе использования информации, полученной на предыдущих этапах реше­ ния, оптимизируется только один шаг, причем с учетом последствий того, к чему он приводит в будущем, т. е. на следующих этапах.

Такое поэтапное планирование возможно в том слу­ чае, если оптимизируемая функция, т. е. критерий опти­ мальности, обладает свойством аддитивности, при кото­

ром

полный критерий

оптимальности J (X,

U) складыва­

ется

из элементарных

значений фг(хг-, щ)

того же кри­

терия, полученных на

каждом этапе (шаге).

При поэтапном планировании с учетом последствий процесс динамического программирования обычно осу­

ществляется в обратном

по времени направлении,

т. е

от конца процесса к началу. Или, иначе, сначала

пла­

нируется последний шаг,

а затем к нему «пристраивает-

чся» предпоследний и т. д. При этом на каждом шаге определяется условный экстремум для любого из воз­ можных исходов предшествующего шага. Прежде чем рассмотреть схему вычислительного процесса, сформу­ лируем задачу.

2 4 0 .

 

Требуется

определить оптимальное

управление

11 =

=

U ( U i ,

« 2 ,

• •.,

Um) при

U G U » 0 1 1 , переводящее

систему

с

фазовыми

координатами

 

Х = Х(хі,

х2, ...,

 

хп)

при

ХеХД°п

из

состояния X0=X(t0)

в состояние

Х„=Х(£„)

и обеспечивающее

получение экстремального

(пусть ма­

ксимального) значения некоторого критерия оптималь­

ности

 

 

 

 

 

 

 

 

 

 

 

/ ( X , U ) = / ( x 1 ) х2,

хп; «і,

« 2 ,

Um) =мак с

(7-36)

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Л = S %

 

U<) = макс,

 

 

(7-37)

 

 

 

 

 

(=і

 

 

 

 

 

 

где -фі(Хі_і,

Uj)—значение

критерия

оптимальности на

і-м интервале (шаге), являющееся функцией координат

системы

в

конце

(і-—1)-го

интервала

и управления на

і-м интервале.

 

 

 

 

 

 

 

 

Схема решения задачи сложится при этом следую­

щим образом. Согласно высказанным выше предпосыл­

кам расчет начинается с последнего

(/і-го)

интервала.

Начало его фиксируется моментом времени tn-\,

состоя­

ние— координатами X„_t и управление—Un .

 

Согласно

принципу

оптимальности

управления

U n для

любого

Хп _! должно обеспечить максимум /

на п-м

интервале,

т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

фпп _1 , и „ ) = м а к с .

 

 

(7-38)

Пусть в интервале п оптимальное управление будет £/*„. Тогда для любого состояния (координат) Х„_і оптимальное значение приращения целевой функции бу­ дет /*„, т. е.

/*„=макс / 7 1 ( Х „ _ і )

=макС'фцп _і).

 

(7-39)

В интервале /г--1 в момент времени tn.-2

любое со­

стояние системы

Х п _ 2

будет

достигаться с

помощью

управления

U n _ i .

 

 

 

 

(шаге)

В результате выполненного на этом интервале

управления

Un-i

получим приращение критерия

опти­

мальности фя-і, зависящее как от принятого

в момент

tn-2 состояния системы

(т. е. ее координат)

Х и _2, так

и от указанного управления, т. е.

 

 

 

•/я.-і = ф 7 і - і = фп-і(Хп _2 , Un-i)-

 

(7-40)

16—91

 

 

 

 

 

241

Тогда суммарный наибольший эффект за два рассма­ триваемых шага, очевидно, будет определяться как

•f*п(п-і) (Х„_2 ) = М а к с [ ф п - і ( Х п - 2 , Un-i) +/*n(X„_i)]. (7-41)

Ясно, что для оптимального управления Ь*п зна­ чение /*п(п-і) будет являться функцией только состояния системы Х,г _2 в момент tn-z, что и отражает запись ле­ вой части этого условия.

Поиск оптимального

управления U*n~i для каждого

Х „ _ 2 можно осуществить

методом последовательного пе­

ребора из числа возможных и допустимых или какимнибудь оптимизационным методом.

Для любого і-го шага аналогичная запись будет иметь

следующий вид:

 

Ji, (і+і),.... n(Xn-i) =макс(фі(Хі_і, Ut)

n(Xi)].

 

(7-42)

В процессе расчета для каждого X„_j запоминается

оптимальное управление

 

и п _ ( ж ) = и * п _ ( Ж ) ( Х п _ г ) .

(7-43)

Расчет продолжается до первого интервала, где /*і =

= /о; с учетом начального условия Х(і0 ),

определяется

оптимальное управление Ui и, следовательно, весь ряд значений и „ _ ( 1 - + 1 ) и соответствующие им значения Х„_*, обеспечивающие экстремум /*о(Х0 ). Сказанное иллюст­ рирует рис. 7-1.

Кроме рассмотренного метода динамического про­ граммирования, существует ряд его модификаций. Все они направлены на то, чтобы уменьшить возможное ко­ личество принимаемых к рассмотрению состояний систе­ мы X. Метод, как нетрудно видеть, позволяет опреде­

лить

тлобальиый оптимум (с точностью, соответствую­

щей

разбиению параметра X) . Его достоинством

являет­

ся также и то, что он позволяет легко учитывать

всякого

рода ограничения и прост в алгоритмизации.

Однако

при

большом числе переменных он становится

крайне

трудоемким, что и заставляет применять различные его модификации.

Г р а д и е н т н ы е м е т о д ы

Направление вектора-градиента функции / ( X ) слу­ жит, как известно, направлением максимальной скоро­ сти возрастания этой функции. Отсюда процесс оптими-

242

зации по методу градиента будет сводиться к определе­ нию в каждый момент времени t направления наиско­ рейшего изменения функции и некоторого перемещения по этому направлению в прямую или обратную сторону (в зависимости от того, что ищется — максимум или ми­ нимум функции). Процесс изменения траектории движе­ ния системы Х(/) может быть как непрерывным, так и дискретным.

Рис. 7-1. Общая схема решения задачи методом дина­ мического программирования.

Значение вектора-градиента функции / ( X ) в любой точке определяется формулой

 

 

g r a d / = £ " Ä " x ° '

 

( 7 - 4 4 )

 

Х°

 

 

і = і

 

 

 

 

где

ортогональные друг к другу единичные

векторы.

 

Для

определения

направления

вектора-градиента

I

в рассматриваемой

точке

необходимо

определить

его

компоненты по вектору X. Этими компонентами

являют­

ся

частные производные

функции,

т.

е. dJ/dXi.

Таким

образом, для вычисления указанных компонентов необ­ ходимо, чтобы исследуемая функция J = J(Xi, ..., х п ) была непрерывно дифференцируемой по всем перемен­ ным ХІ в области поиска экстремума. Необходимо так­ же, чтобы в области допустимых значений переменных

16*

один

243

(включая ее границу) имелся всего

 

экстремум

функции / ( X ) . Только в этом случае можно быть уве­ ренным, что процесс сходится к глобальному экстре­ муму.

Итак, для поиска экстремума функции / ( X ) необхо­ димо в каждой точке определить вектор-градиент и сде­ лать шаг по его направлению (или обратному). В новой точке снова определяется вектор-градиент и снова дела­ ется шаг по его направлению. Такое движение осуще­ ствляется до тех пор, пока не будет выполнено условие

|grad/| = 2]|

is,

(7-45)

1=1

где е — достаточно малое наперед заданное число. Указанный шаг по направлению вектора-градиента

осуществляется обычно с помощью так нааываемой гра­ диентной системы дифференциальных уравнений вида

d x t m = = c

dl

(7_46)

dt

dxt

 

и легко реализуется на ЭВМ. При С < 0 движение осу­ ществляется по направлению, обратному направлению вектора-градиента, называемого иногда антиградиентом.

Разновидностью описанного метода градиента явля­ ется метод наискорейшего спуска. В этом методе движе­ ние вдоль направления вектора-градиента осуществляет­ ся не в соседнюю достаточно близкую точку, а до полу­ чения экстремума вдоль этого направления. Найденный на этом направлении частный экстремум принимается в качестве следующей начальной точки, и движение по­ вторяется. Решение определится при достижении усло­ вия (7-45).

Описанные градиентные методы в настоящее время широко применяются при решении оптимизационных за­ дач. Они обладают хорошей сходимостью (скорость ре­ шения), однако последняя существенно зависит от вы­ бора расчетных переменных. Недостатком метода явля­ ется, как указывалось, возможность использования его для поиска лишь локального экстремума. Однако прак­ тически, если с помощью этого метода осуществить по­ иск из различных начальных точек, сравнивая получен­ ные решения, можно из них выбрать наилучшее и счи­ тать его за глобальный экстремум.

244

Все рассматриваемые здесь математические методы имеют между собой много общего и при определенных предпосылках переходят один в другой. Однако в вы­ числительном отношении возможности их реализации различны.

Из предыдущих рассуждений следует, что методы классического вариационного исчисления целесообразно применять к задачам, у которых область изменения пе­ ременных не имеет ограничений, что обычно наблюдает­ ся в. тех случаях, когда переменные мало изменяются. Принцип максимума оказывается эффективным, когда области определения X и U являются замкнутыми, а ре­ шения находятся на границах допустимых областей. В этих же условиях целесообразно использовать и гра­ диентные методы. Динамическое программирование на­ ходит свое применение для задач умеренной сложности с наличием ограничений на фазовые координаты и управления. Вообще говоря, такая оценка методов явля­ ется, конечно, весьма поверхностной. Вместе с тем раз­ вернутая сравнительная оценка их является задачей крайне трудной.

В данной книге нет возможности рассмотреть все разновидности описанных методов. Их достаточно много, и каждый из них в той или другой мере в соответствии с конкретными условиями задачи улучшает в своей об­ ласти возможности ее решения.

7-4. Н е к о т о р ы е

м е т о д ы учета ограничений в задачах

математического

п р о г р а м м и р о в а н и я

Как указывалось в предыдущем параграфе, на целе­ вую функцию / ( X , U) могут быть наложены ограничения типа равенств или неравенств: уравнения (7-1) (7-3) или (7-4). Учет этих ограничений является наиболее сложным этапом в процедуре поиска решения, в осо­ бенности если оно граничное и не единственное (много­ экстремальные задачи). Существует много методов уче­ та ограничений. Рассмотрим те из них, которые являют­ ся наиболее распространенными.

Ф и к с а ц и я

г р а н и ч н ы х

з н а ч е н и й

п е р е ­

м е н н ы х . Из рассмотренных методов такой учет

огра­

ничений наиболее удобен для градиентных методов, ког­ да ограничения наложены на координаты xit для прин­ ципа максимума при ограничениях, накладываемых на

245

управления iij, и в динамическом программировании, когда ограничиваются как ХІ, так и щ.

Организация решения с использованием метода фи­ ксации граничных значений весьма проста и сводится к тому, что при достижении траектории поиска по како­ му-либо параметру граничного значения величина пара­

метра фиксируется на его

предельном

значении.

 

М е т о д м н о ж и т е л е й

Л а г р а н ж а. Этим

мето­

дом достаточно эффективно

учитывается

наличие

допол­

нительных условий типа равенств (уравнение связи), которые могут быть изопериметрическими, голономными и неголономиыми. Методы и приемы учета этих ограни­

чений основаны на организации новой целевой

функции,

в которую

с помощью

множителей Лагранжа

вводятся

указанные

условия [Л.

14]. Поиск экстремума

новой це­

левой

функции может

осуществляться обычными мето­

дами

математического

программирования. Некоторые

принципы построения указанной функции были рассмо­

трены в

предыдущем параграфе.

М е т

о д ш т р а ф н ы х ф у н к ц и й . Этот метод пред­

назначен для учета любых ограничений типа неравенст­ ва. Суть его состоит в том, что определение экстремума осуществляется исходя не из целевой функции / ( X , U), а некоторой другой, состоящей из целевой и так назы­ ваемой штрафной функции, т. е.

Ф(Х,

U ) = / ( X , и ) + Ш ( Х , U)—нжстр,

(7-47)

где Ш(Х,

U) ш т р а ф н а я функция.

 

 

При

этом

если

определяется минимум

функции

Ф(Х, U),

то

штрафная функция Ш(Х, U) имеет

знак

плюс. Если же осуществляется максимизация

Ф(Х,

U),

то штрафная функция

отрицательна.

 

 

Таким образом, смысл использования штрафной функция заключается в том, что всякое нарушение огра­ ничений как бы штрафуется по определенным матема­ тическим правилам, вытекающим из принципа: чем боль­ ше нарушение, тем больше штраф. При бесконечно боль­ ших значениях Ш(Х, 13) значение Ф(Х, U) вырождает­ ся в движение вдоль границы.

Поиск экстремума Ф(Х, U) может осуществляться любым из рассмотренных в § 7-4 методов математиче­ ского программирования.

246

Известно несколько математических формулировок штрафных функций. Рассмотрим одну из них для слу­ чая введения следующих ограничений:

— х«<0, і = 1 , 2, .... л;

(7-48) 4

— U j < 0 ,

/ = 1, 2

т;

(7-49)

M X , U ) < 0 ,s = l , 2, .... p.

(7-50)

Введем в рассмотрение функцию

 

 

%

, 0 „ р И г < 0 ; I

 

 

11 при z >

0. J

 

Тогда уравнения (7-48)—(7-50) будут эквивалентны соответственно следующим уравнениям типа равенств:

 

 

 

 

 

*<Sg(—ХІ)=0;

 

 

 

(7-52)

 

 

 

 

 

" j S g ( - " j ) = 0 ;

 

 

 

(7-53)

 

 

 

 

M X ,

U)Sgf.(X, U)=0 .

-

 

(7-54)

 

Очевидно,

что если

исходные

уравнения

(7-48) —

(7-50) являются совместными, то решения их

совпада­

ют

с решением

уравнений (7-52) — (7-54).

 

 

 

 

Образуем

функцию Ш(Х, U) в следующем

виде:

 

 

 

 

 

n

 

m

 

 

 

 

 

 

 

 

I1=1

 

1=1

 

 

 

 

X и. [ S g ( -

«j)r + £

ae f; (X, U) [Sg f„ (X, U)]\

(7-55)

где

ЦІ>0,

r\j>0

и rzs >0— некоторые постоянные коэф­

фициенты.

 

 

 

 

 

 

 

 

 

 

Обычно т = 2 .

 

учесть, что (Sg(2)]2=Sg2,

 

В этом случае,

если

 

 

 

 

 

п

 

m

 

 

 

 

 

 

 

£

пх\

Sg ( - Xi) +

V -щи) Sg ( - щ) +

 

 

 

 

Іi=\

 

i=\

 

 

 

 

 

 

+ É < ( X , U ) S g f s ( X , U ) l

 

 

(7-56)

 

 

 

 

5 = 1

 

 

J

 

 

 

 

Возможны и другие значения т.

 

 

 

 

 

Метод

штрафных

функций легко

реализуется

как на

цифровых, так и на аналоговых вычислительных

маши-

247

пах и всегда может с тем или другим приближением обеспечить решение любой задачи математического про­ граммирования. Однако он имеет один недостаток, кото­ рый в некоторых случаях ограничивает возможность его применения. Речь идет о сходимости решения. При ма­ лых значениях констант р.,, щ, as и т экстремум функ­ ции (7-47) может оказаться далеко за областью опре­ деления, получаемой введением указанных выше ограничений. При больших значениях констант резко ис­ кривляются поверхности функции (7-47) вдоль линий ог­ раничений и появляющиеся вследствие этого «овраги» зна­ чительно замедляют сходимость решения. Поэтому при использовании метода штрафных функций большое зна­ чение имеет оптимальный выбор указанных констант.

7-5. О с н о в н ы е положения и о б щ а я ф о р м у л и р о в к а задачи

Речной сток в современных условиях, как уже было отмечено, используется для удовлетворения нужд ряда отраслей народного хозяйства, т. е. комплексно. Отсюда все расчеты, связанные с использованием речного стока, есть расчеты по определению эффективности его ком­ плексного использования. При таких расчетах возмож­ ность удовлетворения каждого участника энерговодохо­ зяйственного комплекса (ЭВХК) должна определяться с учетом интересов всех других участников комплекса. Иначе говоря, нельзя каждого участника ЭВХК рассма­ тривать вне связи его с другими участниками этого ком­ плекса.

В этих условиях суммарные эксплуатационные из­ держки за расчетный интервал времени по ЭВХК в це­ лом будут определяться следующим образом:

И. =

И с + Я и р +

ИТР+Ищ,

+ Ус + Ущ, + У т р + Упр, (7-57)

где И с,

Я и р , # т р ,

# п р — суммарные издержки по энерго­

системе, ирригации, водному транспорту и прочим участ­ никам ЭВХіК соответственно; Ус, Ущ?, Утр, Упр — ущербы, получающиеся от недодачи запланированной продукции по тем же участникам ЭВХК-

Экономически наивыгоднейший режим ЭВХК при обеспечении заданного объема продукции будет, очевид­ но, определяться минимумом указанных суммарных из­ держек.

248

Однако практическое определение этого режима встречает пока серьезные трудности. .Причин для этого много, и в их числе немаловажными являются следую­ щие:

1. Большая размерность задачи. По существу мы не имеем возможности ставить задачу на современные ЦВМ без того, чтобы не вводить определенные упрощения в ее постановку.

2. Экономический фактор. Эта трудность сводится к тому, что, к сожалению, до сих пор нет достаточно строгого и обоснованного .метода оценки в денежном вы­ ражении ущербов, получающихся от неудовлетворения спроса на воду того или другого участника комплекса. До сих пор в ряде случаев нет надежных значений удель­ ных ущербов по таким отраслям водного хозяйства, как орошение, рыбное хозяйство и судоходство.

3. Требования на воду отдельных участников ком­ плекса изменяются во времени, переходя из совпадаю­ щих в противоречивые и наоборот. Так, водный транс­ порт заинтересован в период мелководья в сработке водохранилища, а энергетика, наоборот, в сохранении ма­ ксимального уровня его до наступления осенне-зимнего пика нагрузки. Зимой энергетика предъявляет повышен­ ный спрос на воду, что обычно удовлетворяет требова­ ниям по обеспечению нормальных условий стоянки су­ дов в затонах нижнего бьефа ГЭС. Противоречивы тре­ бования на воду энергетики и ирригации, энергетики и рыбного хозяйства, рыбного хозяйства и ирригации и т. д. Имеются даже противоречия внутри одной и той же отрасли народного хозяйства. Так, водный транс­ порт заинтересован в поддержании судоходных глубин в нижнем бьефе ГЭС, что требует соответствующих рас­ ходов из водохранилищ, но при этом последние сраба­ тываются, и тем самым ухудшаются условия судоходст­ ва в верхнем бьефе данной ГЭС и нижнем у вышеле­ жащей.

Существует некоторый оптимум, однако определение его в условиях практически непрерывного учета проти­ воречивых требований участников комплекса приводит к дополнительному усложнению вычислительного алго­ ритма.

4. Вероятностный характер основной исходной инфор­ мации. Учет этого обстоятельства приводит к необходи­ мости использовать в рассматриваемых расчетах соответ-

249

Соседние файлы в папке книги из ГПНТБ