Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ТЭРЭО.doc
Скачиваний:
49
Добавлен:
01.12.2018
Размер:
1.18 Mб
Скачать

Лекция №3: Оптимизация параметров технической эксплуатации

Классификация методов оптимизации. Выбор критериев оптимальности функционирования морских радиоэлектронных систем

Оптимизация в широком смысле слова находит применение в науке, технике и в других областях человеческой деятельности. Особенно значительные результаты достигнуты при проектировании и анализе сложных технических систем.

Оптимизация (в общем, понимании) – целенаправленная деятельность, заключающаяся в получении наилучших результатов при соответствующих условиях (ограничениях). При наличии ЭВМ решение оптимизационных задач заметно упрощается.

Постановка задачи оптимизации предполагает существование конкурирующих свойств процесса. Выбор компромиссного варианта для указанных свойств и представляет собой процедуру решения оптимизационной задачи.

Решение оптимизационной задачи для процесса технической эксплуатации сложных систем может быть представлено в виде набора правил, в виде стратегии или способа управления, согласно которым следует поступать в тот или иной момент принятия решения.

При постановке задачи оптимизации необходимо:

1. Наличие объекта оптимизации и цели оптимизации. При этом формулировка каждой задачи оптимизации должна подразумевать нахождение экстремального значения лишь одной величины, т.е. одновременно системе не должно приписываться два и более критериев оптимизации, т.к. практически всегда экстремум одного критерия не соответствует экстремуму другого.

2. Наличие ресурсов оптимизации, под которыми понимают возможность выбора значений некоторых параметров оптимизируемого объекта. Объект должен обладать определенными степенями свободы – управляющими воздействиями.

3. Возможность количественной оценки оптимизируемой величины, поскольку только в этом случае можно сравнивать эффекты от выбора тех или иных управляющих воздействий.

4. Учет ограничений.

Обычно оптимизируемая величина связана с экономичностью работы или технической эксплуатации рассматриваемой системы. Оптимизируемое качество или вариант работы объекта должен оцениваться какой-то количественной мерой – критерием оптимальности.

Вопрос о критериях оптимизации – один из самых важных и в то же время он далек от удовлетворительного решения. На каждом из этапов решения задачи оптимизации встает проблема формулировки крите­риев оптимальности и оптимизации. Для решения задачи оптимизации необходимо, прежде всего, уметь формулировать критерии оптимальности и владеть методами (или процедурами) оптимизации.

В настоящее время выделяют два вида критериев оптимизации. Это, во-первых, выработанные практикой качественные или количе­ственные характеристики оптимальности работы различных систем и, во-вторых, математические критерии оптимальности, положенные в основу аналитических, графоаналитических, численных и машинных методов оптимизации. Однако они часто далеки от потребностей практики. Существует множество различных критериев. Выбор того или иного критерия зависит от разработчика технической системы, и в этом содержится элемент нестрогости. Однако все чаще практика предлагает типовые критерии, которые становятся общепринятыми и заносятся в технические задания.

На основании выбранного критерия оптимальности составляется целевая функция, представляющая собой зависимость критерия оптимальности от параметров, влияющих на ее значение. Вид критерия оптимальности или целевой функции определяется конкретной задачей оптимизации. Таким образом, задача оптимизации сводится к нахождению экстремума целевой функции.

Наиболее общей постановкой оптимальной задачи является выражение критерия оптимальности в виде экономической оценки (производительность, прибыль, рентабельность, стоимость выполняемых работ). Однако в частных задачах оптимизации, когда объект является частью технологического процесса, не всегда удается или не всегда целесообразно выделять прямой экономический показатель, который бы полностью характеризовал эффективность работы рассматриваемого объекта. В таких случаях критерием оптимальности может служить технологическая характеристика, косвенно оценивающая экономичность работы объекта. Но в любом случае любой критерий оптимальности имеет экономическую природу.

В задачах оптимизации различают простые и сложные критерии оптимизации. Критерий оптимальности называется простым, если требуется определить экстремум целевой функции без задания условий на какие-либо другие величины. Такие критерии обычно используются при решении частных задач оптимизации. Критерий оптимальности называется сложным, если необходимо установить экстремум целевой функции при некоторых условиях, которые накладываются на ряд других величин (например, определение максимального качества работы при заданных или ограниченных расходах, времени обслуживания и др.).

Процедура решения задачи оптимизации обязательно включает, помимо выбора управляющих параметров, еще и установление ограничений на эти параметры. Ограничения могут накладываться как по технологическим, так и по экономическим соображениям.

Наиболее распространенные в прикладной математике методы оптимизации используют понятие минимума (или максимума) функции или функ­ционала. В первом случае находят значение n переменных , при которых функция принимает экстремальное значение F=min(mаx). В простейшем случае дифференцируемости функции и неравенства нулю вторых производных задача сводится к решению n алгебраических (в общем случае нелинейных) уравнений

=0, =1,2,...,n.

При оптимизации управления приходится оперировать с большим числом переменных и это затрудняет решение уравнений даже с помощью современных ЭВМ.

В качестве оптимизируемой функции могут выступать, например, величина функция готовности все эксплуатируемой системы, удельные экономические затраты на её эксплуатацию.

Критерий оптимальности (с ограничениями) для функции формулируется следующим образом:

Методы отыскания экстремума функции получили такое большое развитие в кибернетике в связи с вычислительными трудностями решения системы алгебраических уравнений вида

j=1,2,…n,

особенно при наличии ограничений на координаты .

Классическая математика ограничивалась разработкой методов решения и доказательствами принципиальной разрешимости этих уравне­ний, что привело к созданию так называемых аналити­ческих методов оптимизации. Однако при решении конкретных инже­нерных задач важно владеть процедурами, позволяющими доводить решение до числовых данных. Это заставило искать и разрабатывать численные методы оптимизации.

Итак, для решения задачи оптимизации необходимо:

– составить математическую модель объекта оптимизации;

– выбрать критерий оптимальности и составить целевую функцию;

– установить возможные ограничения, которые должны накладываться на переменные;

– выбрать метод оптимизации, который позволит найти экстремальные значения искомых величин.

Принято различать задачи статической оптимизации для процессов, протекающих в установившихся режимах, и задачи динамической оптимизации. В первом случае решаются вопросы создания и реализации оптимальной модели процесса, во втором – задачи создания и реализации системы оптимального управления процессом при неустановившихся режимах эксплуатации.

Расчет оптимальных параметров процесса технической эксплуатации радиоэлектронной системы методом неопределенных множителей Лагранжа

Широкое применение в задачах оптимизации нашел метод множителей Лагранжа. С помощью метода множителей Лагранжа по существу формулируются необходимые условия, позволяющие определить точки оптимума в задачах оптимизации с ограничениями в виде равенств. При этом задача оптимизации с ограничениями преобразуется в эквивалентную задачу безусловной оптимизации, в которой фигурируют некоторые неизвестные параметры, называемые множителями Лагранжа.

Метод неопределенных множителей Лагранжа со­стоит в следующем: если требуется найти минимум или максимум функции при дополнительном условии, то составляется функция Лагранжа:

,

где γ – неопределенный множитель Лагранжа.

Множитель Лагранжа  представляет собой параметр, значение которого выбирается таким образом, чтобы выполнялось ограничение задачи. С экономической точки зрения множители Лагранжа интерпретируются как неявные (теневые) цены ресурсов, определяемые ограничениями.

Необходимые условия экстремума функции выражаются системой уравнений:

Система решений удовлетворяющих этим уравнениям, может дать экстремум функции . Строго говоря, метод множителей Лагранжа применим лишь в тех случаях, когда дополнительное условие задано в виде равенства, а аргументы непрерывны.

В процессе решения могут получиться нецелочисленные значения , поэтому необходимо выполнять округление этих значений в сторону ближайших целых чисел. После округления часть целочисленных значений сразу же исключается, поскольку для них не выполняется требуемое условие. При этом необходимо в соответствии с поставленной оптимизационной задачей выбрать решение, которое либо минимизирует затраты, либо при котором получается максимальное значение показателя надежности системы.

Расчет оптимальных стратегий технической эксплуатации морской радиоэлектронной системы с помощью динамического программирования (итерационный алгоритм)

С помощью динамического программирования ре­шают задачи, связанные с непрерывными процессами оптимального управления, при этом оно представляет собой один из приемов решения вариационных задач. Для численного решения непрерывных вариационных задач методом динамического программирования необходимо лишь заменить непре­рывный процесс дискретным процессом с соответствующим малым интервалом дискретности.

Динамическое программирование также позволяет ре­шать задачи, изначально дискретные, т.е. не преобразо­ванные из соответствующих непрерывных задач. Кроме того, динамическое программирование применяется для решения задач кибернетики, сводимых к проблеме оптимального перебора. Динамическое програм­мирование в этом случае выступает как некоторый оптимальный метод перебора вариантов.

В основе непрерывного и дискретного динамического программи­рования лежит принцип оптимальности Беллмана, который справедлив и для дискретных, и для стохастических процессов управления.

Марковские процессы с непрерывным временем. Рассмотрим процесс, переходы в котором совершаются через случайные интервалы времени. Во-первых, необходимо описать марковский процесс с m состояниями, время, между переходами которого случайно. Важными параметрами такого процесса являются интенсивности переходов. Обозначим через λij интенсивность перехода процесса из состояния Si в состояние Sj, при . Величины λij определяются следующим образом. За бесконечно малый интервал времени dt процесс, который находится в состоянии Si, будет совершать переход в состояние Sj с вероятностью λijdt (ij). Вероятность двух или более переходов за время dt имеет порядок {dt)2 или выше, и предполагается, что она бес­конечно мала, если dt выбирается достаточно малым. Мы будем рассмат­ривать процесс, для которого интенсивности переходов λij постоянны. Теперь можно описать марковский процесс с непрерывным временем матрицей интенсивностей переходов Λ с компонентами λij, диагональные элементы которой определены.

Вероятность того, что система находится в состоянии Si к моменту t после начала процесса называется вероятностью состояния . Ве­роятности состояний в момент t+dt можно связать с вероятностями состояний в момент t посредством уравне­ний:

, j=1,2,…,N. (3.1)

Система может попасть в состояние Sj в момент времени t+dt двумя взаимно исключающими друг друга путями. Во-первых, она уже может находиться в состоя­нии Sj в момент времени t и не сделать ни одного пере­хода в течение интервала dt. Эти события имеют вероятности и соответственно, так как мы предположили, что вероятности нескольких переходов имеют порядок высший, чем dt, и в расчет не принима­ются, а вероятность не сделать ни одного перехода за время dt равна 1 минус вероятность того, что за время dt система перейдет в некоторое состояние .

Во-вторых, в момент времени t система может находиться в одном из состояний и за время dt совершить переход из состояния Si в состояние Sj. Эти события имеют вероятности и λijdt соответственно. Эти вероятности должны быть перемножены и просуммированы по всем i, не равным j , так как система могла попасть в состояние Sj из любого состояния Si. Таким обра­зом получаются уравнения (3.1).

Определим диагональные элементы матрицы Λ по фор­муле:

(3.2)

Если переписать уравнение (3.1) с учетом равенства (3.2), то получим

или

.

Деля обе части последнего уравнения на dt и переходя к пределу при , получаем

, j=1,2,…,N. (3.3)

Уравнения (5.3) являются системой линейных диффе­ренциальных уравнений с постоянными коэффициентами, которые связывают вероятности состояний с матрицей интенсивностей переходов Λ1. Для того чтобы найти ее решения, нужно задать начальные условия .

В процессах с непрерывным временем матрица интенсивностей переходов Λ играет такую же роль, какую матрица вероятностей перехо­дов Р играет в процессах с дискретным временем. Теперь, однако, мы имеем систему дифференциальных (3.3). В матричном виде уравне­ния (3.3) можно записать следующим образом:

, (3.4)

где вектор вероятностей состояний в момент t.

Внедиагональные элементы матрицы Λ определяются интенсивностями переходов процесса. Диагональные элементы задаются равенством (3.2). Сумма элементов вдоль каждой строки матрицы Λ равна нулю или

.

Матрица, сумма элементов строк которой равна нулю, называется дифференциальной.

Марковский процесс с непрерывным временем и доходами Введём понятие дохода, получаемого при переходе системы из одного состояния в другое. Предположим, что система приносит доход rii за единицу времени в течение всего периода её пребывания в состоянии Si. Предположим далее, что, когда система совершает переход из состояния Si в состояние Sj , она приносит доход в rij единиц, т.е. доходы за переход.

Оценим ожидаемые прибыли от эксплуатации системы за время при данных начальных условиях. Через обозначим полный ожидаемый доход, который система принесет за время t, если начальным состоянием является состояние Si. Полный ожидаемый доход:

. (3.5)

Уравнение (3.5) может быть получено следующим образом. В течение интервала времени dt система может либо остаться в состоянии Si, либо совершить переход в некоторое другое состояние. Если она остается в состоянии Si в течение времени di, то доход составит riidt плюс ожидаемый доход vi(t), который она принесет за оставшиеся t единиц времени. Вероятность того, что система останется в состоянии Si течении времени dt равна 1 минус вероятность того, что за это время она совершит переход: . С другой стороны, за время dt система может совершить переход в некоторое состояние ji с вероятностью λij dt. В этом случае доход составит плюс ожидаемый доход , который будет получен за оставшееся время, если бы начальным было состояние Sj. Произведение вероятностей и доходов нужно просуммировать по всем состояниям ji, чтобы получить полное значение ожидаемого дохода.

Используя равенство (3.2), можно переписать уравнение (3.5) следующим образом:

или

,

где мы пренебрегаем членами более высокого порядка по сравнению с dt. Наконец, если вычесть vi(t) из обеих частей этого равенства и результат разделить на dt, то получим

.

Переходя к пределу при dt 0, находим

, i = 1, 2, …, N.

Назовем нормой вы­ручки величину:

.

Полные ожидаемые доходы vi (t) удовлетворяют системе линейных дифференциальных уравнений с постоянными коэффициентами и определя­ются из неё, если известны vi(t).

Построение структурной схемы итерационного алгоритма определения оптимальных стратегий технической эксплуатации.

Итерационный алгоритм улучшения ре­шения, предложенный Р. Ховардом позволяет существенно сократить объем вычисле­ний и сэкономить машинное время, за счет этого может быть значительно увеличена размерность решаемых задач.

Рассмотрим управляемый марковский процесс с доходами и расходами. Пусть пребывание устройства в со­стоянии Si связано с расходами в среднем rii рублей в единицу времени. Величина rii может характеризовать убытки от простоя оборудования на АP и ПО. Если устройство переходит из Si в Sj (ij), обусловлен­ные этим переходом средние расходы равны rij, руб., за один переход. Величина rij может характеризовать, например, стоимость отказа устройства во время опера­тивной работы. Ясно, что в общем случае rij и rij, могут быть положительными, отрицательными и равными нулю.

Как и ранее, задача оптимизации заключается в выборе таких стратегий в каждом состоянии, которые минимизируют математическое ожидание УЭР. Итерационный алгоритм позволяет осуществлять направленный перебор решений. Например, если устройство может нахо­диться в 10 состояниях и в каждом состоянии может применяться 10 стратегий, то, применяя обычный пере­бор, придется N1=1010 раз решать систему алгебраичес­ких уравнений десятого порядка. С помощью итерационного алгоритма оптимальное решение находят за несколько, обычно три – десять, итераций. Выведем аналитические выражения для целевой функции для состояния статистического рав­новесия. Дифференциальные уравнения, описывающие динамику расходов в переходном режиме, составляют так же, как и для вероятностей. Если устройство начинают эксплуатировать из состояния Si, математическое ожидание ЭР за время t определяется следующим образом:

(3.6)

Величину сi=rii+rij называют непосредственно ожидаемыми расходами для состояния Si. С учетом этого

, (3.7)

или в матричной форме

(3.8)

Используем преобразование Лапласа, тогда

(3.9)

где V(0) – вектор доходов в момент окончания процес­са; Е–единичная матрица. Матрица (sE–Л)-1 включа­ет матрицу Т предельных вероятностей с сомножителем s-1 – элементы i-й строки этой матрицы являются пре­дельными вероятностями процесса, если он начинается из состояния Si, и матрицу L(s) переходных составляю­щих, т.е. (sE–А)-1=s-1T+L(s).

Следовательно,

(3.10)

Для состояния статистического равновесия обратное преобразование Лапласа дает V(t)==tTc+L(0)c+TV(0), где постоянная составляющая ЭР Y==L(0)c+TV(0), а УЭР С=Тс. С учетом этого

, (3.11)

или

(3.12)

Дифференцируя уравнение (3.12) по времени с учетом дифференциальных уравнений для ЭР, получим

(3.13)

Так как уравнение (3.13) должно быть справедливо для состояния статистического равновесия (при t→∞), то сомножитель при t должен быть равен нулю и уравнение для УЭР распадается на два.

(3.14)

Мы рассматривали процесс, порождающий только один эргодический класс, поэтому ci = cj = С (математи­ческое ожидание УЭР не зависит от того, из какого со­стояния устройство начали эксплуатировать).

Следовательно, второе уравнение является тождеством, так как уравнение, отражает фундаментальное свойство матрицы интенсивностей переходов. Окончательно

(3.15)

Уравнение (3.15) лежит в основе итерационного алгоритма отыскания оптимальных решений. Итерацион­ный цикл состоит из двух операций: определение весов gj из решения системы (3.15) при gN-1=0 и улуч­шения решения, которое заключается в использо­вании полученных весов gj предыдущего решения для нахождения стратегии dik, минимизирующей УЭР:

(3.16)

Эта стратегия dik. становится новым решением в Si-м состоянии.

Новое вектор-решение D будет найдено, когда про­цедура улучшения решения будет выполнена для всех состояний. Если новое вектор-решение совпадает с предыдущим, итера­ционный процесс сошелся и оптимальное решение найде­но, в противном случае опять возвращаются операции определения весов. Если старое решение в состоянии Si приводит к оди­наковым УЭР с какой-либо другой стратегией, необхо­димо оставить старое решение – это обеспечивает сходи­мость итерационного процесса при наличии эквивалент­ных решений.

Как и другие методы линейного и динамического про­граммирования, итерационный метод справедлив только для режима статистического равновесия. Если необходи­мо оптимизировать ТО на конечном интервале времени (когда режим статистического равновесия еще не успе­вает установиться), применяют аппроксимацию Марковского процесса цепью с последующим использованием рекуррентного метода. Однако это существенно усложняет вычислительную процедуру.

По сравнению с другими методами линейного про­граммирования итерационный метод является более гиб­ким (структура расходов учитывается более дифферен­цирование), он легко программируется, позволяет суще­ственно сократить объем вычислений и затраты машин­ного времени при отыскании оптимальных решений.

Р ис.3.1. Общий итерационный цикл для процесса последовательных решений с непрерывным временем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]