Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Моделирование систем

..pdf
Скачиваний:
7
Добавлен:
19.11.2023
Размер:
38.5 Mб
Скачать

2. Сложность исследуемой системы S при ее моделировании на ЭВМ часто приводит к тому, что априорное суждение о харак­ теристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невоз­ можным. Поэтому при моделировании систем широко используют­ ся непараметрические оценки и оценки моментов распределения.

3. Блочность конструкции машинной модели Мм и раздельное исследование блоков связаны с программной имитацией входных переменных для одной частичной модели по оценкам выходных переменных, полученных на другой частичной модели. Если ЭВМ, используемая для моделирования, не позволяет воспользоваться переменными, записанными на внешние носители, то следует пред­ ставить эти переменные в форме, удобной для построения алгорит­ ма их имитации.

Методы оценки. Рассмотрим наиболее удобные для про­ граммной реализации методы оценки распределений и некоторых их моментов при достаточно большом объеме выборки (числе реализаций N). Математическое ожидание и дисперсия случайной величины £ соответственно имеют вид

li(= M [Q = | xf(x)dx\ ol=D[Q =M [(x—Ц()г]=

—00

= f (x-fi()zf(x)dx,

—00

где / ( JC) — плотность распределения случайной величины £, прини­ мающей значения х.

При проведении имитационного эксперимента со стохастической моделью системы S определить эти моменты нельзя, так как плот­ ность распределения, как правило, априори неизвестна. Поэтому при обработке результатов моделирования приходится довольст­ воваться лишь некоторыми оценками моментов, полученными на конечном числе реализаций N. При независимых наблюдениях зна­ чений случайной величины £ в качестве таких оценок используются

x= fk= (l/N ) £

xr, Si= Si= (l/N ) £ ( ъ - х ) 2,

i=1

i =l

где 5c и Sb2 — выборочное среднее и выборочная дисперсия соответ­ ственно. Знак ~ над /2$ и о* означает, что эти выборочные моменты используются в качестве оценок математического ожидания и ди­ сперсии Of2.

К качеству оценок, полученных в результате статистической обработки резуль­ татов моделирования, предъявляются следующие требования [7, 11, 25]:

1) несмещенность оценки, т. е. равенство математического ожидания оценки определяемому параметру M \ g \ = g , где g — оценка переменной (параметра) g;

2) эффективность оценки, т. е. минимальность среднего квадрата ошибки данной

16 — 4833

241

оценки M\gx—g]^M[(gi—g)2], где gx — рассматриваемая оценка; gi — любая другая оценка;

3) состоятельность оценки, т. е. сходимость по вероятности при N-+ со к оцени­ ваемому параметру

lim P{\g-g\>e}=0, е>0,

*-♦00

либо, учитывая неравенство Чебышева, достаточное (но не обязательно необходи­ мое) условие выполнения этого неравенства заключается в том, чтобы

lim JV-+0D

Рассмотрим оценку выборочного среднего значения х. Математическое ожида­ ние выборочного среднего значения х составит

щ

т.е. оценка Д{=х является несмещенной.

С учетом независимости значений х,- средний квадрат ошибки

т.е. оценка р^=х состоятельна. Можно показать, что эта оценка также и эффективна. Рассмотрим оценку выборочной дисперсии S2. Математическое ожидание выбо­

рочной дисперсии

X (x,-x)2J = i м|^Х

Учитывая, что

If

 

ft

(хг-/1{)2 -#(х-Д{)2,

х

(х,-х) 2 = £

1-1

1-1

 

M

f a i -

M p - / i {)2]=o-£/W,

получим M[S2]=(M rf—af)fN—(N—1)ixf/iV, т. e. оценка erf—5? является смещенной. Можно показать, что эта оценка состоятельна и эффективна.

Несмещенную оценку дисперсии of можно получить, вычисляя выборочную дисперсию вида

Эта оценка также удовлетворяет условиям эффективности и состоятельности.

Статистические методы обработки. Рассмотрим некоторые осо­ бенности статистических методов, используемых для обработки результатов моделирования системы S. Для случая исследования сложных систем при большом числе реализаций N в результате моделирования на ЭВМ получается значительный объем инфор­ мации о состояниях процесса функционирования системы. Поэтому необходимо так организовать в процессе вычислений фиксацию и обработку результатов моделирования, чтобы оценки для ис­

242

комых характеристик формировались постепенно по ходу модели­ рования, т. е. без специального запоминания всей информации о состояниях процесса функционирования системы S.

Бели при моделировании процесса функционирования конкрет­ ной системы S учитываются случайные факторы, то и среди резуль­ татов моделирования присутствуют случайные величины. В качест­ ве оценок для искомых характеристик рассчитывают средние значе­ ния, дисперсии, корреляционные моменты и т. д.

Пусть в качестве искомой величины фигурирует вероятность некоторого события А. В качестве оценки для искомой вероятности р —Р{А) используется частость наступления события m/N, где т — число случаев наступления события А; N — число реализаций. Такая оценка вероятности появления события А является состо­ ятельной, несмещенной и эффективной. В случае необходимости получения оценки вероятности в памяти ЭВМ при обработке ре­ зультатов моделирования достаточно накапливать лишь число m (при условии, что N задано заранее).

Аналогично при обработке результатов моделирования можно подойти к оценке вероятностей возможных значений случайной величины, т. е. закона распределения. Область возможных значений случайной величины rj разбивается на п интервалов. Затем накап­ ливается количество попаданий случайной величины в эти интерва­

лы тк, к 1, /2. Оценкой для вероятности попадания случайной величины в интервал с номером к служит величина mk/N. Таким образом, при этом достаточно фиксировать п значений тк при обработке результатов моделирования на ЭВМ.

Для оценки среднего значения случайной величины Т]накаплива­

ется сумма возможных значений случайной величины ук, к= 1, N, которые она принимает при различных реализациях. Тогда среднее значение

У=0/ЛО £ Ук.

При этом ввиду несмещенности и состоятельности оценки

=D{p]=D[rj]/N=^IN.

Вкачестве оценки дисперсии случайной величины т]при обработ­ ке результатов моделирования можно использовать

S i = t (Ук- y flN .

Непосредственное вычисление дисперсии по этой формуле нера­

ционально, так как среднее значение у изменяется в процессе накоп­ ления значений ук. Это приводит к необходимости запоминания всех N значений ук. Поэтому более рационально организовать фик­

16*

2 4 3

сацию результатов моделирования для оценки дисперсии с исполь­ зованием следующей формулы:

Тогда для вычисления дисперсии достаточно накапливать две

суммы: значений ук и их квадратов ук1.

Для случайных величин { и rj с возможными значениями хк и ук корреляционный момент

N или

*{, = ( д w - ( . m J ;

£ y ^ j o r - 1).

Последнее выражение вычисляется при запоминании в процессе моделирования небольшого числа значений.

Если при моделировании системы S искомыми характеристи­ ками являются математическое ожидание и корреляционная функ­ ция случайного процесса y(t) [в интервале моделирования (0, 7)], то для нахождения оценок этих величин указанный интервал разбива­ ют на отрезки с постоянным шагом At и накапливают значения процесса ук(/) для фиксированных моментов времени t — tm=mAt.

При обработке результатов моделирования математическое ожидание и корреляционную функцию запишем так:

N

N

У(‘т)= £

yh(tm)IN; B(u, z)= £ (Ук1и)-у(и))(Ук(г)~У (z))l(N -1),

Jt= l

к=1

где и R Z пробегают все значения tm.

Для уменьшения затрат машинных ресурсов на хранение проме­ жуточных результатов последнее выражение также целесообразно

привести к следующему виду:

 

 

 

z)= ( £ ук(и) yt (z)-(llN )

£

ytl(u) £

у к(z) j (ЛГ-1).

\Jfc= 1

*=1

к=1

/

Отметим особенности фиксации и обработки результатов моде­ лирования, связанные с оценкой характеристик стационарных слу­ чайных процессов, обладающих эргодическим свойством. Пусть рассматривается процесс y(t). Тогда с учетом этих предположений поступают в соответствии с правилом: среднее по времени равно среднему по множеству. Это означает, что для оценки искомых характеристик выбирается одна достаточно продолжительная ре­

244

ализация процесса y(t), для которой целесообразно фиксировать результаты моделирования. Для рассматриваемого случая запишем математическое ожидание и корреляционную функцию процесса:

У= lim

(1/7) [y(t)dt; В(т)= lim [1/(Г-т)] [ y(.l)y(t+ T:)dt-y2.

Г-*оо

I

Т-* со

На практике при моделировании на ЭВМ системы S интервал (О, 7) оказывается ограниченным и, кроме того, значения у (/) удается определить только для конечного набора моментов времени tm. При обработке результатов моделирования для получения оценок у и В(т) используем приближенные формулы

Г / Д г ( Г — т ) / д г

У =(А //7) £ y (Q ; В Ь )= Ш 1(Т -х)]

£ y (Q y (t„ + x ) - y 2,

m = 1

т = 1

которые целесообразно преобразовать к виду, позволяющему эф­ фективно организовать порядок фиксации и обработки результатов моделирования на ЭВМ [4].

Задачи обработки результатов моделирования. При обработке результатов машинного эксперимента с моделью Мм наиболее ча­ сто возникают следующие задачи: определение эмпирического зако­ на распределения случайной величины, проверка однородности рас­ пределений, сравнение средних значений и дисперсий переменных, полученных в результате моделирования, и т. д. Эти задачи с точки зрения математической статистики являются типовыми задачами по проверке статистических гипотез.

Задача определения эмпирического закона распределения слу­ чайной величины наиболее общая из перечисленных, но для пра­ вильного решения требует большого числа реализаций N. В этом случае по результатам машинного эксперимента находят значения выборочного закона распределения F3(y) (или функции плотности f 3 (у)) и выдвигают нулевую гипотезу Н 0, что полученное эмпиричес­ кое распределение согласуется с каким-либо теоретическим рас­ пределением. Проверяют эту гипотезу Н 0 с помощью статистичес­ ких критериев согласия Колмогорова, Пирсона, Смирнова и т. д., причем необходимую в этом случае статистическую обработку ре­ зультатов ведут по возможности в процессе моделирования систе­ мы S на ЭВМ.

Для принятия или опровержения гипотезы выбирают некоторую случайную величину U, характеризующую степень расхождения теоретического и эмпирического распределения, связанную с недо­ статочностью статистического материала и другими случайными причинами. Закон распределения этой случайной величины зависит от закона распределения случайной величины rj и числа реализаций N при статистическом моделировании системы 5. Если вероятность

245

расхождения теоретического и эмпирического распределений P{Ur^U } велика в понятиях применяемого критерия согласия, то проверяемая гипотеза о виде распределения Яр не опровергается. Выбор вида теоретического распределения F(y) (илиf(y)) проводит­ ся по графикам (гистограммам) F3(y) (или f a(y))9 выведенным на печать или на экран дисплея.

Рассмотрим особенности использования при обработке резуль­ татов моделирования системы S на ЭВМ ряда критериев согласия [7, 11, 18, 21, 25].

Критерий согласи Колмогорова. Основан на выборе в качестве меры расхожде­ ния U величины 2>=max[F3(y)—F(y)].

Из теоремы Колмогорова следует, что 5 = D y/N при N-+co имеет функцию распределения

5(г)= ^{«< г}= £ ( - l) * e - e v ,z > 0 .

к— Л

Если вычисленное на основе экспериментальных данных значение 5 меньше, чем табличное значение при выбранном уровне значимости у, то гипотезу Н 0 принимают, в противном случае расхождение между Fa(y) и F(y) считается неслучайным^ гипо­ теза Н0 отвергается.

Критерий Колмогорова для обработки результатов моделирования целесообраз­ но применять в тех случаях, когда известны все параметры теоретической функции распределения. Недостаток использования этого критерия связан с необходимостью фиксации в памяти ЭВМ для определения D всех статистических частот с целью их упорядочения в порядке возрастания.

Критерий согласи Пирсона. Основан на определении в качестве меры расхожде­ ния U величины

t = 1i-1 <щ - я т т .

где ш/ — количество значений случайной величины JJ, попавших в i-й подынтервал; p i — вероятность попадания случайной величины ц в i-й подынтервал, вычисленная из теоретического распределения; d — количество подынтервалов, на которые раз­ бивается интервал измерения в машинном эксперименте.

При N-* со закон распределения величины U, являющейся мерой расхождения, зависит только от числа подынтервалов и приближается к закону распределения х* (хи-квадрат) с {d—r—1) степенями свободы, где г — число параметров теоретиче­ ского закона распределения.

Из теоремы Пирсона следует, что, какова бы ни была функция распределения F(y) случайной величины г/, при N-* со распределение величины х2 имеет вид

FkМ = Р {*2< z} = l/[2fc/2Г (fc/2)] j e-'/2 p f i - Ч dt> г>0)

0

где Г (k/2) — гамма-функция; z — значение случайной величины х2; к —d —r 1 — число степеней свободы. Функции распределения Fk(z) табулированы.

По вычисленному значению U—xi и числу степеней свободы к с помощью таблиц находится вероятность Р {Хт^Х2}- Если эта вероятность превышает некото­ рый уровень значимости у, то считается, что гипотеза Н0 о виде распределения не опровергается результатами машинного эксперимента.

Критерий согласия Смирнова. При оценке адекватности машинной модели М м ре­ альной системе S возникает необходимость проверки гипотезы Я 0, заключающейся в том, что две выборки принадлежат той же генеральной совокупности. Если

246

выборки независимы и законы распределения совокупностей F(u) и F(z), из которых извлечены выборки, являются непрерывными функциями своих аргументов v и £, то дня проверки гипотезы Н 0 можно использовать критерий согласия Смирнова, при­ менение которого сводится к следующему. По имеющимся результатам вычисляют эмпирические функции распределения F3(u) и F3(z) и определяют

2)=max |F3(M) —F3(r)|.

Затем при заданном уровне значимости у находят допустимое отклонение

0 ,-y /to i< U N ,+ l

где N x и N2 — объемы сравниваемых выборок для F3(u) и F3(z), и проводят сравнение значений D и Dy: если D >D y>то нулевую гипотезу Н0 о тождественности законов распределения F(u) и F(z) с доверительной вероятностью /3=1—у от­ вергают.

Критерий согласия Стьюденга. Сравнение средних значений двух независимых выборок, взятых из нормальных совокупностей с неизвестными, но равными диспер­ сиями D[v]=D[£\, сводится к проверке нулевой гипотезы Н0: A = u—z= 0 на основа­ нии критерия согласия Стьюденга (/-критерия). Проверка по этому критерию сводит­ ся к выполнению следующих действий. Вычисляют оценку

< = [(« -;)/V (A r,-l)S H № -l)o f?]/V W 1W3(Wl +WJ -2)/(W 1+WJ)>

где N t и N2 — объемы выборок для оценки й и г соответственно; сг? и erf — оценки дисперсий соответствующих выборок.

Затем определяют число степеней свободы k= N 1+N2—2, выбирают уровень значимости у и по таблицам находят значение /у. Расчетное значение t сравнивается с табличным ty и если |/| < /у, то гипотеза Я 0 не опровергается результатами машин­ ного эксперимента.

Критерий согласия Фишера. Задача сравнения дисперсий сводится к проверке вулевой гипотезы Я 0, заключающейся в принадлежности двух выборок к одной и той же генеральной совокупности. Пусть необходимо сравнить две дисперсии erf и erf, полученные ери обработке результатов моделирования и имеющие кх и к2 степеней свободы соответственно, причем erf >бг§. Для того чтобы опровергнуть нулевую гипотезу Я 0: а \= о \, необходимо при уровне значимости у указать значимость расхождения между а\ и erf. При условии независимости выборок, взятых из нор­ мальных совокупностей, в качестве критерия значимости используется распределение Фишера (F-критерий) F= a\la2, которое зависит только от числа степеней свободы k1= N 1—\, k2= N 2—\, где Nx и N2 — объемы выборок для оценки а\ и cf соответ­ ственно.

Алгоритм применения критерия Фишера следующий: 1) вычисляется выборочное отношение F= ffi/all 2) определяется число степеней свободы k 1=Ni — l и к 2 =N2—1;

3)

при выбранном уровне значимости у по таблицам ^-распределения находятся

значения границ

критической области

F1 — l/[Fi^yj2 (kXt fc2)]; F2—F \^yp_(fcls

к2);

4)

проверяется неравенство FX^ 1 ^ F 2;

если

это неравенство выполняется, то

с

доверительной

вероятностью /} нулевая

гипотеза Я 0: а \= а\ может

быть

принята.

Хотя рассмотренные оценки искомых характеристик процесса функционирования системы S, полученные в результате машинного эксперимента с моделью Мм, являются простейшими, но охватыва­ ют большинство случаев, встречающихся в практике обработки результатов моделирования системы для целей ее исследования и проектирования.

247

7.2. АНАЛИЗ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ МАШИННОГО МОДЕЛИРОВАНИЯ

Возможность фиксации при моделировании системы S на ЭВМ значений переменных (параметров) и их статистическая обработка для получения интересующих экспериментатора характеристик по­ зволяют провести объективный анализ связей между этими вели­ чинами. Для решения этой задачи существуют различные методы, зависящие от целей исследования и вида получаемых при модели­ ровании характеристик. Рассмотрим особенности использования методов корреляционного, регрессионного и дисперсионного анали­ за для результатов моделирования систем [7, 11, 18, 21, 25, 46].

Корреляционный анализ результатов моделирования. С помощью корреляционного анализа исследователь может установить, насколь­ ко тесна связь между двумя (или более) случайными величинами, наблюдаемыми и фиксируемыми при моделировании конкретной системы S. Корреляционный анализ результатов моделирования сводится к оценке разброса значений ц относительно среднего значе­ ния у, т. е. к оценке силы корреляционной связи. Существование этих связей и их тесноту можно для схемы корреляционного анали­ за у=М[ц/£=х] выразить при наличии линейной связи между ис­ следуемыми величинами и нормальности их совместного распреде­ ления с помощью коэффициента корреляции

rt,=M[Z-M№M[4-M[4WjD№Dl7ji =

т. е. второй смешанный центральный момент делится на произведе­ ние средних квадратичных отклонений, чтобы иметь безразмерную величину, инвариантную относительно единиц измерения рассмат­ риваемых случайных переменных.

Пример 7.1. Пусть результаты

моделирования получены при N реализациях,

а коэффициент корреляции

 

£ (хк-х)(Ук~У)

£ W k - N x y

Очевидно, что данное соотношение требует минимальных затрат машинной памяти на обработку результатов моделирования. Получаемый при этом коэффици­ ент корреляции |г ^ |* а При сделанных предположениях г^п—0 свидетельствует о взаимной независимости случайных переменных £ и у, исследуемых при моделиро­ вании (рве. 7.1, а). При \г£п\ 1 имеет место функциональная (т. е. нестохастическая) линейная зависимость ъщ&.у=Ьа+Ьхх, причем если г^ > 0 , то говорят о положитель­ ной корреляции, т. е. большие значения одной случайной величины соответствуют большим значениям другой (рис. 7.1, б). Случай 0<Г{,,<1 соответствует либо

наличию линейной корреляции с рассеянием (рис. 7.1, в), либо наличию нелинейной корреляции результатов моделирования (рис. 7.1, г).

248

а)

 

 

6)

в)

а<^тГ I

У

О

 

 

У

о

0

«

 

Оо о

о о

О

о

 

О

о

0

 

О°

о

о ° о

 

О о«^°

 

 

°

о

о

X

X

х

 

 

 

Рис. 7.1. Различные случаи корреляции переменных

Для того чтобы оценить точность полученной при обработке результатов моделирования системы S оценки г^, целесообразно ввести в рассмотрение коэффициент w = ln [(l+ r{4) /( l - r {jJ)]/2, при­ чем w приближенно подчиняется гауссовскому распределению со средним значением и дисперсией:

Дн,=1п[(1+Г{,)/(1 -Г{,)]/2, о»— l/(N 3).

Из-за влияния числа реализаций при моделировании N на оценку коэффициента корреляции необходимо убедиться в том, что действительно отражает наличие статистически значимой корреляционной зависимости между исследуемыми переменными модели Мм. Это можно сделать проверкой гипотезы Н0: г^= 0. Если гипотеза Н 0 при анализе отвергается, то корреляционную зависи­ мость признают статистически значимой. Очевидно, что выбороч­ ное распределение введенного в рассмотрение коэффициента w при г ^ = 0 является гауссовским с нулевым средним ftw=0 и дисперсией

c i= (N З)-1. Следовательно, область принятия гипотезы Н0 опре­ деляется неравенством

-z& 4 ;y /N -3 ln [(l+ r{,) /( l - r {,)]/2<2^2,

где zaj2 подчиняется нормированному гауссовскому распределению. Если лежит вне приведенного интервала, то это означает наличие корреляционной зависимости между переменными модели на уров­ не значимости у.

При анализе результатов моделирования системы S важно от­ метить то обстоятельство, что даже если удалось установить тес­ ную зависимость между двумя переменными, то отсюда еще непо­ средственно не следует их причинно-следственная взаимообуслов­ ленность. Возможна ситуация, когда случайные f и q стохастически зависимы, хотя причинно они являются для системы S независимы­ ми. При статистическом моделировании наличие такой зависимо­ сти может иметь место, например, из-за коррелированности после­ довательностей псевдослучайных чисел, используемых для имита­ ции событий, положенных в основу вычисления значений JC и у.

Таким образом, корреляционный анализ устанавливает связь между исследуемыми случайными переменными машинной модели

249

и оценивает тесноту этой связи. Однако в дополнение к этому желательно располагать моделью зависимости, полученной после обработки результатов моделирования.

Регрессионный анализ результатов моделирования. Регрессион­ ный анализ дает возможность построить модель, наилучшим об­ разом соответствующую набору данных, полученных в ходе машин­ ного эксперимента с системой S. Под наилучшим соответствием понимается минимизированная функция ошибки, являющаяся раз­ ностью между прогнозируемой моделью и данными эксперимента. Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок.

Пример 7.2. Рассмотрим особенности регрессионного анализа результатов моде­ лирования при построении линейной регрессионной модели. На рис. 7.2, а показаны

точки Xhуь /= 1, М полученные в машинном эксперименте с моделью Мм системы S. Делаем предположение, что мо­ дель результатов машинного экс­ перимента графически может быть представлена в виде прямой линии

i > = < P ( * ) = A o + b i * >

Рис. 7.2. Построение линейной регрессионной модели

где у — величина, предсказы­ ваемая регрессионной моде­ лью.

Требуется получить такие зна­ чения коэффициентов Ьа и Ь1г при которых сумма квадратов ошибок является минимальной. На рисун­

ке ошибка е/, /= 1, N, для каждой экспериментальной точки определяется как расстояние по вертикали от этой точки до линии регрессии у=(р(х).

Обозначим $i=b0+ ЬХХ{, /= 1, N. Тогда выражение для ошибок будет иметь вид

N

ei^fr-y i^b o + b & i-y b а функция ошибки i?0= £ (60+ £ ^ - у ,)2.

1-1

Для получения Ь0и Ь1}при которых функция F0 является минимальной, применя­ ются обычные методы математического анализа. Условием минимума является

8FJdb0=6; 8F0{dbl =Q.

Дифференцируя Fo, получаем

8F0l8b0=d

£ (i0+ 41*i-y ,)1/8i0=2(W i.0+ * 1 £

х , - £

я ) - О ,

 

i-i

\

i-i

i-i

/

j y

 

 

 

 

| у

d F J d b ^d £

(Ь о + Ь м -у ^ /д Ь ^ М о

£

xi+2b1 £

х ? - 2

£ Х{у,=0.

i - i

 

i - i

i - i

 

i - i

Решая систему этих двух линейных алгебраических уравнений, можно получить значения Ь0 и Ьх. В матричном представлении эти уравнения имеют вид

250

Соседние файлы в папке книги