Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Казаков В.А. Введение в теорию марковских процессов и некоторые радиотехнические задачи

.pdf
Скачиваний:
21
Добавлен:
23.10.2023
Размер:
7.76 Mб
Скачать

которая с весом pik является слагаемым искомой вели­ чины <tij>i. Суммируя по всем k, получаем

Щі

= Ьц+

2 РІИІ)Ь.

(1-22)

Учитывая правила сложения и перемножения ма­ триц, на основе (1.22) получаем матричное соотноше­ ние

откуда

{<**>*} =

i + Q {<**>*}.

 

 

{ № } =

( I - Q ) - l =

N.

(1.23)

 

Таким

образом,

каждый

элемент

фундаментальной

матрицы

означает

среднее

число попаданий

процесса

в данное невозвратное состояние в зависимости от на­ чального состояния. Из (1.22) следует, что в матрице N элементы главной диагонали (i = j) должны быть боль­ ше единицы.

Вычислим фундаментальную матрицу для поглощаю­ щей цепи Маркова, рассмотренной в примере 2 § 1.2. Из соотношений (1.18), (1.19) имеем:

тогда

I - Q = -g

1 _ р .

(1.24)

Как известно {5, 6], любая невырожденная квадрат­ ная матрица А порядка k имеет единственную обратную матрицу, записываемую в виде

(

Аи

Ац

. . .

Ahl

\

 

Л1 2

А22

. . .

Л й 2

,

(1.25)

•^т

2ь . . .

-^hh '

 

где \А\—определитель матрицы А; Ац — алгебраиче­

ское дополнение элемента

ац, связанное с минором Мц

соотношением Ац = (1 )

i+JMij.

20

Используя определение (1.25), для матрицы (1.24) легко получаем обратную

(1.26)

где последнее равенство записано на основе (1.23) в со­ ответствии с новой нумерацией состояний.

Конкретизируем пример, задав р= 1/4- Тогда из (1.26) получим

(1.27)

Рассмотрим, например, вторую строку матрицы (1.27). Элементы этой строки показывают, что если про­ цесс начинается из состояния х ^ то с учетом единичного вклада начального состояния процесс проводит в этом

состоянии в среднем 8 Д .единиц времени. С

начального

момента

процесс

проведет в состоянии Хз в

среднем

%

единиц

времени,

а в состоянии хь — только

2/э- Анало­

гично можно пояснить значения элементов

первой

и

третьей

строк. Подчеркнем, что в силу однородности

марковской цепи

в качестве начального состояния мож­

но выбрать любое состояние, в котором оказывается процесс в данный момент времени. Следовательно, фун­ даментальная матрица дает одинаковый прогноз на бу­ дущее независимо от абсолютного значения времени, прошедшего от начального момента. Это обстоятельство, в частности, иллюстрирует марковское свойство процес­ са, характеризуя его как процесс без последействия: при известном настоящем будущее не зависит от прошлого. При этом следует иметь в виду, что указанное свойство фундаментальной матрицы не противоречит характеру изменений безусловных вероятностей и вероятностей пе­ рехода с течением времени: у поглощающих цепей без­

условная вероятность при большом

п попасть

в невоз­

вратное состояние мала, но если

система

оказалась

в этом состоянии, то средние времена, которые

проведет

процесс в невозвратных состояниях,

определяются с по­

мощью матрицы N.

 

 

21

Фундаментальная матрица позволяет вычислить еще целый ряд важных характеристик марковской цепи.

Обозначим через U время, которое

проводит процесс

в невозвратных состояниях,

включая

время пребывания

в начальном состоянии ХІ. С учетом

масштабного

коэф­

фициента величина

ti представляет

собой число

шагов,

которое совершает

процесс

при переходе из начального

состояния в поглощающее, т. е.

 

 

 

 

ti=

S rij.

 

 

 

Тогда среднее время до поглощения при начальном со­ стоянии ХІ равно:

''fop = <**) = ( 2 і Д = Е {п3)і.

(1.28)

Соотношение (1.28) указывает путь для определения важнейшей характеристики цепи tiCp. Именно: сумми­ руя построчно элементы фундаментальной матрицы, по­ лучаем вектор-столбец величины ticp:

{&ер>} = Ш

=

{ 2

(1.29)

Применительно

к числовому

примеру имеем

 

 

А о р \

Л . 8 \

 

 

{ticP{ = \ tict

1 = 1 3,2 I .

 

 

 

'sep

3,4

 

Полученный

результат

свидетельствует о том, что

быстрее всего

поглощающее

состояние можно

достичь

из состояния Хз. Естественно было бы ожидать, что ве­ личина ticp будет меньше rfscp, так как попасть в погло­ щающее состояние из среднего труднее, чем из близле-

жащих

состояний. Однако в рассматриваемом

примере

в трех

случаях из четырех

(q=3'U) движение

частицы

происходит по направлению

к состоянию х \ ,

поэтому

^5ср>^4срРазберем теперь вопрос о том, в к а к о е из погло­

щающих состояний попадет блуждающая частица. Для этого необходимо вычислить все возможные вероятности bij того, что процесс, выходящий из невозвратного со­ стояния ХІ, попадает в поглощающее состояние Xj. При

22 •

подсчете вероятностей Ьц придется оперировать

с эле­

ментами подматрицы R .матрицы

перехода Р

(1.19),

так как именно вероятности, образующие подматрицу R,

характеризуют переходы процесса

из невозвратных со­

стояний в поглощающие.

Если процесс выходит из невозвратного состояния хь то, во-первых, он может с вероятностью р ц оказаться в интересующем нас поглощающем состоянии Xj (веро­ ятности Pij образуют подматрицу R), во-вторых, процесс может попасть с вероятностью р ш в любое другое не­ возвратное состояние Xh (вероятности pik образуют под­

матрицу Q) и уже оттуда

с

вероятностью Ьщ

перейти

в поглощающее

состояние

хг

Таким образом,

 

 

btj = Pij-\r

 

^ Pikbkj,

 

или в матричной

форме

 

 

 

Отсюда

B = R+QB.

 

В = ( І — Q ) - i R = N R .

(1.30)

 

Применение (1.30) к рассматриваемому числовому при­ меру приводит к следующему результату:

ІЧ

0\

Пи

0 \

 

/ » / „

V* Ѵю

R = о о 1 = 1 о о ; N =

ѵв

 

7s V.

Ѵо

pi

\ о

ѵ /

 

Ч . .

ju

"Л»

 

 

 

/&зі

ь3л

89/40

'Ло

B =

N R = k ,

\ : \

/10

V.o

 

 

 

 

 

27/

13/

 

 

 

 

 

 

/40

/40

 

 

 

 

 

 

Из-за существенной разницы

между

вероятностями

р и q вероятность Ьц

попасть из

любого

невозвратного

состояния ХІ в поглощающее состояние Хі больше, чем вероятность попадания в состояние xz. Полная вероят­ ность поглощения процесса, выходящего из любого на­ чального состояния, равна единице. Этот факт легко подтверждается построчным суммированием элементов последней матрицы.

С помощью фундаментальной матрицы N можно вы­ числить и другие характеристики'поглощающих цепей Маркова. В частности, помимо средних значений вычи­ слены, например, дисперсии величин tij и ti [3].

23

1.5. Эргодические цепи Маркова

Напомним, что эргодическая марковская цепь не со­ держит поглощающих состояний и состоит из одного класса сообщающихся состояний. Если время существо­ вания процесса в поглощающей системе конечно, то при отсутствии 'поглощающих состояний процесс может раз­ виваться сколь угодно долго. В связи с этим основной интерес представляет вопрос о том, как изменяются с течением времени безусловные вероятности состояний эргодической цепи. Для эргодических цепей справедли­

ва следующая

важная

т е о р е м а М а р к о в а о предель­

ных

вероятностях.

 

 

 

шагов п вероятность

 

При увеличении числа

перехода

pij(n)

из состояния

ХІ

в состояние

Xj

стремится

к опре­

деленному пределу

pj,

называемому

ф и н а л ь н о й ве­

роятностью, т. е.

fij

(п) =

pj

 

 

 

i, j

 

 

 

Ііш

для всех

(1.31)

 

 

л-юо

 

 

 

 

 

 

 

 

 

или в матричной

форме

 

 

 

 

 

 

 

 

 

 

Pu

(л)

Pu

(л)

• •

PIN (Л)

 

 

 

 

 

А. (л)

А . СО

• • •

РмО)

 

 

 

 

(Ал H

Рт (л)

• • •

% ( « )

 

 

/

А

 

 

А

• • •

P N

 

 

 

 

— [

А

 

 

А

• • •

PN

 

 

(1.32)

 

 

 

 

 

 

 

 

 

 

 

 

\

А

 

А

• • •

PN

 

 

 

Доказательство этой теоремы можно найти, например,

в[1].

Соотношения (1.31), (1.32) означают, что предел ве­ роятности перехода между любыми состояниями эрго­ дической цепи существует и не зависит от состояния х*. Иными словами, по истечении достаточно большого вре­

мени вероятность

того, что

процесс

будет

находиться

в состоянии Xj не зависит от того, из

какого состояния

этот процесс начал

развиваться.

Поэтому

говорят, что

марковские цепи (равно, как и марковские

процессы,

рассматриваемые в дальнейшем)

«забывают» свое прош­

лое.

 

 

 

 

 

 

 

Для эргодических

цепей

безусловные

 

вероятности

p(")j при увеличении

п также

стремятся

к

финальным

24

вероятностям

р,.

Действительно,

 

найдя предел

(1.16),

с учетом

(1.31),

получаем

 

 

 

 

lim

/ > ; л

, = 1 і т £ p[0)Pn('l)

=

l ,

p{t0)ïmPij(n)

=

 

 

 

І=І

( = 1

 

 

 

 

 

• = І 1 ^ 0 ) Л

=

Л .

(1.33)

 

 

 

1=1

 

 

 

 

Соотношение

(1.33) указывает

на то, что при

доста­

точно большом п безусловные вероятности состояний, составляющие в совокупности одномерное распределе­ ние, не зависят от времени. Поскольку у рассматривае­ мых однородных цепей Маркова вероятности перехода также не зависят от времени, то при достаточно боль­ шом п можно считать, что двумерное распределение безусловных состояний зависит лишь от разности мо­ ментов времени.

Из корреляционной теории случайных процессов из­ вестно, что если двумерная плотность вероятности зави­ сит от разности времени между сечениями процесса, то такой процесс является стационарным (в широком смысле). Это обстоятельство позволяет воспользоваться аналогией и назвать режим работы эргодической систе­ мы при достаточно большом п с т а ц и о н а р н ы м . Оче­ видно, стационарный режим возможен лишь у однород­ ных цепей. До наступления стационарного режима си­

стема находится

в п е р е х о д н о м режиме, длительность

которого можно

определить,

выбрав некоторый крите­

рий, зависящий

от разности

р^—pWj.

Вычисление финальных вероятностей при известном начальном распределении и заданной матрице перехода представляет собой наиболее важную задачу при изуче­ нии эргодических цепей. Первый путь определения веро­ ятностей pj дает теорема Маркова (1.32), согласно ко­ торой возведение матрицы перехода в достаточно боль­ шую степень п должно дать матрицу-строку искомых вероятностей. Ясно, однако, что определять финальные вероятности подобным. образом весьма трудоемко. Го­ раздо проще они находятся из решения системы алге­ браических уравнений, которая составляется исходя из следующих 'соображений. В соответствии с формулой полной вероятности запишем соотношение, которое опра-

ведл'иво при произвольном п

^ + , ) = 2 / > : e w

1=1

Но ів стационарном режиме (.при -большом п) 'безуслов­ ные вероятности равны финальным

поэтому

ft=S»

(1.34)

 

І=І

Система (1.34) из N алгебраических уравнений является однородной и, следовательно, имеет лишь ну­ левое решение. Если же из (1.34) взять /V—I уравнение и дополнить их условием нормировки

 

ІРІРЦ-РІ^О;

 

 

 

(1.35)

 

І=І

 

 

i=i

 

 

то такая

система дает уже ненулевое

решение.

Рассмотрим на

числовом

примере, как изменяются

матрицы

перехода и безусловные

вероятности состояний

с ростом числа п. Пусть матрица

перехода имеет вид

 

(Pu

Pu

Ргг\

/0,6

0,3

0,1\

 

Р = І Л і

A i

Р23 H

0 - 4

0.2

0,4 I .

 

Ѵ З І

Pit

Ргг '

0,2

0,5

0,3'

Возводя эту матрицу во вторую, третью и четвертую сте­ пени, получаем

 

 

 

/0,5

 

0.29

 

Р(2) =

Р * = ( о , 4

 

0,36

 

 

 

 

Ч),38

0,31

 

 

 

/

0,4458

0,3145

 

Р(3) =

Р 5 =

І

0,4352

0,3200

 

 

 

\

0,4318

0,3179

 

 

 

 

/0,4391

 

0,3170

0,24394

Р(4) =

Р'1

=

І 0,4390

0,3171

0,2439 .

 

 

 

Ч),4390

 

0,3171

0,2439'

Как видно, матрица перехода уже за четыре шага вырождается в матрицу, полностью определяемую ма-

26

трицей-строкой. Небольшие различия в четвертом знаке после запятой исчезают полностью в матрице

Согласно теореме Маркова финальные вероятности для этого примера равны

рі=0,4391, /72 =О,3170; р 3 =0,2439 . Вычислим теперь безусловные вероятности состояний

для нескольких

величин п

при различных начальных

распределениях:

 

 

 

1)

Р 0 =

(0,2

0,3

0,5),

 

2)

Ро =

(0,1

0,8

0,1),

3)

Р о = ( Ѵ 3

V3

V 3 ),

 

 

4)

Ро = (0

0

1),

 

 

5)

Р 0 = (0,4391

0,3170

0,2439).

Р(2), Р(3)

Используя рассчитанные

выше матрицы

и Р(4), для пяти начальных

распределений

по формуле

(1.15) можно получить следующие результаты, для удоб­ ства сведенные в табл. 1—5.

Таблицы показывают изменение безусловных вероят­ ностей с ростом числа шагов. Хорошо заметен эффект «забывания» начального распределения. Как видно из табл. 1—4, независимо от вида начального распределе­ ния уже через четыре шага наступает стационарный режим. Табл. 5 указывает на то, что при начальном рас­ пределении, равном распределению финальных вероят­ ностей, во все моменты времени имеет место стационар­ ный режим.

Вычислим теперь финальные вероятности состояний путем решения системы уравнений. Согласно (1.35) имеем:

РіРн+р%р%\.+РзРзі—Рі=0 ;

Pipi2+Р2Р22+РзРзг—Рг=0 ;

Рі + Р2+Рз=Л,

или

—0,4р1 +0,4/?2 +0,2рз=0; 0,3/?!—0,8/72+0,5р3=0;

Р і + / ? 2 + Р з = 1 .

27

Р 0

= (0,2 0,3

0,5)

 

 

 

Т а б л и ц а

1

 

 

 

 

п

 

 

 

 

1

0

1

2

3

4

 

 

 

 

 

р\а)

0,2

0,34

0,41

0,4356

0,4391

 

 

 

0,3

0,37

0,32

0,3179

0,3170

 

 

 

0,5

0,29

0,27

0,2465

0,2439

 

Р„ = (0,1 0,8

0,1)

 

 

 

Т а б л и ц а

2

 

/>(.")

 

 

л

 

 

 

 

 

 

 

 

 

 

 

1

0

1

2

3

4

 

 

 

 

 

 

0,1

0,40

0,41

0,4359

0,4391

 

 

 

0,8

0,24

0,35

0,3192

0,3170

 

 

 

0,1

0,36

0,24

0,2449

0,2439

 

Р 0

= (Ѵз V . Ѵз)

 

 

 

Т а б л и ц а 3

 

if

 

 

п

 

 

 

 

0

I

2

3

4

 

 

 

 

 

р\п)

0,33333

0,39999

0,4267

0,4375

0,4391

 

 

 

0,33333

0,33333

0,3200

0,3175

0,3170

 

 

 

0,33333

0,26666

0,2533

0,2450

0,2439

 

Ро = (0 0 1)

 

 

 

 

Т а б л и ц а 4

 

 

 

 

л

 

 

 

 

/

0

1

2

3

4

 

 

 

 

 

 

0

0,2

0,38

0,4318

0,4391

 

 

 

0

0,5

0,31

0,3179

0,3170

 

 

 

1

0,3

0.31

0,2503

0,2439

 

28

Р0 = (0,4391 0,3170 0,2439)

Т а б л и ц а 5

 

 

 

п

 

 

 

0

1

2

3

4

р\п)

0,4391

0,4391

0,4391

0,4391

0,4391

 

0,3170

0,3170

0,3170

0,3170

0,3170

 

0,2439

0,2439

0,2439

0,2439

0,2439

Решение этой системы уравнений приводит к следующе­ му естественному результату

РІ=0,4391, /?2=0,3170, р 3 = 0,2439.

Если положить для определенности х± = 0, х%=\, х3—2, то стационарный режим можно характеризовать корре­ ляционной функцией Kx(kA) с дискретными значениями аргумента M (à=Q, 1, 2, ... )

(1.36)

где t/j — состояние системы в момент времени, отстоя­ щий от выбранного фиксированного момента на вели­

чину kA; p(Xi, t)j, kA) —совместная

вероятность

состоя­

ний xi, yj, разделенных 'интервалом kA..

 

 

Очевидно,

р{Хі,

УІ,

kA)=piPij(kA).

 

(1 . 37)

 

 

 

Результаты расчетов

по формулам

( 1 . 3 6 ) ,

(1 . 37)

сведе­

ны в табл. 6.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 6

 

0

+ 1

 

+ 2

± 3

+4

± 5

Kx(kà)

0,64

0,208

0,057

0,012

0,00

0,00

Помимо финальных вероятностей для эргодических цепей можно определить еще ряд интересных характери­ стик. Если, например, необходимо вычислить среднее время, за которое процесс из состояния ХІ впервые по-

29

Соседние файлы в папке книги из ГПНТБ