книги из ГПНТБ / Казаков В.А. Введение в теорию марковских процессов и некоторые радиотехнические задачи
.pdfкоторая с весом pik является слагаемым искомой вели чины <tij>i. Суммируя по всем k, получаем
Щі |
= Ьц+ |
2 РІИ{ПІ)Ь. |
(1-22) |
Учитывая правила сложения и перемножения ма триц, на основе (1.22) получаем матричное соотноше ние
откуда |
{<**>*} = |
i + Q {<**>*}. |
|
|
|||
{ № } = |
( I - Q ) - l = |
N. |
(1.23) |
||||
|
|||||||
Таким |
образом, |
каждый |
элемент |
фундаментальной |
|||
матрицы |
означает |
среднее |
число попаданий |
процесса |
в данное невозвратное состояние в зависимости от на чального состояния. Из (1.22) следует, что в матрице N элементы главной диагонали (i = j) должны быть боль ше единицы.
Вычислим фундаментальную матрицу для поглощаю щей цепи Маркова, рассмотренной в примере 2 § 1.2. Из соотношений (1.18), (1.19) имеем:
тогда
I - Q = -g |
1 _ р . |
(1.24) |
Как известно {5, 6], любая невырожденная квадрат ная матрица А порядка k имеет единственную обратную матрицу, записываемую в виде
( |
Аи |
Ац |
. . . |
Ahl |
\ |
|
Л1 2 |
А22 |
. . . |
Л й 2 |
, |
(1.25) |
|
•^т |
-А2ь . . . |
-^hh ' |
|
где \А\—определитель матрицы А; Ац — алгебраиче
ское дополнение элемента |
ац, связанное с минором Мц |
соотношением Ац = (— 1 ) |
i+JMij. |
20
Используя определение (1.25), для матрицы (1.24) легко получаем обратную
(1.26)
где последнее равенство записано на основе (1.23) в со ответствии с новой нумерацией состояний.
Конкретизируем пример, задав р= 1/4- Тогда из (1.26) получим
(1.27)
Рассмотрим, например, вторую строку матрицы (1.27). Элементы этой строки показывают, что если про цесс начинается из состояния х ^ то с учетом единичного вклада начального состояния процесс проводит в этом
состоянии в среднем 8 Д .единиц времени. С |
начального |
|||
момента |
процесс |
проведет в состоянии Хз в |
среднем |
% |
единиц |
времени, |
а в состоянии хь — только |
2/э- Анало |
|
гично можно пояснить значения элементов |
первой |
и |
||
третьей |
строк. Подчеркнем, что в силу однородности |
|||
марковской цепи |
в качестве начального состояния мож |
но выбрать любое состояние, в котором оказывается процесс в данный момент времени. Следовательно, фун даментальная матрица дает одинаковый прогноз на бу дущее независимо от абсолютного значения времени, прошедшего от начального момента. Это обстоятельство, в частности, иллюстрирует марковское свойство процес са, характеризуя его как процесс без последействия: при известном настоящем будущее не зависит от прошлого. При этом следует иметь в виду, что указанное свойство фундаментальной матрицы не противоречит характеру изменений безусловных вероятностей и вероятностей пе рехода с течением времени: у поглощающих цепей без
условная вероятность при большом |
п попасть |
в невоз |
вратное состояние мала, но если |
система |
оказалась |
в этом состоянии, то средние времена, которые |
проведет |
|
процесс в невозвратных состояниях, |
определяются с по |
|
мощью матрицы N. |
|
|
21
Фундаментальная матрица позволяет вычислить еще целый ряд важных характеристик марковской цепи.
Обозначим через U время, которое |
проводит процесс |
||||
в невозвратных состояниях, |
включая |
время пребывания |
|||
в начальном состоянии ХІ. С учетом |
масштабного |
коэф |
|||
фициента величина |
ti представляет |
собой число |
шагов, |
||
которое совершает |
процесс |
при переходе из начального |
|||
состояния в поглощающее, т. е. |
|
|
|
||
|
ti= |
S rij. |
|
|
|
Тогда среднее время до поглощения при начальном со стоянии ХІ равно:
''fop = <**) = ( 2 і Д = Е {п3)і. |
(1.28) |
Соотношение (1.28) указывает путь для определения важнейшей характеристики цепи tiCp. Именно: сумми руя построчно элементы фундаментальной матрицы, по лучаем вектор-столбец величины ticp:
{&ер>} = Ш |
= |
{ 2 |
(1.29) |
|
Применительно |
к числовому |
примеру имеем |
|
|
|
А о р \ |
Л . 8 \ |
|
|
|
{ticP{ = \ tict |
1 = 1 3,2 I . |
|
|
|
|
'sep |
3,4 |
|
Полученный |
результат |
свидетельствует о том, что |
||
быстрее всего |
поглощающее |
состояние можно |
достичь |
из состояния Хз. Естественно было бы ожидать, что ве личина ticp будет меньше rfscp, так как попасть в погло щающее состояние из среднего труднее, чем из близле-
жащих |
состояний. Однако в рассматриваемом |
примере |
|
в трех |
случаях из четырех |
(q=3'U) движение |
частицы |
происходит по направлению |
к состоянию х \ , |
поэтому |
^5ср>^4срРазберем теперь вопрос о том, в к а к о е из погло
щающих состояний попадет блуждающая частица. Для этого необходимо вычислить все возможные вероятности bij того, что процесс, выходящий из невозвратного со стояния ХІ, попадает в поглощающее состояние Xj. При
22 •
подсчете вероятностей Ьц придется оперировать |
с эле |
|
ментами подматрицы R .матрицы |
перехода Р |
(1.19), |
так как именно вероятности, образующие подматрицу R, |
||
характеризуют переходы процесса |
из невозвратных со |
стояний в поглощающие.
Если процесс выходит из невозвратного состояния хь то, во-первых, он может с вероятностью р ц оказаться в интересующем нас поглощающем состоянии Xj (веро ятности Pij образуют подматрицу R), во-вторых, процесс может попасть с вероятностью р ш в любое другое не возвратное состояние Xh (вероятности pik образуют под
матрицу Q) и уже оттуда |
с |
вероятностью Ьщ |
перейти |
||
в поглощающее |
состояние |
хг |
Таким образом, |
|
|
|
btj = Pij-\r |
|
^ Pikbkj, |
|
|
или в матричной |
форме |
|
|
|
|
Отсюда |
B = R+QB. |
|
|||
В = ( І — Q ) - i R = N R . |
(1.30) |
||||
|
Применение (1.30) к рассматриваемому числовому при меру приводит к следующему результату:
ІЧ |
0\ |
Пи |
0 \ |
|
/ » / „ |
V* Ѵю |
|
R = о о 1 = 1 о о ; N = |
ѵв |
|
7s V. |
||||
Ѵо |
pi |
\ о |
ѵ / |
|
Ч . . |
ju |
"Л» |
|
|
|
/&зі |
ь3л |
89/40 |
'Ло |
|
B = |
N R = k , |
\ : \ |
/10 |
V.o |
|||
|
|
|
|
|
27/ |
13/ |
|
|
|
|
|
|
/40 |
/40 |
|
|
|
|
|
|
|
||
Из-за существенной разницы |
между |
вероятностями |
|||||
р и q вероятность Ьц |
попасть из |
любого |
невозвратного |
состояния ХІ в поглощающее состояние Хі больше, чем вероятность попадания в состояние xz. Полная вероят ность поглощения процесса, выходящего из любого на чального состояния, равна единице. Этот факт легко подтверждается построчным суммированием элементов последней матрицы.
С помощью фундаментальной матрицы N можно вы числить и другие характеристики'поглощающих цепей Маркова. В частности, помимо средних значений вычи слены, например, дисперсии величин tij и ti [3].
23
1.5. Эргодические цепи Маркова
Напомним, что эргодическая марковская цепь не со держит поглощающих состояний и состоит из одного класса сообщающихся состояний. Если время существо вания процесса в поглощающей системе конечно, то при отсутствии 'поглощающих состояний процесс может раз виваться сколь угодно долго. В связи с этим основной интерес представляет вопрос о том, как изменяются с течением времени безусловные вероятности состояний эргодической цепи. Для эргодических цепей справедли
ва следующая |
важная |
т е о р е м а М а р к о в а о предель |
|||||||||
ных |
вероятностях. |
|
|
|
шагов п вероятность |
|
|||||
При увеличении числа |
перехода |
||||||||||
pij(n) |
из состояния |
ХІ |
в состояние |
Xj |
стремится |
к опре |
|||||
деленному пределу |
pj, |
называемому |
ф и н а л ь н о й ве |
||||||||
роятностью, т. е. |
fij |
(п) = |
pj |
|
|
|
i, j |
|
|||
|
|
Ііш |
для всех |
(1.31) |
|||||||
|
|
л-юо |
|
|
|
|
|
|
|
|
|
или в матричной |
форме |
|
|
|
|
|
|
||||
|
|
|
|
Pu |
(л) |
Pu |
(л) |
• • |
• |
PIN (Л) |
|
|
|
|
|
А. (л) |
А . СО |
• • • |
РмО) |
|
|||
|
|
|
(Ал H |
Рт (л) |
• • • |
% ( « ) |
|
||||
|
/ |
А |
|
|
А |
• • • |
P N |
|
|
|
|
|
— [ |
А |
|
|
А |
• • • |
PN |
|
|
(1.32) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
\ |
А |
|
А |
• • • |
PN |
|
|
|
Доказательство этой теоремы можно найти, например,
в[1].
Соотношения (1.31), (1.32) означают, что предел ве роятности перехода между любыми состояниями эрго дической цепи существует и не зависит от состояния х*. Иными словами, по истечении достаточно большого вре
мени вероятность |
того, что |
процесс |
будет |
находиться |
|||
в состоянии Xj не зависит от того, из |
какого состояния |
||||||
этот процесс начал |
развиваться. |
Поэтому |
говорят, что |
||||
марковские цепи (равно, как и марковские |
процессы, |
||||||
рассматриваемые в дальнейшем) |
«забывают» свое прош |
||||||
лое. |
|
|
|
|
|
|
|
Для эргодических |
цепей |
безусловные |
|
вероятности |
|||
p(")j при увеличении |
п также |
стремятся |
к |
финальным |
24
вероятностям |
р,. |
Действительно, |
|
найдя предел |
(1.16), |
||
с учетом |
(1.31), |
получаем |
|
|
|
|
|
lim |
/ > ; л |
, = 1 і т £ p[0)Pn('l) |
= |
l , |
p{t0)ïmPij(n) |
= |
|
|
|
|
І=І |
( = 1 |
|
|
|
|
|
|
• = І 1 ^ 0 ) Л |
= |
Л . |
(1.33) |
|
|
|
|
1=1 |
|
|
|
|
Соотношение |
(1.33) указывает |
на то, что при |
доста |
точно большом п безусловные вероятности состояний, составляющие в совокупности одномерное распределе ние, не зависят от времени. Поскольку у рассматривае мых однородных цепей Маркова вероятности перехода также не зависят от времени, то при достаточно боль шом п можно считать, что двумерное распределение безусловных состояний зависит лишь от разности мо ментов времени.
Из корреляционной теории случайных процессов из вестно, что если двумерная плотность вероятности зави сит от разности времени между сечениями процесса, то такой процесс является стационарным (в широком смысле). Это обстоятельство позволяет воспользоваться аналогией и назвать режим работы эргодической систе мы при достаточно большом п с т а ц и о н а р н ы м . Оче видно, стационарный режим возможен лишь у однород ных цепей. До наступления стационарного режима си
стема находится |
в п е р е х о д н о м режиме, длительность |
|
которого можно |
определить, |
выбрав некоторый крите |
рий, зависящий |
от разности |
р^—pWj. |
Вычисление финальных вероятностей при известном начальном распределении и заданной матрице перехода представляет собой наиболее важную задачу при изуче нии эргодических цепей. Первый путь определения веро ятностей pj дает теорема Маркова (1.32), согласно ко торой возведение матрицы перехода в достаточно боль шую степень п должно дать матрицу-строку искомых вероятностей. Ясно, однако, что определять финальные вероятности подобным. образом весьма трудоемко. Го раздо проще они находятся из решения системы алге браических уравнений, которая составляется исходя из следующих 'соображений. В соответствии с формулой полной вероятности запишем соотношение, которое опра-
ведл'иво при произвольном п
^ + , ) = 2 / > : e w
1=1
Но ів стационарном режиме (.при -большом п) 'безуслов ные вероятности равны финальным
поэтому
ft=S» |
(1.34) |
|
І=І |
Система (1.34) из N алгебраических уравнений является однородной и, следовательно, имеет лишь ну левое решение. Если же из (1.34) взять /V—I уравнение и дополнить их условием нормировки
|
ІРІРЦ-РІ^О; |
|
|
|
(1.35) |
|
|
І=І |
|
|
i=i |
|
|
то такая |
система дает уже ненулевое |
решение. |
||||
Рассмотрим на |
числовом |
примере, как изменяются |
||||
матрицы |
перехода и безусловные |
вероятности состояний |
||||
с ростом числа п. Пусть матрица |
перехода имеет вид |
|||||
|
(Pu |
Pu |
Ргг\ |
/0,6 |
0,3 |
0,1\ |
|
Р = І Л і |
A i |
Р23 H |
0 - 4 |
0.2 |
0,4 I . |
|
Ѵ З І |
Pit |
Ргг ' |
0,2 |
0,5 |
0,3' |
Возводя эту матрицу во вторую, третью и четвертую сте пени, получаем
|
|
|
/0,5 |
|
0.29 |
|
Р(2) = |
Р * = ( о , 4 |
|
0,36 |
|
||
|
|
|
Ч),38 |
0,31 |
|
|
|
|
/ |
0,4458 |
0,3145 |
|
|
Р(3) = |
Р 5 = |
І |
0,4352 |
0,3200 |
|
|
|
|
\ |
0,4318 |
0,3179 |
|
|
|
|
|
/0,4391 |
|
0,3170 |
0,24394 |
Р(4) = |
Р'1 |
= |
І 0,4390 |
0,3171 |
0,2439 . |
|
|
|
|
Ч),4390 |
|
0,3171 |
0,2439' |
Как видно, матрица перехода уже за четыре шага вырождается в матрицу, полностью определяемую ма-
26
трицей-строкой. Небольшие различия в четвертом знаке после запятой исчезают полностью в матрице
Согласно теореме Маркова финальные вероятности для этого примера равны
рі=0,4391, /72 =О,3170; р 3 =0,2439 . Вычислим теперь безусловные вероятности состояний
для нескольких |
величин п |
при различных начальных |
|||
распределениях: |
|
|
|
||
1) |
Р 0 = |
(0,2 |
0,3 |
0,5), |
|
2) |
Ро = |
(0,1 |
0,8 |
0,1), |
3) |
Р о = ( Ѵ 3 |
V3 |
V 3 ), |
|
|
4) |
Ро = (0 |
0 |
1), |
|
|
5) |
Р 0 = (0,4391 |
0,3170 |
0,2439). |
Р(2), Р(3) |
|
Используя рассчитанные |
выше матрицы |
||||
и Р(4), для пяти начальных |
распределений |
по формуле |
(1.15) можно получить следующие результаты, для удоб ства сведенные в табл. 1—5.
Таблицы показывают изменение безусловных вероят ностей с ростом числа шагов. Хорошо заметен эффект «забывания» начального распределения. Как видно из табл. 1—4, независимо от вида начального распределе ния уже через четыре шага наступает стационарный режим. Табл. 5 указывает на то, что при начальном рас пределении, равном распределению финальных вероят ностей, во все моменты времени имеет место стационар ный режим.
Вычислим теперь финальные вероятности состояний путем решения системы уравнений. Согласно (1.35) имеем:
РіРн+р%р%\.+РзРзі—Рі=0 ;
Pipi2+Р2Р22+РзРзг—Рг=0 ;
Рі + Р2+Рз=Л,
или
—0,4р1 +0,4/?2 +0,2рз=0; 0,3/?!—0,8/72+0,5р3=0;
Р і + / ? 2 + Р з = 1 .
27
Р 0 |
= (0,2 0,3 |
0,5) |
|
|
|
Т а б л и ц а |
1 |
|
|
|
|
п |
|
|
|
|
1 |
0 |
1 |
2 |
3 |
4 |
|
|
|
|
|||||
|
р\а) |
0,2 |
0,34 |
0,41 |
0,4356 |
0,4391 |
|
|
|
0,3 |
0,37 |
0,32 |
0,3179 |
0,3170 |
|
|
|
0,5 |
0,29 |
0,27 |
0,2465 |
0,2439 |
|
Р„ = (0,1 0,8 |
0,1) |
|
|
|
Т а б л и ц а |
2 |
|
|
/>(.") |
|
|
л |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
0 |
1 |
2 |
3 |
4 |
|
|
|
|
|||||
|
|
0,1 |
0,40 |
0,41 |
0,4359 |
0,4391 |
|
|
|
0,8 |
0,24 |
0,35 |
0,3192 |
0,3170 |
|
|
|
0,1 |
0,36 |
0,24 |
0,2449 |
0,2439 |
|
Р 0 |
= (Ѵз V . Ѵз) |
|
|
|
Т а б л и ц а 3 |
||
|
if |
|
|
п |
|
|
|
|
0 |
I |
2 |
3 |
4 |
|
|
|
|
|
|||||
|
р\п) |
0,33333 |
0,39999 |
0,4267 |
0,4375 |
0,4391 |
|
|
|
0,33333 |
0,33333 |
0,3200 |
0,3175 |
0,3170 |
|
|
|
0,33333 |
0,26666 |
0,2533 |
0,2450 |
0,2439 |
|
Ро = (0 0 1) |
|
|
|
|
Т а б л и ц а 4 |
||
|
|
|
|
л |
|
|
|
|
/ |
0 |
1 |
2 |
3 |
4 |
|
|
|
|
|||||
|
|
0 |
0,2 |
0,38 |
0,4318 |
0,4391 |
|
|
|
0 |
0,5 |
0,31 |
0,3179 |
0,3170 |
|
|
|
1 |
0,3 |
0.31 |
0,2503 |
0,2439 |
|
28
Р0 = (0,4391 0,3170 0,2439) |
Т а б л и ц а 5 |
|
|
|
п |
|
|
|
0 |
1 |
2 |
3 |
4 |
р\п) |
0,4391 |
0,4391 |
0,4391 |
0,4391 |
0,4391 |
|
0,3170 |
0,3170 |
0,3170 |
0,3170 |
0,3170 |
|
0,2439 |
0,2439 |
0,2439 |
0,2439 |
0,2439 |
Решение этой системы уравнений приводит к следующе му естественному результату
РІ=0,4391, /?2=0,3170, р 3 = 0,2439.
Если положить для определенности х± = 0, х%=\, х3—2, то стационарный режим можно характеризовать корре ляционной функцией Kx(kA) с дискретными значениями аргумента M (à=Q, 1, 2, ... )
(1.36)
где t/j — состояние системы в момент времени, отстоя щий от выбранного фиксированного момента на вели
чину kA; p(Xi, t)j, kA) —совместная |
вероятность |
состоя |
||||||
ний xi, yj, разделенных 'интервалом kA.. |
|
|
||||||
Очевидно, |
р{Хі, |
УІ, |
kA)=piPij(kA). |
|
(1 . 37) |
|||
|
|
|
||||||
Результаты расчетов |
по формулам |
( 1 . 3 6 ) , |
(1 . 37) |
сведе |
||||
ны в табл. 6. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 6 |
|
|
0 |
+ 1 |
|
+ 2 |
± 3 |
+4 |
± 5 |
|
Kx(kà) |
0,64 |
0,208 |
0,057 |
0,012 |
0,00 |
0,00 |
Помимо финальных вероятностей для эргодических цепей можно определить еще ряд интересных характери стик. Если, например, необходимо вычислить среднее время, за которое процесс из состояния ХІ впервые по-
29