книги / Модели непрерывных каналов связи на основе стохастических дифференциальных уравнений
..pdfнейных СДУ, порождающих, как известно, гауссовские процессы и поля. Для нелинейных СДУ определение многомерной условной по 0 плотности вероятности их решения ад(хь ..., х^|0) и соответст вующего ОП даже при идентификации процессов требуют доволь но сложных процедур решения УФПК в нестационарном режиме (см. § 2.1). Что же касается моделей случайных полей, то для них, как отмечено в гл. 4, аналог УФПК вообще существует не всегда.
Поэтому при практическом осуществлении идентификации обычно идут по пути получения субоптимальных оценок, основан ных на тех или иных приближенных допущениях. Например, мож но использовать так называемый псевдобайесовский подход, при котором функция правдоподобия разлагается в произведение ус ловных плотностей, приближенно считающихся гауссовскими [121, 122]. Используя затем ряд допущений, удается свести задачу иден тификации к задаче нелинейной фильтрации калмановского типа.
Другой путь связан с представлением искомых параметров 0 как дополнительных переменных состояния. Поскольку эти пара метры предполагаются не меняющимися во времени, для них спра ведливо очевидное тождество d§/d t= 0, которое добавляется к исходным СДУ. К полученной системе уравнений относительно рас ширенного вектора состояний Х (/)= [х (£ ), 0] применяется проце дура оптимальной фильтрации [34, 45, 121, 161]. Такой путь,
в принципе, позволяет получать оценки параметров 0, оптималь
ные по среднеквадратическому |
критерию (см. разд. 5.1.1), но связан |
с увеличением размерности |
вектора состояний и других век |
торных и матричных величин, входящих в СДУ. К тому же рас ширенные СДУ, как правило, оказываются нелинейными относи тельно вектора Х(£). даже если исходные СДУ были линейны от носительно х (/). Поэтому необходимо прибегать к нелинейной фильтрации, практическая реализация которой почти неизбежно связана с теми или иными приближениями.
Применительно к случайным полям оба последних подхода на талкиваются на отмечавшиеся в разд. 1.3.2, 1.4.3 трудности, свя занные с обобщением понятия состояния, а следовательно, и алго ритмов фильтрации калмановского типа, на случайные функции многих переменных. По существу, для каждого типа СДУ в част ных производных, описывающего случайное поле, алгоритм оцени вания параметров должен быть разработан и обоснован отдельно.
Ниже рассматриваются некоторые, представляющие наиболь ший интерес для моделирования каналов связи алгоритмы иден тификации марковских моделей случайных процессов и полей в форме СДУ.
5.1.4. Дискретизация непрерывных СДУ в задачах идентификации
Практическая реализация непрерывных по пространству изме рений и обработки случайных полей при идентификации их моде лей, как правило, затруднительна. В большинстве случаев нзме-
141
рения осуществляются с помощью группы первичных преобразо вателей (датчиков), размещенных в определенных точках наблю даемой области пространства.
При условии линейности измерений (которое обычно соблюда ется) на выходах преобразователей формируются векторные сиг налы
|
т |
|
z,(<) = j |
$ H,(f. т, г)у (х, r)d*dt, |
(5.1.10) |
8 |
о |
|
где й —наблюдаемая область пространства; [0, Т] — интервал из мерения во времени; {t, х, р) — матричная импульсная характе ристика /-го преобразователя (см. разд. 1.2.1).
Если эта характеристика имеет вид
Н,(/, т, г)==1,6(/ т) б (г Г/), |
(5.1.11) |
где I— единичная матрица, то преобразователи |
формируют обыч |
ные отсчеты поля в виде функций времени, наблюдаемых в дис кретных точках пространства:
* i(0 = y (* . г*)- |
(5.1.12) |
Конечно, ни один реальный преобразователь не |
может в точно |
сти иметь характеристику вида (5.1.11) (хотя бы |
потому, что он |
занимает определенную, не сводящуюся к точке область простран ства и имеет инерционность во времени); поэтому точечные измере ния вида (5.1.12) следует рассматривать лишь как некоторое при ближение к реальной ситуации.
Если пренебречь инерционностью процессов в преобразовате
ле, то |
|
Н{(£, т, r )= Q i(r )6 (/—т) |
(5.1.13) |
и |
|
М * ) = J<*/(г )у (/, r)dr, |
(5.1.14) |
й |
|
где Q/ (г)— некоторые матричные функции г.
На практике для измерения во всех точках поля, как правило, используются однотипные преобразователи, обеспечивающие неза висимое измерение скалярных компонент поля. В этом случае диа
гональная матрица |
|
||
|
|
Q i ( r ) = g i ( r ) I |
(5.1.15) |
где <fr(r)— ИПХ |
измерительного преобразователя |
по скалярной |
|
компоненте. |
|
|
|
_ |
. |
т |
|
При </j(r) = |
elv г для всех I, |
|
где v — вектор пространственных частот, преобразователь будет измерять пространственный спектр реализации поля.
При обработке поля на цифровых ЭВМ необходима его дис кретизация не только по пространству, но и по времени. Для фор-
142
мирования отсчетов в дискретные моменты времени
требуется |
|
z i h = y ( t k , |
г*) |
|
(5.1.16) |
||
|
|
|
|
т)б (г г*). |
(5.1.17) |
||
Н*а (/, |
т , |
г) = |
16 ( / а |
||||
При выборе |
|
|
|
|
|
|
|
и |
// |
*. |
ч |
, |
i(wc4-vrr) |
(5.1.18) |
|
|
|
r) = |
I e v |
^ |
|||
измеряется пространственно-временной |
спектр комплексных ампли |
||||||
туд реализации поля. |
|
и общий |
случай-'-выбор в |
качестве |
|||
Наконец, возможен |
|||||||
Н (t, т, г) какой-либо иной |
(отличной и от дельта-функций и экспо |
||||||
нент) системы линейно-независимых матричных функций. |
|
||||||
Обычно при этом вводят отдельно скалярные функции времен |
|||||||
ных координат fh(t) и пространственных координат qi(r), |
полагая |
||||||
НАг(*, т, |
г)=Ы0<7*(г)1. |
(5.1.19) |
Таким образом, дискретизацию поля следует понимать доста точно широко. В общем случае это некоторое усеченное представ ление (проекция) непрерывного поля в счетном базисе.
При условии (5.1.15) непрерывное поле может быть прибли женно восстановлено по своим дискретным компонентам с помо щью ряда
м |
|
y(t, г )= 2 2 /№ 9 / (г)» |
(5.1.20) |
t=i |
|
где {ф*(г)}—функции, биортогональные {<7*(г)}, в |
общем случае |
с некоторым весом до(г): |
|
J?/ (г) <7/ (г) до (г)dr = |
|
2 |
|
При дискретизации по пространству и времени используется представление
|
М N |
|
У (t. |
Z )= 2 2 z*/9 /(r) ^ W - |
(5.1.21) |
|
/=1 А=1 |
|
где {Ч М О }— система |
функций, биортогональных |
{М О }- |
Если при первоначальном разложении поля использован орто гональный базис, то можно положить Ф *(г)=#(г) и Ч М 0 —Ы 0 - Располагая непрерывной моделью исходного поля y(t, г), мож но построить соответствующую дискретную модель для его конеч номерного представления (вектора функций [z*(/)] или матрицы
М ) .
Если, например, задано СДУ вида
f t , г у (* . г) = № Г),
143
то с учетом (5.1.21) можно записать систему уравнений:
NМ
Иг * , , { 2 2**« * »«* * (< ) ■qi(r)ta(t)dtdT
&о \k=i /=1
т
= |
f J&(t, r)qj(T)tm(t)dtdr, |
|
|||
|
8 0 |
|
|
|
|
/ = 1 , |
2,..., |
M, |
= 1 ,2 ,..., N, |
|
|
которая после выполнения |
интегрирования |
переходит в |
систему |
||
алгебраических уравнений относительно гц. |
Такой подход |
(вклю |
чая разные его модификации) известен под названием метода мо ментов или метода Галеркина [107]. Хотя выбор базиса при дис кретизации, в принципе, произволен, простой переход от непрерыв ной модели к дискретной получается только при определенных условиях. Для приведенного выше СДУ таким условием является
наличие простой связи |
между разложениями |
исходного поля |
|
у(/, г) и его отображения f t >ry (^ г). В этом |
смысле |
наиболее |
|
благоприятным является |
выбор в качестве 4 ^ (0 |
и <pz (г) |
собствен |
ных функций указанного оператора по скалярным компонентам
поля (см. разд. |
1.2.2) Ч Тогда |
при |
условии линейности оператора |
N |
М |
N |
М |
f |
t. г 2 2 |
z« 4r‘ W ‘i’< w = 2 2 |
L« z« ’r' |
* |
<5Л-22') |
|
|
k=\ i=i |
|
ft=i /= i |
|
|
|
где Ц*— матрица |
собственных |
чисел, |
аналогичная |
введенной |
||
в (1.2.14), |
вследствие чего для |
каждого |
гщ получается система |
линейных алгебраических уравнений, в матричной записи имеющая вид
Здесь |
(5.1.23) |
|
|
= 1 f s (f. г) **(<)¥/(г) (Шг. |
(5.1.24) |
8 0 |
|
Аналогично при разложении по собственным функциям только |
|
для пространственных координат |
|
м |
|
f t , Г S z /W ? /(r ) = L , ^ z / (/)(pl (r). |
(5.1.25) |
/=1 |
|
где t—оператор по временным координатам, и в итоге получает ся система обыкновенных дифференциальных уравнений
W 0 ^ * i ( 0 = f c ( 0 . |
(5.1.26) |
где |
|
r)f,(r)dr. |
(5.1.27) |
1 Здесь они выбраны одинаковыми по всем компонентам.
144
Для оператора дифференцирования собственными являются комплексные экспоненциальные функции
/ \ |
IV/ Г |
?i (г) — е |
1 |
Действительно,
1VJ г
d г
Использование экспоненциальных функций приводит к извест ному спектральному представлению поля в конечной области, при котором СДУ заменяется моделью, основанной на введении пере
даточных функций в приближенной дискретной форме (см. разд,
1.2.2).
Другой способ простого дискретного представления производ ных связан с использованием обычного представления поля его от счетами в дискретных точках пространства. При этом
|
|
zi(0= y(*» |
г')> |
|
(5.1.28). |
|
ду(<» |
г) |
Лг [у(*. |
г/+1) — у(Л |
г,)]. |
(5.1.28) |
|
дг |
r= r i |
|||||
|
Заметим, что дискретное спектральное представление может быть получено на основе применения к уравнению поля много мерного преобразования Фурье, как это подробно описано в гл. 4, и последующего взятия дискретных отсчетов по временной и про странственным частотам. Однако для нелинейных СДУ спектраль ное представление затруднительно.
На практике в основном распространена дискретизация полей путем представления их отсчетами по пространству и времени— она наиболее проста в реализации, дает удовлетворительную точ ность (реальные измерения обычно можно считать близкими к то чечным), удобна для аппроксимации производных.
Конечно, к представлению случайных процессов и полей типа белого шума своими отсчетами необходимо подходить с известной осторожностью. Не следует забывать, что спектр таких процессов даже приближенно нельзя считать финитным; поэтому восстанов ление их возможно только по отсчетам, взятым с интервалом Аг-> —>-0. Поэтому говоря о дискретной модели белого поля, обычно подразумевают поле с полосой пространственных частот A F=V 2Ar, а при предельном переходе к непрерывной модели вместе с Дг-*-0 полагают AF->-oo.
При дискретизации поля по пространству частные производные по координатам г заменяются соответствующими конечными раз ностями, в результате чего СДУ с частными производными заме
няется системой обыкновенных СДУ вида |
|
|
= |
0 + G (X . t)S (t), |
(5.1.29). |
dt |
|
|
0 -3490 |
145 |
где. |
x(t, гм ) ] г |
(5.1.30) |
X (0 = [* (* , ri), |
— блочный вектор состояния, составленный из векторов состояния
лоля в разных точках |
пространства; B ( f ) = [ l ( f , |
ri)» •••> К?» |
|
хм) ] т—вектор отсчетов |
случайного |
возбуждающего |
воздействия |
(с учетом сказанного выше); |
|
|
|
G(X, 0 = [G (X , /. г,), |
.... G(X, t, rM)] . |
|
Функции /(X , t) и G(X, t) определяются коэффициентами ис ходного СДУ в частных производных [для СДУ вида (1.4.34) — -оператором f T и матрицей G(x, t, г )]. Формулы для их расчета
могут быть получены для каждого конкретного вида СДУ и в слу чае нелинейных СДУ оказываются довольно сложными. Подроб ный пример такого расчета приведен в разд. 6.6.3.
Несмотря на сделанные выше оговорки, переход от непрерыв ных СДУ к дискретной модели типа (5.1.29) имеет вполне строгое математическое обоснование [165]. Показано, в частности, что если формирующий фильтр исходного поля удовлетворяет требо ванию физической осуществимости, то и формирующий фильтр многомерного случайного процесса, образованного отсчетами поля [т. е. фильтр, описываемый (5.1.29) ], также удовлетворяет этому требованию.
Рассмотрим теперь случай, когда производится дискретизация не только по пространству, но и по времени.
Обозначив X (th )= X (k ) и полагая
[ ■ T U ~ lX(* + 1 ) - X(*)1i - t
получаем вместо (5.1.29) разностное уравнение |
|
X (ft-f-1) — X (k) = f (X, th)A t+ G {X , th)S (th)At, |
(5.1.31) |
которое обычно записывается в виде |
|
Х (* + 1 )= ф (Х , *)Н-Г(Х, k)w (k), |
(5.1.32) |
где ф(Х, ft)= X (fe )+ f [Х(1л). h]M; Г(Х, k)=G [Х (4 ), |
4]Д<; |
Mw (ft) wT (/) = V W (ft)6w, |
(5.1.33) |
Здесь, как и прежде, предполагается, что |
|
M 3 (t)S T(z) = '¥s b ( t - * ) . |
(5.1.34) |
Заметим, что обратный переход от дискретной модели к не прерывной при Д/-й), N-+oo менее тривиален и для строгого обос нования требует привлечения понятия стохастического интеграла
[28, |
66, |
86, |
122, |
126, |
132]. |
с учетом |
|
Обозначив |
x(U, |
|
гь)=х(£, k), уравнение (5.1.32) |
||||
(5.1.30) |
можно записать также в виде |
|
|||||
|
|
|
х(Н -1, |
£)=Фа{х(/, £)}+Г(х, i, k)v/(i), |
(5.1.35) |
446
где $ г — некоторые пространственный (дифференциальный или ин-
тегродифференциальный) оператор; Г— граница области наблюде ния в пространстве.
Граничные и начальные условия могут быть как детерминиро ванными, так и стохастическими, т. е. включать в себя некоторые случайные воздействия, а также детерминированными, но не изве стными (или содержащими неизвестные параметры). В последнем случае наряду с идентификацией самих СДУ возникает задача идентификации их начальных или граничных условий [112].
Однако перечисленные ситуации в основном характерны для физических, а не феноменологических моделей. В последних, как упоминалось, обычно целесообразно считать заданными какие-ли бо простые начальные и граничные условия, что и будет предпо лагаться в дальнейшем.
В частном случае, когда в (5.2.1) отсутствуют пространствен ные координаты, т. е. задан случайный процесс, параметры а и р в силу (1.4.16) определяют соответственно коэффициенты сноса и диффузии марковского процесса, порождаемого СДУ (5.2.1) [131, 142]. Иногда такая терминология по аналогии применяется и к мо делям полей, хотя в этом случае УФПК удается записать не всегда.
Рассмотрим вначале методы идентификации вектора неизвестлых параметров 0 = (а , р) модели (5.2.1) в условиях, когда шумом наблюдений можно пренебречь и уравнение наблюдений имеет вид
z (t, г)=Ув(*, r)= C x 0(f, г), |
(5.2.2) |
где С — некоторая известная постоянная матрица.
Заметим, что это условие не является, как может показаться на первый взгляд, практически нереальным. При моделировании многих случайных процессов, например помех, в каналах связи целесообразно не выделять шум наблюдений в качестве особой компоненты, а следует рассматривать его как часть моделируемого процесса.
При указанном допущении реализации вектора состояния и, следовательно, левой части (5.2.1) во многих случаях удается не сложно выразить через реализацию наблюдаемого поля (резуль таты измерений) z (t, г). Эта задача решается тривиально, когда матрица С в (5.2.2) квадратная и невырожденная, и следователь но, x(t, r ) = C г). Другим примером может служить случай, когда шум 1(/, г) присутствует не во всех скалярных уравнениях системы (5.2.1). Это характерно для СДУ, преобразованных к си стеме уравнений первого порядка (5.2.1) из одного скалярного уравнения высшего порядка, как это описано в разд. 1.3.2. Тогда между переменными состояния и наблюдаемыми переменными су ществует детерминированная связь. В частности, для уравнений вида (1.3.31) в разд. 1.3.2 введен двумерный вектор состояния х (t, r) = [xi(f, г), х2(/, г )]г, причем в обозначениях уравнения
148
(5.2.2)
Z(t, r) — x,(t, r), x j t , Г) = — |
r' |
dz(t, r) |
|
dt |
|||
|
|
Можно привести и другие аналогичные примеры. Один из спо
собов |
|
определения |
вектора |
состояния |
изложен в [15]. Вместе |
с тем |
уравнения (5.2.1), (5.2.2) могут |
иметь и такой вид, при ко |
|||
тором |
компоненты |
вектора |
состояния |
принципиально не поддают |
ся точному определению по измерениям z(t, г) на некотором ин тервале [£о, tfi] даже при отсутствии шума наблюдений, т. е. не обладают свойством наблюдаемости [15, 161]. Это означает, что выбранная модель даже без внешнего воздействия не позволяет по наблюдениям поля z(t, г) на указанном интервале определить его значения при t>t\. Феноменологические модели с таким свой ством в рамках рассматриваемого подхода необходимо исключить.
Рассмотрим вначале задачу оценивания параметров а, считая G(/, г) точно известной (нередко используют, например, модели вида (5.2.1), в которых G(£, г)= 1 ).
Записав уравнение (5.2.1) в форме стохастического дифферен циала
dx{t, г) = f j x ( f , r)dt -j-G (/, r)d\V (t, r),
где W(£, r)— стандартное вииеровское поле, и используя методы [66, 187], получаем для логарифма отношения правдоподобия вы
ражение
т
lnA («) = l n - ^ / ^ - = J J c r«, |
г; a)[rfx(t, г) - S r?x {t . r)dldr]~ |
||||||
|
Q О |
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
— |
г; |
а)0(Л |
r)G r (^, г) с (Л г; a)dtdr, |
(5.2.3) |
|||
а о |
|
|
|
|
|
|
|
где стохастический интеграл понимается в смысле Ито и |
|
||||||
с (t, г; a) = S(f, r ) [ f rx(t,a |
г) - f ? x ( t , |
г)), S(t,r) = [G(t. r)GT(t, г)]-1; |
|||||
ao—вектор некоторых постоянных |
значений параметров К |
|
|||||
Если исходить из «нестрогой» записи СДУ в виде (5.2.1), по |
|||||||
лучим |
|
г |
|
|
|
|
|
|
1_ |
dx(t, |
г) |
|
|
||
In Л (а) = |
Г Г( |
X |
|
||||
2 |
J Л |
|
dt |
|
|
||
|
|
|
|
|
|||
|
|
я о |
|
|
|
|
|
X S(t. |
|
- |
f |
rx(t,’ |
r)JdWr + T(n,). |
(5.2.4) |
где у(сю) —величина, не зависящая от a, x(t, г).
1 При записи ОП для случайного процесса, описываемого обыкновенным СДУ или уравнением Ито, в качестве «нулевой» обычно удобно выбирать гипо тезу, соответствующую dx(t) =dW (/). Однако для некоторых СДУ с частными производными в отличие от обычных меры Z’ (х 10) и Р(х|«0») оказываются сингулярными [68].
149
Искомая оценка |
|
а = argmaxln А (а), |
(5.2.5) |
а |
|
Разумеется, в строгом смысле, когда в правой части |
(5.2.1) |
присутствует идеальный белый шум, производная dx(t, т)]Ы мо жет не существовать. Поскольку, однако, реальные процессы всег да гладкие, на (5.2.4) можно смотреть, как на реализуемое при
ближение точного |
представления (5.2.3). Интеграл при этом пони |
|
мается в обычном |
смысле. |
а сводится |
Как видно из |
(5.2.4), (5.2.5), оценивание вектора |
|
к поиску такого его значения, которое обеспечивает |
наилучшее |
приближение производной вектора состояния в метрике, порождае мой матрицей S(/, г), в связи с чем этот метод идентификации (применительно к процессам рассматривавшийся в [121] и др.) назван методом дифференциальной аппроксимации.
При выполнении соответствующих условий дифференцируемо
сти и выпуклости |
(5.2.4) |
как функции а |
оценка может быть |
най |
дена из уравнения |
|
|
|
|
г |
|
|
|
|
<Э1пЛ(а) |
^ |
— £ гх (*> r)lr S(f, |
r ) ± r r x ( t r)dtdi = |
0. |
\J |
да
ЙО
(5.2.6)
Здесь и далее производные скаляров и векторов по векторам следует понимать соответственно как векторы производных с ком понентами dffdaj или матрицы Якоби с компонентами dfildaj.
Уравнение (5.2.6) позволяет по заданному виду оператора син тезировать конкретный алгоритм оценивания; некоторые примеры такого синтеза приведены в следующих разделах.
Иногда для упрощения алгоритма матрица S(/, г) в (5.2.6) за меняется любой постоянной положительно определенной или даже единичной матрицей, что, конечно, связано с потерей оптимально сти оценки по правилу МП.
Говоря о реализации алгоритмов идентификации, основанных на решении уравнения правдоподобия вида (5.2.6) или ему подоб ных, нельзя не отметить, что они включают в себя непрерывную пространственно-временную обработку наблюдаемого поля, осуще ствлять которую технически крайне затруднительно. На практике чаще всего наблюдаются и обрабатываются отсчеты поля в дискрет ных точках пространства. Использование при обработке цифровых ЭВМ требует и дискретизации по времени. Поэтому во многих слу чаях целесообразно с самого начала рассматривать при идентифи
кации |
не непрерывные СДУ (5.2.1), а соответствующую дискрет |
ную модель, полученную методами, описанными в разд. 5.1.4. |
|
Уравнение правдоподобия для оценки параметров а при этом |
|
приобретает вид |
|
N |
М |
|
J ] Iх ( '+ 1 •* ) - ф г * ( ‘ ’ *)ir s («'. А) - я г ф * х (г- * ) = ° - (5-2-7) |
i = l |
k =1 |
150