Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления

.pdf
Скачиваний:
10
Добавлен:
24.10.2023
Размер:
10.97 Mб
Скачать

70

Глава 3

где предел берется в среднеквадратическом

Е \l-\fAt)dy(l)\-

>0.

(5.8)

Можно также определить интеграл как любую случайную вели­ чину, которая равна / с вероятностью 1. Таким образом, можно распространить определение интеграла на случай, когда суще­ ствуют интегралы lf2dr и \idni. При этом сохранятся свойства (5.4) и (5.6). Следовательно,

E$f[t)dy(t)=

\f(()dm(t),

(5.9)

var ]f{f)dy(t)=

jr-(t)dr(t).

(5.10)

Подробное доказательство приведено в работе [11]

(разд. 11

данной главы).

 

 

Интегралы от стохастических процессов

Для случая, когда f — стохастический процесс, интеграл (5.1) можно определить как предел в среднеквадратическом. Если / не зависит от у, то обобщение очевидно, и в этом случае нельзя получить какие-либо интересные результаты. Если / зависит от у, то интеграл будет обладать необычными свойствами: напри­ мер, он будет зависеть от выбора т*. Покажем это на примере.

Пример 1

Рассмотрим интеграл

 

t

 

 

 

 

 

\w(s)dw(s),

 

 

(5.11)

 

 

о

 

 

 

 

где {w(t),

t еТ}—винеровский

процесс с единичным

парамет­

ром дисперсии. Пусть интервал

(о, t) точками o =

t\,

t2,

tN,

разделен на N подынтервалов. Используя

рассмотрен­

ный выше

метод, интеграл (5.1)

можно, например,

определить

любым из следующих выражений:

 

 

N

 

/ 0

=

l i m £ а» ft) \w(U+i)-w(ti)],

(5.12)

Л

=

l i m i > ( * , + , ) [w(tt+l)-w(tt)h

(5-13)

 

 

i=i

 

где предел берется в среднеквадратическом.

Если бы интегралы можно было определить как обыкновен­ ные интегралы Стильтьеса, то они были бы равны, так как опера-

Стохастические модели "состояния

71

ция интегрирования непрерывна. Однако стохастические интегра­ лы не обладают этим свойством, поскольку

 

N

 

h-Io

= lira £ [w (U+i) - w (/,)] 2 = t.

(5.14)

(Сравните этот результат с упражнением в разд. 4.)

Таким образом, этот пример показывает, что выбор т* В фор­ муле (5.3) существен при определении стохастического интегра­ ла. Учитывая это замечание, можно определить континуум сто­

хастических

интегралов

следующей

формулой:

 

/ , = ( 1 - я ) / 0

+ Ч =

 

 

 

=

lim i [(1 - X)w(tt)

-г te>(t(+l)]

[w (t{+1) - w (tt)]

(5.15)

 

i=i

 

 

 

 

при

0 < ^ < 1 .

 

 

 

 

Некоторые из этих интегралов имеют особые названия, /о назызывается интегралом Ито, a I0t5 называется интегралом Стратоыовпча. Рассмотрим свойства этих интегралов более подробно.

Пусть

{y{t),

teT}—нормальный

процесс

с независимыми

приращениями. Обозначим функцию

среднего

значения

через

m(t), а

ковариационную

функцию

через

r{t).

Интеграл

Ито,

определенный

формулой

 

 

 

 

 

 

 

j f it) dy (0 =

lim £

/ (t.) [у (tl+l

- * ( * , ) ] ,

(5.16)

обладает следующими свойствами:

 

 

 

 

 

 

Е\f{t)dy{i)=

${Ef(l)}dm(t),

 

(5.17)

cov [ j / (0 dy (0, j g (0 dy (0] = J [Ef (0 g (0] dr (0. (5.18)

Строгое доказательство приведено в работе [11]. Уравнения (5.17) и (5.18) показывают, что операции математического ожи­ дания н интегрирования перестановочны.

Из примера 1 следует, что формула (5.17) неверна для инте­ гралов Ik, если ХфО.

Интегрирование по частям

 

 

Для интегрирования

по частям

часто употребляется

фор­

мула

 

 

 

| /(s)dy(s)

= f(s)y(s)

| - [ у ( s ) d f (s),

(5.19)

(I

0

0

72

Глава

3

которую можно записать в следующем виде:

 

t

t

 

f (0 y(Q — f (0) у (0) = j '

/ (s) dy (s) + j у (s) df (s). (5.19a)

 

о

0

Найдем, существует ли соответствующая формула для стохасти­ ческих интегралов.

Пусть 0 = tu t2,

t^+i t — подразбиение

интервала

(0, t).

Рассмотрим равенство

 

 

 

 

 

 

 

 

 

 

=

/ ( ' H - I ) [У(*ш)-У{ь)]

+У(**)

 

[ / ( W - ' C * ) ]

=

=

у ()[f{tn.i)-f\tk)]+f{lk)[y[

 

 

 

 

 

 

* ш

)

- * ( Л ) ] •

Суммируя по k и перейдя к среднеквадратическому

 

пределу при

max

— *i|-»-0, получим

 

 

 

 

 

 

 

 

 

 

 

/ (*) У (0 -

/ (0) У (0) = Л (Л dy) + (У, d/)

=

 

 

где

 

 

= Л (М/ ) + Л>

 

 

 

 

 

(5.20)

 

 

 

 

 

 

 

 

 

 

 

 

 

/ 0 ( f , % )

= l i m £

f (Л) [г/

(

*

,

+

,

)

(

5 -

2 1 )

 

 

Л'

 

 

 

 

 

 

 

 

 

 

 

/ 1 ( / , r f y ) = l i m 2

[

<

/

( *

,

+ ,

(5-22)

Таким образом, аналогия между формулами интегрирования по частям существует. Отметим, однако, что если / — стохастиче­ ский процесс с независимыми приращениями, то для получения искомой формулы требуется два интеграла /о и 1\.

Кроме того, если ввести симметричный интеграл

V s = Y ,

7 ° +

/ ' ) '

( 5 - 2 3 >

то из соотношения (5.20) получим

выражение

 

/ (0 УН)-! (0) У (0) =

/ 0

5

(/, dy) + / 0 j 5 (у, df),

(5.24)

которое представляет собой хорошо известную формулу (5.19) для интегрирования по частям. Симметричный интеграл, опреде­ ленный формулой

N

/o.» = I l m T S [ / K ) + ^ ( W ] И ' ж ) - * ( М ] ' ( 5 -2 5 >

1=1

был назван интегралом Стратоновича. Таким образом, можно

Стохастические модели состояния

73

сделать вывод, что обычная формула интегрирования по частям полезна также и для стохастических интегралов, если их интер­ претировать как интегралы Стратоновича.

Сравнение с формальным интегрированием

Для понимания свойств стохастического интеграла проведем сравнение с формальным интегрированием в случае, когда это возможно. Сначала рассмотрим §wdw. Если w — обычная функ­ ция, то получаем

t

w(s)dw(s)

= —(w2(t)

— w2(0)).

о

2

 

 

 

Если {w(t)}—винеровский

процесс

с единичным параметром

дисперсии, то интеграл можно интерпретировать многими спосо­ бами. Рассмотрим

/,(w, dw) =

lim f

[ha (t.+ l )

+ (1 -

X)w (/.)]

[w

( - w [ t . ) \ .

Выражение под знаком суммы можно

представить следующим

образом:

 

 

 

 

 

 

 

[Xw , tt+l)

+ (1 - X)w{tt)]

[w[tl+l)

-

w{tt)]

 

=

= »(*,)»(

ti+l) - w* (tt) +

Я [w (tc + l )

-

w (

2

г

' (

^ ) - ^ ^ ) } + ^ ~ т ) ^ ( ^ ~

ш

^ У - -

1

 

 

 

 

 

 

Так как сумма

 

 

 

 

 

 

 

 

 

 

2

- » ( M ] S

 

 

 

 

 

 

1=1

 

 

 

 

 

сходится к t с вероятностью 1 при N-+oo,

то

 

 

 

I x

(w, dw) = ±- [и;2 (t) -

ш2 (0)]

+ (X -

±у.

 

 

В данном примере стохастический интеграл совпадает с фор­ мальным интегрированием, если интерпретировать стохастиче­ ский интеграл как интеграл Стратоновича.

Упражнение

1.Рассмотрим интеграл

/= §f(s)dy(s),

и

74

Глава 3

где {y(t), i еТ}—процесс

с независимыми нормальными при­

ращениями со средним значением пг и ковариацией приращений

dr. Допустим, что у(0)=0.

Пусть /, пг и г — непрерывно

диффе­

ренцируемые функции. Обозначим производные через f,

in' и г'.

Определим интеграл / формулой

(5.2)

 

 

I = f{t)y{t)~

\

f'(s)y(s)ds.

 

 

 

6

 

 

Показать, что

 

 

 

 

El

=

^f(s)m'(s)ds,

 

 

о

 

 

 

 

t

 

 

 

var /

= jf-(s)r'(s)ds.

 

 

о

 

 

 

Сравнить этот результат с выражениями (5.9) и (5.10).

6. ЛИНЕЙНЫЕ СТОХАСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

В этом разделе дано точное определение линейного стоха­ стического дифференциального уравнения, введенного в разд. 4. Рассмотрим

dx =

A (I) xdt + do,

 

 

(6.1)

где х—/г-мерный вектор, {v(t),

t еТ}—/г-мерный

винеровский

процесс с ковариацией приращений Ridt, А — квадратная

мат­

рица порядка пУ^п. Элементы матриц А и

Ri—непрерывные

функции времени. Предположим, что начальное значение x(t0)

нормальная случайная величина

со средним

значением

«г0 и

ковариацией Ro.

 

 

 

 

 

 

Сравнив эти условия с эвристическими

рассуждениями

в

разд. 4, получим, что о = 1

не зависит от х.

Если

выражение

(6.1) интерпретировать как

среднеквадратический

предел

раз­

ностного уравнения, то несущественно, используем ли мы пря­ мые или обратные разности. Сравните эти выводы с выражени­ ем (4.15).

Если значение и в уравнении

(6.1)

имело бы ограниченную

вариацию, то решение уравнения

(6.1)

можно было

записать

в виде

 

 

 

 

i

 

 

X (t) = Ф (/; t0) X (t0)

+ J Ф (/; S) dv (s),

(6.2)

Стохастические модели состояния

75

где Ф удовлетворяет дифференциальному

уравнению

dcD(M0 ) = A

[ t ) 0 ( t . t o )

( 6 3 )

dt

 

 

с начальным условием

 

 

O(t0\t0)

= I .

(6.4)

Уравнение (6.1) часто используется для моделирования систе­

мы, входной сигнал которой

представляет собой белый

шум

с ограниченным частотным

диапазоном. Чтобы сохранить

эту

 

По

 

Р и с . 3.1. Блок-схема системы dx/dt=

Р и с .

3.2. Блок-схема стохастиче-

=Ах-\-и.

ского

дифференциальгого

уравне­

 

ния (6.1), при решении которого

 

используется определение

инте­

 

 

грала (5.2).

 

интерпретацию, желательно представить уравнение (6.1) в виде блок-схемы, подобной блок-схеме на рис. 3.1, где входным сиг­ налом является производная от v. Но так как v не имеет про­ изводной, такое представление невозможно. Однако если ин­ теграл (6.2) определяется выражением (5.2), то решение урав­ нения (6.1) можно интерпретировать как интеграл от выбороч­ ных функций и его можно также представить в виде блок-схемы

с входной переменной v (рис. 3.2). Отметим, что, строго

говоря,

такую блок-схему

можно не давать,

если

уравнение

(6.1) ин­

терпретировать

с

использованием

стохастического

интеграла,

так как интегральный блок в блок-схеме

представляет

собой

интегрирование

функции времени.

 

 

 

 

Рассмотрим свойства решения (6.2). Так как переменная х является линейной функцией нормального процесса, то она также нормальна и может быть полностью описана средним значением и ковариационной функцией. Для их вычисления по­ ложим

t

Ex (t) = Ф (/; t0) Ex (/„) + E j ' Ф (t; s) dv (s).

и

Используя свойство (5.9) стохастического интеграла, получим.

76

Глава 3

что второй член в правой части равен нулю. Следовательно,

 

тх

(t) =

Ex(t)

=

Ф

t0)

Ex(t0)

= Ф (t-10) m0.

 

 

(6.5)

Дифференцируя,

получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т

=

7 - ф С ;

* о К = Л (t)Ф(t;

t0)m0=A

(t)mx,

 

 

(6.6)

 

 

at

 

at

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где второе равенство вытекает из условия (6.3).

 

 

 

Решение

(6.2)

можно

 

получить непосредственно переходом

в уравнении

(6.1)

к

математическому

ожиданию с

использова­

нием теоремы 6.2 гл. 2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Начальное значение

для

уравнения

(6.6)

получено

из

выра­

жения (6.5),

т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mx(t0)

=

m0.

 

 

 

 

 

 

(6.7)

Для

вычисления

ковариации

х

предположим, что т 0

= 0 . Это

можно получить, вычитая тх

из

х.

Тогда

Ex(t)=0.

Для

s^t

получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R (s, 0 =

cov

(s), х

(t)]

=

Ex

(s) xT

(t)

=

 

 

 

 

 

 

 

=

E [Ф (S; /J X (t) +

f Ф (S; S')

dv (S')\

XT

(t)

=

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

Ф (s; t) Ex (t) XT

(t)

=

Ф (s; t)

R (/, 0 =

Ф (s; О Я (/).

 

(6.8)

Первое

равенство следует

из

Ex(t)—0,

а

 

третье

вытекает из

того, что v(s)

не зависит

OT.x(t)

при s^t.

Аналогично

получим

 

 

 

R (s, t)

=

R (s, S)

Фт

{t; s) = P (s) Фт

(t; s),

 

 

(6.8a)

где s ^

t.

Для вычисления

ковариации

P(t)

 

=

R(t;

t)

образуем

следующеее

выражение:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cov

[x

((), x (t)]

=

Ex (t) xT

(t)

=

 

 

 

 

 

 

 

 

 

 

=

E j Ф (t;

 

 

 

 

 

t

Ф (/; s) dv

 

 

 

 

 

 

 

 

t0)

X

(/„) - f j

(s) ] X

 

 

 

 

 

 

 

 

 

 

 

 

 

t

o'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X [Ф [t-

in)

x (t0)

+

 

f Ф (t; s) dv

(s)]T

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

=

O(i;t0)Ex(t0)xT(tu)OT(t;t0)

 

 

 

 

+

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

+

E [ J Ф (/; S)

 

(S)] [ j

Ф (/; S) dV (S)

y

=

 

 

 

 

 

 

U

 

 

 

 

 

 

 

t.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

=

Ф (t; tQ) R0

ФТ (/; *0 ) 4-

j ' Ф

 

s) R,

(s) ФТ (t; s) ds.

(6.9)

и

Стохастические модели состояния

77

Третье равенство следует из того, что v(s)

и x(t)

 

независимы

при

s^t,

 

 

а последнее

равенство

вытекает

из

свойства

(5.10)

стохастического

интеграла.

 

 

 

 

 

 

 

 

 

 

 

 

 

Дифференцируя

выражение (6.9),

получим

 

 

 

 

 

 

dP_

 

 

dt

 

 

R0OT

(t;

t„) +

Ф (/;

t0)

R0

4

Ф Г

(t\

to)

+

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

+

 

<b(t;i)R1T{i;t)+

 

f

dt

0(t;s)

R^O7

 

(i-s)ds

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

Or(t;s)

ds.

 

 

 

 

 

 

 

(6.Ю)

 

+

 

 

 

^0(t;s)R1(s) dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из уравнения

(6.3) следует, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-%r<bT{t;t0)

= <I>T(t;to)AT(t).

 

 

 

 

(6.11)

 

 

 

 

 

 

at

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из

уравнений

(6.10)

и (6.11)

получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^

=

A(t)P

+ PAT(i)

 

+

Rl[t),

 

 

 

 

(6.12;

 

 

 

 

 

 

at

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(to)

=

Ro-

 

 

 

 

 

 

 

 

 

 

(6.13)

Дифференциальное

уравнение

(6.12)

можно

также

получить

непосредственно

из

стохастического

дифференциального

урав­

нения.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим

разность

 

 

 

 

 

 

 

 

 

 

 

 

Р (t+ h) — P (t) = Ex(t

+ h) xT

(t +

h)

 

Ex (t) xT

(t)

=

 

 

 

=

E [ [x (t +

h) x (t}] [x(t

+

h) x

(t)]T

+

x(t)

\x

(t + h)—x

(t)} T+

+

[x(t

+

h)-x(t))xT(t))

=

 

 

 

 

 

 

 

 

 

 

 

— E[(Axh

 

+ At)) (Axh

- f Avf

 

f x (Axh

+

Av)T

+

 

 

 

 

- f

(Axh

+

Aa) xT] +

о (A) =

 

 

 

 

 

 

 

 

 

 

 

=

RJi +

 

[ExxT)

ATh

+ AhE [xxT)

+

o(h)

=

 

 

 

 

 

 

=

[PAT

 

4-AP+ RL)h

+ o{h).

 

 

 

 

 

 

 

 

 

 

Четвертое

 

равенство

следует

из

того,

 

что

х

и Av

независимы

и E{Av)

(Au) T =

.R1 /i+o(/!.). Разделив

на h

и

перейдя

к

преде­

лу при /г-»-0, получим выражение (6.12). Сформулируем теоре­ му 6.1, которая является итогом приведенных выше рассуж­ дений.

78

Глава 3

Теорема 6.1. Решением стохастического дифференциального уравнения является случайный процесс со средним значением тх(1) и ковариационной функции R(s, t), где

~£-

 

= A(t)mx,

 

 

(6.6)

at

 

 

 

 

 

mx(t0)

 

= m0,

 

 

(6.7)

Я ^

)

= 1 Ф ( 5 ' ^

^

S > t >

(6.8)

"

;

\P(s)0T(t;s),

 

sKt,

 

^=AP+PAT

+ RU

(6.12)

at

 

 

 

 

P(t0)

 

= R0.

 

 

(6.13)

Замечание. Аналогичные

формулы для

среднего

значения и

ковариационной функции можно получить, если предположить,

что

{v(t),

teT}—процесс

с

некоррелированными

приращени­

ями с нулевым средним и ковариацией приращений

R\dt.

 

Возникает вопрос, стоит ли использовать этот метод для

решения

стохастического дифференциального уравнения в ли­

нейном случае? Нельзя ли получить аналогичный

результат

формальным преобразованием

равенства

 

 

 

 

 

— = Ах + е,

 

(6.14)

 

 

 

dt

 

 

'

где

{е}—непрерывный

белый

шум с ковариационной

функцией

 

 

cov [e(t),e(s)]

= Rfiit — s).

 

 

Чтобы показать, как легко получить при этом неверный резуль­ тат, проведем некоторые формальные преобразования равенст­ ва (6.14). Рассмотрим, например, вычисления ковариационной матрицы

 

 

Р (t) = Ex (0 хТ

(t).

 

Дифференцируя

по времени, получим

 

 

— = Е— хт

+ Ex—

= Е(Ах

+ е)хт + Ех(Ах

-f е)т =

dt

dt

dt

v

'

'

'

=

AExxT

± {ExxT)

A t = AP +

PAT.

 

Очевидно, что это неверно, так как мы получаем только первые два члена выражения (6.12), т. е. для случая, когда е = 0 . По­ лучение неверного результата объясняется тем, что производ­ ная dx/dt не существует. Так как dx имеет размерность у dt ,

Стохастические модели состояния

79

то обычные правила дифференцирования в этом случае не при­

менимы. Рассмотрим

тождество

 

 

 

 

 

Аххт

= (Л; -f А*) +

Axf — ххт

= х (Ах)т +

(ДАТ) Х Т

+ (ДА-) (ДАТ)7".

Если

ДАТ имеет

размерность Д^, как при обычных

вычислениях,

то последний член имеет размерность

(Ai)2,

и он мал по срав­

нению с А-ДЛТг. Если

AT является винеровским

процессом, послед­

ний

член

имеет

размерность

At. Перейдя

к

математическому

ожиданию, получим

 

 

 

 

 

 

 

 

АЕххт

= Ex (AxAt + Avf

+ Е (AxAt + До) хт

+

 

 

 

-f

Е (AxAt + Av) (AxAt + Av)T

=

 

 

 

 

 

=

[{ExxT)

A T + AExxT]

At + E (Av) (Av)r

+ о (At);

следовательно,

dP = [PAT + AP+ Rx) dt,

что приводит к правильному результату.

Упражнения

1. Изменение тяги ракетного двигателя приблизительно мо­ жно описать белым шумом вектора угловой тяги. Предположим, что спектральная плотность N = 0,0004 рад2 /Гц и ускорение ра­ кеты равно 3 м/с2 . Определить дисперсию горизонтального по­ ложения и горизонтальной скорости после 100 с ускоренного движения.

Замечание. Горизонтальное движение описывается уравне­ нием Л'=а0, где Э угол вектора тяги.

2. Оценить

ковариационную

матрицу

состояния

системы

 

 

dx

- f l

i

~aAxdt+\l

dv.

 

 

 

 

 

1

о J

 

[ о

 

 

где

Qi>0,

а 2 > 0 ,

a {v(t),

teT} — винеровский процесс с единич­

ным параметром

дисперсии.

 

 

 

 

 

3. Скалярный случайный процесс удовлетворяет стохастиче­

скому дифференциальному уравнению

 

 

 

 

 

 

 

dx = axdt + dv,

 

 

где

{v(t),

teT} —винеровский процесс с параметром дисперсии

гх.

Начальное состояние лт0 нормально

с математическим ожи­

данием /д0 и ковариацией г0 . Процесс

{v(t),

teT} не зависит от

А'(^О). Найти среднее значение m(t)

и ковариационную

функцию

для

АТ(^). Привести достаточные условия существования преде­

ла

Ex2(t)

при t-^oo

и t0-^>—со.

Показать,

что если

пг0—0,