Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ временных рядов

..pdf
Скачиваний:
4
Добавлен:
19.11.2023
Размер:
47.02 Mб
Скачать

Глава 6

СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ

6.1. ВВЕДЕНИЕ

Одна из первоочередных задач в анализе временных рядов состоит в том, чтобы решить, не является ли наблюдаемый ряд реа­ лизацией последовательности независимых случайных величин. В качестве простой альтернативы здесь можно использовать про­ цесс, у которого последовательные наблюдения коррелированы. Примером такой альтернативы будет процесс, порождаемый стоха­ стическим разностным уравнением первого порядка. В подобных случаях для проверки гипотезы о независимости может оказаться уместным использование различного вида сериальных корреляций первого порядка.

Пусть наблюдаемый ряд уъ ..., ут является реализацией про­ цесса, имеющего нулевое математическое ожидание. Одно из воз­ можных определений сериальной корреляции первого порядка таково:

т

 

2

vm- 1

( 1)

t~2

гг

Т

t—\

В этой главе рассматриваются различные определения сериальной корреляции. Если известно, что средние значения равны нулю, то эти определения являются модификациями (1). Если же средние значения неизвестны, то yt в (1) заменяется отклонением от выбо­ рочного среднего (или от оценки тренда). Многие модификации свя­ заны с изменением крайних членов, т. е. членов, содержащих Ун У г> У т -1, Ут - Другие включают в себя введение дополнительного сомножителя, например Т1(Т — 1).

284 СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ Гл. 6.

Сериальная корреляция служит мерой взаимной зависимости между элементами последовательности наблюдений, подобно тому

как мерой

зависимости

менаду двумя

множествами наблюдений

* i, _ ..., х ы

и г ъ ... , Z fj служит обычный

коэффициент корреляции

(средние предполагаются

равными нулю)

(2)

В случае сериальной корреляции в числителе последнего выра-

Т 2

жения переменная х, заменяется на yt, а г, на yt-\. Поскольку 2 У‘

Т

t= 2

Г—1

и 2

y2t- 1 = 2 * /? служат в случае стационарного процесса (с ну-

/=2

*=1

левым средним) оценками для — 1)/а2, то эти статистики можно

т

заменить на 2 yl (возможно, домножив еще на — 1)/Т). Таким t=i

образом, определение (1) аналогично определению (2). Сериальную корреляцию называют иногда автокорреляцией.

Сериальные корреляции более высокого порядка определяются аналогичным образом. Так, одним из определений сериальной кор­ реляции /-го порядка является

т

2

ym -i

(3 )

--------- .

2 ft

t=\

Эта величина измеряет взаимную зависимость наблюдений, сдвинутых на / единиц времени. Она может использоваться для про­ верки нулевой гипотезы о независимости против альтернативы, ут­ верждающей существование зависимости между наблюдениями, отстоящими друг от друга на / единиц времени.

В большинстве ситуаций, однако, полагают, что наличие зави­ симости наблюдений, отстоящих друг от друга на i единиц времени, автоматически приводит к зависимости наблюдений, отстоящих

Ч В дальнейшем автор обычно называет такие отношения сериальными коэф­ фициентами корреляции.— Прим, перев.

&1.

ВВЕДЕНИЕ

285

друг от друга также на 1, 2,

i — 1 единиц времени. В связи с

этим сериальную корреляцию i-ro порядка

обычно используют для

проверки нулевой гипотезы, утверждающей существование зависи­ мости (t — 1)-го порядка, против альтернативы, утверждающей, что порядок зависимости равен i. Например, можно говорить, что процесс, порождаемый стохастическим разностным уравнением i-ro порядка, соответствует зависимости порядка i. При этом сериаль­ ный коэффициент корреляции порядка i следовало бы использовать вместе с сериальными коэффициентами корреляции меньшего по­ рядка.

Более общей является задача определения порядка зависимости

для случая, когда предполагается, что этот порядок не

меньше

т (>• 0)и не бс.,ьше р ( > т). Такую процедуру со многими

решени­

ями можно построить, используя сериальные коэффициенты корре­ ляции вплоть до порядка р.

Вопросы проверки независимости, проверки порядка зависи­ мости и установления наличия зависимости были по существу уже рассмотрены в гл. 5 при исследовании модели стохастического разностного уравнения (фактически стационарного гауссовского процесса конечного порядка). Свойства соответствующих процедур, распределения оценок и критерии, используемые для этих целей, оыли изложены в рамках теории больших выборок. В настоящей главе будут получены оптимальные процедуры и точные распреде­ ления для моделей, являющихся некоторыми модификациями мо­ дели стохастического разностного уравнения. (Например, оценка

—Pi в модели стохастического разностного уравнения первого по­ рядка имеет вид сериального коэффициента первого порядка.)

Общие типы моделей мы получим исходя из модели стохастиче­ ского разностного уравнения (§ 6.2). Для этих экспоненциальных моделей предлагаются оптимальные (односторонние или несмещен­ ные) критерии для проверки зависимости. Разрабатываются про­ цедуры со многими решениями, использующие такие критерии (§ 6.4). Соответствующие построения аналогичны тем, которые ис­ пользовались для определения степени полиномиального тренда (разд. 3.2.2); определяются некоторые точные модели как для слу­ чая известных средних (§ 6.5), так и для случая, когда средние неизвестны, включая модели с трендом (§ 6.6). Эти модели связывают­ ся с определениями сериальных коэффициентов корреляции. При их исследовании используются циклические сериальные коэффи­ циенты корреляции, а также коэффициенты, основанные на сумме квадратов последовательных разностей. Мы получим точные рас­ пределения некоторых сериальных коэффициентов корреляции (§ 6.7) й их приближенные распределения (§ 6.8), а также найдем некоторые совместные распределения (§6.9). Использование сериаль­ ных корреляций в качестве оценок будет рассмотрено позднее, (гл. 8).

286

СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ

Гл. 6.

6.2.ТИПЫ МОДЕЛЕЙ

Вгл. 5 мы изучали временные ряды, порожденные стохасти­ ческим разностным уравнением порядка р :

о)

Ut +

+

• • • + §pVt—p — Щ.

где

{щ} — последовательность

независимых случайных величин

с нулевыми средними и дисперсиями а2. Если распределение вели­

чин уъ

...,

ур задано,

а щ не зависит от y t-i, yt-2, ..., у± для t =

= р +

1,

..., Т, то

распределение величин ир+ь ..., ит будет

полностью определять совместное распределение уъ ..., ут, явля­ ющихся наблюдаемыми величинами. Если, к тому же, случайные величины щ являются одинаково распределенными, то совместное распределение величин уъ ..., ур можно подобрать таким образом, что yt будут образовывать стационарный случайный процесс, если только Бее корни соответствующего характеристического уравне­ ния лежат в единичном круге. [В разд. 5.2.1 было показано, что для того, чтобы случайный процесс ..., у - 1, у0, уъ ..., удовлетворяю­ щий стохастическому разностному уравнению (1), был стационар­ ным и величина yt не зависела от щ+и ut+2» •••> необходимо и до­ статочно, чтобы все корни характеристического уравнения, соот­ ветствующего (1), лежали в единичном круге.] Если а2 является единственным неизвестным параметром распределения случайной величины щ, то параметрами процесса будут рь ..., и а2.

Займемся рассмотрением временных рядов, имеющих совмест­ ные нормальные распределения с нулевыми средними. Случай, ког­ да средние отличны от нуля, будет рассмотрен в этой главе поз­ днее. Модели с нормальными распределениями называются гаус­ совскими. В таких моделях совместное распределение величин Уъ •••» УР определяется полностью заданием ковариационной матрицы этих величин, которую будем обозначать Ърр. Пусть

(2) S p p — ( ° ( P ) ) -

Тогда плотность совместного распределения величин уъ ..., ур равна

(3)

а плотность совместного распределения up+i,

итравна

6.2. ТИПЫ МОДЕЛЕЙ 287

Поэтому плотность совместного распределения у ъ

у т есть

1

(

1 f

р

 

 

 

<5)

ехР р

2 I J , <

y

ty, +

 

1

7

 

 

 

 

1

+ ~

^ + i ^

^

$ 1 У ( Ы

+

• * *

+ Рр */*-р) j

Выражение в показателе экспоненты, заключенное в квадратные скобки, равно

(6)

2

0{P)ytys -I

 

2

\yt~ьPi№—1-Ь

•••

Рр(/^_р-{-

 

/,S=1

 

 

 

 

t=p-fl

 

 

 

 

 

 

 

+

 

 

+

2$i$%yi—iy t—2 +

• • • + 2

$p—$ p y t —p + iy t—p +

* • •

 

 

 

 

 

 

 

 

 

 

 

• • •

+ 2$pytyt^p] —

 

 

 

(1

+

P i +

• * *

+

Pp) t=2p+1

+

2 (Pj 4- PiPa +

• • •

 

 

• • •

+

 

Г - р + 1

VtVt-1 +

* * • +

2pp

г

-j

 

 

PP- IPP) 2

2

ViVt-p +

 

 

 

 

 

 

<=p-H

 

 

 

 

<=p+1

J

 

 

 

 

 

г

 

 

P

 

 

 

 

 

 

 

 

 

+

2 atsytys+

2 ^si/r+l-zJ/r+l-s-

 

 

 

 

 

 

 

/,s=l

 

 

t,s=1

 

 

 

 

 

 

(Мы предполагаем

Г >

2p.) Представим

(6) в виде z/'S ’у, где

У =(#i,

....

*/г)'.

 

 

 

чтобы процесс оказался стационар­

 

Если

2рР

выбирается так,

ным, то из соотношения

(7)0 (sr-t) = a [ ( T - s + l ) - ( T ~ t + l ) ]

следует, что элемент, стоящий на пересечении t-й строки и s-ro столб­

ца матрицы 2-1, совпадает

с элементом t + 1)-й строки и

— s + 1)-го столбца той

же матрицы. Ввиду этого указанная

квадратичная форма по переменным уъ

...,

ур будет иметь точно

такой же вид, как и

квадратичная форма

по переменным ут, ...

..., ут+i-p, т. е. ats

bts, t,

s = 1, ...,

p.

Коэффициенты послед­

ней можно получить из соотношения (6).

 

Заметим, что в квадратичной форме (6) отсутствуют слагаемые

У{У$>для которых | t s | >

р. С’точностью до крайних членов эта

квадратичная форма является линейной комбинацией сумм ^ \ytyt-i, t

288

 

СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ

Г л . 6.

/ == 0, 1,

р, именно

 

(8)

1+PI +

± S S «?+2 5L±J !+ "• +Р,

ViVi—14" —

 

 

• • • + 2

2 ytyt—p.

Коэффициенты этой квадратичной формы (в количестве р + 1) задают преобразование р + 1 параметров а2, р1( Рр. Гипотезы и задачи со многими решениями можно формулировать, используя эти коэффициенты. Отметим, что 2рр/о2 является коэффициентом

при

t

Последние члены в (6) [точнее две последние суммы в правой час­ ти (6)] также являются некоторыми функциями от о2, рх....... Рр. Отсюда следует, что достаточное множество статистик будут состав­

лять здесь р + 1 сумм Уytyt~i, /

= 0, 1, ...,

р, и,

кроме того, не-

Т

yx-f-i-tyr+i-s,

t,

s = 1.......

р.

которые из произведений ytys и

В свою очередь тот факт, что число статистик в минимальном дос­ таточном множестве много больше, чем число оцениваемых парамет­ ров, не дает возможности поставить задачи статистических выводов таким образом, чтобы они приводили к относительно простым оптимальным процедурам.

Если значение Т довольно велико по сравнению с р, то суммы

будут доминировать над остальными членами. Это наводит

t

на мысль заменить (5) такой плотностью, которая использовала бы те же самые суммы, но в которой крайние члены были бы изменены таким образом, чтобы можно было получить семейство только р + 1 достаточных статистик.

Предположим, что

плотность совместного распределения вели­

чин уъ ....

ут имеет вид

 

 

 

 

(9)

/ {Уи

• • • . Ут|То.

• • • . У р ) = ^

exp[— (y0Q0+

+

ypQp)/2],

где Qj — квадратичная форма по у =

(</1( ...,

ут)',

 

 

(Ю)

 

 

Q/ = у'А/у,

 

 

 

А/ — заданные симметрические матрицы, / = 0 , 1,

.... р,

причем

А0 положительно определена, а у0,

..., ур — параметры,

у0 > 0,

такие, что квадратичная форма

 

 

 

 

(11)

Q — y0Q0 +

+ yPQP = У' (УоАо +

••• +

УРЮ У

положительно определена. При этих условиях (9) является много­ мерной нормальной плотностью. Константа К = К (Уо> •••» Ур)

6.2.

 

 

 

ТИПЫ МОДЕЛЕЙ

 

 

 

289

зависит от значений Yo, ...*

ур и имеет вид

 

 

 

 

(12)

к

(Yo. • • • ,

Ур) = (2п )~ т'21Yo Ао+

• • •

+ YА

Гл-

 

Обычно в качестве А„ будет браться единичная

матрица I.

 

Связь между параметрами в (9) и (5) следующая:

 

 

 

 

 

* +

Pi +

• • •

+ Рр

 

 

 

 

 

 

?о= --------- ^-------- ->

 

 

 

 

 

 

YI = 2 PI + Р1Р2 +

• • • + Рр—iPp

 

 

 

(13)

 

_ о Рр—1+ PlPp

 

 

 

 

 

 

 

>

 

 

 

 

 

 

Ур1

Z

„2

 

 

 

 

 

Заметим,

что Ym+i =

...

= ур = 0

тогда

и только тогда,

когда

pm+i = ...

 

= р = 0 .

Обычно

квадратичная

форма

Q;

равна

т

 

плюс квадратичная форма по переменныму ъ

..., «//плюс

y ty t - j

подобная ей квадратичная форма по переменным ут~/+ь .... Ут- Эги квадратичные формы выбираются соответствующим образом (например, с общими характеристическими векторами). Три приме­ ра систем квадратичных форм приводятся в § 6.5.

С помощью этой модели рассмотрим проверку гипотезы о том,

что Ym+i = ••• =УР = 0

для

определенных

заранее значений

пг и р. В частности, нас

будет

интересовать

случай m —р — 1.

Наиболее важным является случай, когда р = 1. Поэтому в литера­ туре ему уделяется особое внимание. Мы найдем критерий, равно­ мерно наиболее мощный против альтернатив ур < 0 (или, что экви­ валентно, рр < 0), а также равномерно наиболее мощный несмещен­ ный критерий. Реальное использование этих критериев целиком зависит от етепени разработанности теории и наличия необходимых таблиц.

Другой тип задач, которым мы будем заниматься, это процедура со многими решениями для выбора наибольшего индекса t, при ко­ тором еще у,- Ф 0, среди t = m, ..., р. Последний будет представ­ лять собой порядок зависимости. Мы зададимся вероятностью за­ вышения порядка для случая, когда порядок на самом деле равен f, i = m, .... р — 1, и потребуем, чтобы процедура была равномер­ но наиболее мощной против альтернатив о положительной зависи­ мости (ус< 0) или равномерно наиболее мощной несмещенной про­ цедурой . Такие процедуры строятся из ряда критериев проверки

гипотез

подобно

тому, как это было сделано в разд. 3.2.2.

[См. Т.

Андерсон

(1963).]

290

СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ

Гл. 6.

6.3.РАВНОМЕРНО НАИБОЛЕЕ МОЩНЫЕ КРИТЕРИИ ДЛЯ ПРОВЕРКИ ЗАДАННОГО ПОРЯДКА ЗАВИСИМОСТИ

6.3.1, Критерии, равномерно наиболее мощные

 

против альтернатив о положительной зависимости

Исходной моделью для наблюдений уъ

ут будет модель с

многомерной нормальной плотностью (9) из

§ 6.2. В настоящем

параграфе мы будем интересоваться проверкой гипотезы о значении

у(,

i — 1, ...,

р, в

предположении,

что y;+i = ... = ур = 0 .

В этом случае указанная плотность равна

(1)

ft (Уг......... Ут | ?о.

• • • . yt) =

(То.

•••.?,) X

где

 

 

 

 

 

а квадратичная

форма y0Q0 + ... +

положительно определе­

на. Нулевая гипотеза состоит в том, что порядок зависимости мень­ ше i (в предположении, что он не больше i). Если i = 1, то нулевая гипотеза у( = 0 есть просто гипотеза независимости (когда матри­ ца А0 диагональна, например когда А0 = I). В этом разделе мы зай­ мемся проверкой гипотезы о том, что yt имеет заданное значение, против односторонней альтернативы. В случае когда i = 1 и вы­ брана нулевая гипотеза уг = 0 (р 1 =0), естественной является аль­ тернатива 7 i < 0 (т. е. < 0), которая соответствует положитель­ ной теоретической корреляции между последовательными наблю­ дениями. Если же i > 1, то альтернатива к нулевой гипотезе ус = = 0 (Р, = 0 ) уже не обязательно будет иметь вид yt < 0 (р, < 0), поскольку —f$t представляет частную корреляцию между yt и yt+i при заданных корреляциях низшего порядка. Поскольку критерии, оптимальные против альтернатив yt > 0, строятся подобно крите­ риям, оптимальным против альтернатив yt << 0, мы ограничимся рассмотрением только альтернатив, соответствующих положитель­ ной зависимости (у{ < 0).

Для экспоненциальных семейств плотностей, таких, как (1), задачи статистических выводов относительно просты. Наиболее существенным является здесь тот факт, что минимальное достаточ­ ное множество статистик имеет в этом случае размерность, совпа­ дающую с размерностью множества параметров.

Т е о р е м а 6 . 3 . 1 . Если у ь

ут

имеют

плотность совместного

распределения (1), то Q0, ...,

Qt образуют

достаточное множество

статистик для параметров у0, ...,

yt.

 

6 .3 . РАВНОМЕРНО НАИБОЛЕЕ МОЩНЫЕ КРИТЕРИИ 291

Экспоненциальное семейство имеет классическую форму Купме- н а —Дармуа. Последняя, очевидно, удовлетворяет критерию факто­ ризации, состоящему в том, что соответствующая плотность может быть представлена в виде произведения неотрицательной (изме­ римой) функции от параметров и достаточных статистик и неотри­ цательной (измеримой) функции от наблюдений, не зависящей от параметров. [См., например, Леман (1959, стр. 75) или Кендалл и Стьюарт (1961, стр. 41).] В рассматриваемом случае в качестве пер­ вой функции можно взять самоё плотность, а в качестве второй ис­ пользовать единицу. Из этой теоремы вытекает, что интересующие нас выводы могут быть сделаны на основании значений статистик

Qo, ..., Qc. Например, для любого критерия, использующего

все

наблюдения уг....... ут, можно так подобрать критерий (быть

мо­

жет, рандомизированный), использующий только достаточные ста­

тистики Q0,

...,

Qit что уровни

значимости и функции мощности

обоих критериев будут одинаковыми.

 

 

Т еорема

6.3.2.

Семейство распределений

случайных

величин

Qo, .... Qi

в (1)

при значениях параметров у0,

..., yL, таких, что

квадратичная форма y0Q0 + ...

+ y^Q; положительно

определе­

на, является полным.

 

 

 

Свойство полноты также является общим свойством экспонен­ циальных семейств. [См., например, Леман (1959, стр. 183) или Кендалл и Стьюарт (1961, стр. 256).] Доказательство вынесено в упр. 7.

Из теоремы 6.3.2 следует, что критерий для проверки нулевой ги­

потезы о том, что у,- равно заданному значению, например у!1’, имею­ щий заданный уровень значимости ег и определяемый подобной областью, обладает неймановской структурой. Иными словами, если Si — множество в пространстве случайных величин Q0, •••. Qi, такое, что

(3)

 

Pr {Si | у0, у1(

. . .

, У(—1,

у»5'*. 0.

• • • ,

0} =

Bi,

 

то

 

 

 

 

 

 

 

 

 

 

 

 

0} = et

(4)

Рг {S,. | Q0, . . . .

Q;_i;

Vo.

• • •

. Yi-ь

Vi'*, 0, ...

,

для почти всех возможных значений Q0, ...,

Q(_ i. [См. Леман (1959,

разд. 4.3)

или Кендалл и Стьюарт (1961, п. 23.19).] Доказательство

вынесено в упр. 9. Отметим, что, поскольку статистики Q0,

..., Q,-_i

достаточны для уо. ...,

у/_ь

вероятность Рг (5,-1Q0,

..., Qi_i;

Yo......

Yi-uVi1’, 0 .......0 } не

зависит от значений у,, ...,

уг-i.

Пусть hi (Qi | Qo,

...,

Q,_i;

y0,

...,

y{) условная плотность

распределения

величин Qt при

заданных

значениях

 

Q0,

..., Q;_i

и Yi-H=

•••

=Y р = 0 -

Эта плотность будет интересовать нас на

множестве

i всех

возможных значений Q0,

...,

Q;_i

(которое

292 СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ Гл. 6.

характеризуется положительной маргинальной плотностью распре-

деления величин Q0.......

Q;_i). Пусть ht (Q0,

.... Q« | y0......

У,) —

плотность для

Q0, •••.

Qi

ПРИ Yi+i

=

•••

= yp = 0 . Она

выра­

жается формулой

 

 

 

 

 

 

(5)

ht (Q0, ...

,

Qi | Yo>

• • •

> Y«) ~

 

 

 

 

=

Кi (Yo. • • •

.

Y,) exp [---- Y (YOQO+

• • •

+

Y/Q/)J К (Q0, . . . .

Qt),

которая получается из соотношения для плотности величин уъ ...

...,

утпреобразованием

........

ут в

величины Q0,

Qt и в

i — 1)

величин

yt

и

последующим

интегрированием этих

— I — 1)

величин

yt

по

области,

определяемой

значениями

Q„,

..., Qi.

Выполнение этих

операций одновременно

определяет

функцию kt (Qc, ...,

Qi) в (5). При этом V, будет множеством зна­

чений Q0,

Qi, для которых

(Q0,

...,

Q,) > 0. Маргинальная

плотность величин Q0, ...,

Q,_i будет равна

 

(6 )

/С; (ТО,

••• , Т/)еХР

 

(ToQo +

• • •

+ Yt—lQi—i)

X

где

 

 

 

 

 

 

X ml (Qo, • • •

, Qt-f, Y/).

 

 

 

 

 

 

 

 

 

(7)m,(Qo..........Qw ; Yi) = J‘ e_ViQi/4 (Q0............ Q()

(Заметим, что mi (Q0, ..., Qt-\\ у,) > 0

для всех уг.) Таким обра­

зом, условная плотность для Q, при заданных значениях статистик

Qo.......

Q»-i из Vi-i имеет вид

 

 

(8) M

f t l f t .........f t - . i t . ...........'t,) = e->Aa

■■■*& -

 

 

 

• - Qi-vVi) :

 

(Qi I Qo.

Qi-1; Y/)-

Условная плотность распределения величины Qt при заданных зна­ чениях Qo, ..., Qi-1 представляет собой экспоненциальное семей­ ство с параметром у,-. Действительно, для фиксированных значений

Qo, ..., Qi-1 функция

kt (Qo, ...,

Qi) будет зависеть

только от Q(,

а функция /п(- (Qo.......

Q,_i, уг)

будет функцией от yit выполняя

роль нормирующего

множителя.

Следует заметить,

что условная

плотность ^ (Qi | Qo........ Qf-i, y() может быть записана только для Qo....... Qi—i из Vi-i.

Поскольку критерий для проверки гипотезы yt = у(;[) имеет неймановскую структуру, мы можем применить фундаментальную лемму Неймана — Пирсона (упр. 10) к условному распределению

величины Qi. Наилучцшм для проверки гипотезы у,- = у*1’ против альтернативы у,- = у|2) оказывается критерий, имеющий критиче­