книги / Статистический анализ временных рядов
..pdf6 .4 . ВЫБОР ПОРЯДКА ЗАВИСИМОСТИ 303
|
Рр = |
Рг (принять Нр | Яр_1 U ... [} |
Н т\, |
рр-1 = Рг (принять Яр_1 |Яр_2 и • • • |
и Н т}> |
||
(6) |
: |
|
|
pm+i = |
Рг (принять Hm+l I Нт]. |
|
|
Пусть рт = |
1 — pq — ... — Pm+1 = РГ (принять Нт | Ят }. По |
средством соотношений (6 ) исследователь приписывает определен ные значения вероятностям решений о том, что порядок зависи
мости равен i, |
когда в действительности этот порядок меньше i, |
i = щ + 1....... |
р. |
Статистическая процедура для этой задачи со многими решени ями состоит в следующем. Имеется набор р — т + 1 попарно не пересекающихся, составляющих полную группу областей в про странстве значений Q0, ..., Qp (или в исходном пространстве зна чений у1г ..., г/г). Мы обозначим эти области Rm, Rm+ь ..., Rp- Если выборочная точка попадает в Rit то принимается гипотеза Н(. Приписывание уровней значимости приводит к тому, что эти облас
ти становятся подобными в том смысле, что при у, = |
в |
... = |
ур = |
|
== 0 вероятности попадания |
выборочной точки |
Rt....... Rp |
||
равны соответственно plt ..., |
рр (независимо от у0, |
уь |
..., |
уг-0 - |
Иными словами, если порядок зависимости меньше г, то вероятность ошибок от приписывания зависимости порядка i не зависит от того, каков именно истинный (более низкий) порядок.
Рассмотрим сначала альтернативы, утверждающие факт положи тельной зависимости. Это соответствует значениям yt <С 0. (Позд нее мы рассмотрим несмещенные процедуры для yt Ф 0 .)
Зафиксировав указанные ограничения, потребуем, чтобы обла сти Rt были наилучшими в том смысле, чтобы были максимально возможными вероятности попадания в Rt при условии, что верна Hh i = т + 1, .... р. Мы одновременно пытаемся максимизировать вероятности попадания в р — т различных областей (каждую для всех отрицательных значений соответствующего параметра). Далее будет показано, что в указанных выше условиях при подборе одной из областей с целью максимизации вероятности попадания в эту область не имеет значения то, как выбираются остальные области. Этот факт позволяет оптимизировать области Rm+1, Rp одно временно.
Ограничения (5) или эквивалентные им ограничения (6 ) приво дят к тому, что каждое множество /?,• или, что равносильно, каждое множество Rt (J Ri+i Rp — область отклонения гипотезы
Щ, р - 1.....i — имеет (ввиду свойств достаточности и полноты) ней
мановскую структуру. Иначе говоря, при i = т -f 1, ... , р,
(7) |
Рг (Я, | Qq, . . . . Qi- и yt = • • • = yp = 0) = pl |
304 |
СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ |
Гл. 6. |
||
для почти всех возможных значений Q0, ..., |
Q/-i. Исходя из этого |
|||
можно показать, что выбор Rp, ..., |
Ri+\ (при допущении (6 )) не |
|||
влияет на выбор /?,, т. е. что вероятность попадания в R; (являю |
||||
щаяся функцией у,) |
при Y/+1 |
= ... |
= ур = |
0 не зависит от того, |
какими были выбраны Rp, ..., |
Ri+\. |
Отметим, что значение уг ин |
||
тересует нас только |
в том случае, |
когда |
у(-н = ... = ур = 0 . |
Если же какое-нибудь из у,-+ь ..., ур не равно нулю (т. е. если по рядок зависимости больше t), то вопроса о значении у,- не возни кает и мы можем считать yt Ф 0 .
|
Лемма 6.4.1. |
Пусть множество S;+i в пространстве значений |
||||
Qo, - м Qp таково, что |
|
Рр+ • • • |
|
|
||
(8 ) |
Pr |
|у( + 1 = ... |
= Ур = 0} = |
+ |
Pi-fl, |
|
и |
пусть Г, — множество, |
определяемое |
значениями |
Q0, ..., Qr |
||
Тогда |
|
|
|
|
|
|
(9) |
Pr {5,+i П |
Ti | y/+i = |
• • • = yp = 0} = |
|
|
|
|
= (1 |
— Pp*~ ••• — Pi+\)PT {Ti]Vi+i = |
••• = T P = °}. |
где S{+1 — множество, дополнительное к Si+t.
Смысл леммы состоит в следующем. Каким бы образом мы ни вы
бирали Rp, ..., |
при условии (6 ), |
из которого |
следует (8 ) |
для |
|
5{+i — Rp U ••• U |
Ri+i, |
вероятность |
попадания |
в область |
Rh |
определенную как пересечение 5,+i Г) |
будет зависеть только от |
||||
Tt и не будет зависеть от |
S;+i (когда верна гипотеза Н*р,р- \.... *+i). |
Доказательство леммы проведено в разд. 3.2.2 с использованием коэффициентов регрессии. Там же дано подобное доказательство сформулированной ниже леммы 6.4.2. Оба эти доказательства опи раются только на свойства полноты и достаточности. При этом соот ветствующую терминологию и обозначения можно заменить терми нологией и обозначениями настоящего параграфа.
Пусть |
Т*{ — область, определяемая неравенством |
(Ю) |
Qi>Ci(Q0, . . . . Qi-i), |
в котором ct (Qo, ..., Q;_i) выбирается так, чтобы условная вероят
ность (10) при заданных |
Q0, |
..., Q;_i равнялась е(. для уг = |
0, и |
пусть г( = рг/( 1 — рр — |
... |
— pi+i). |
|
Л емма 6.4.2. Пусть |
Si+i |
удовлетворяет соотношению |
(8 ), а |
Rt — произвольное не пересекающеесяс Si+i множество, для которого
(11) Рг{Яг|У< = Уг-н = ••• =Y P = 0 } = ft.
6 .4 . |
|
|
|
|
|
ВЫБОР ПОРЯДКА ЗАВИСИМОСТИ |
|
|
305 |
||||||
Тогда при |
yt < |
0 |
|
|
|
|
|
|
|
|
|
|
|||
(12) |
Рг [Si+\ |
П |
T i |
|vi+i = |
••• |
= v р = |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
> |
Рг {Я(. | YH -I = |
= YP = 0}- |
||||
|
Из приведенных двух лемм вытекает, что, какими бы ни были |
||||||||||||||
области R p, ..., |
Ri+ i, наилучший выбор области |
|
состоит в том, |
||||||||||||
что |
должно являться частью Т], не содержащей точек Rp, ... |
||||||||||||||
... , Rt+1. При таком выборе R{ вероятность |
|
|
|
|
|||||||||||
(13) |
Pr {Rt | yi+i = |
••• |
= Yp = |
0 } = |
|
|
|
|
|
||||||
|
|
|
= |
(1— Рр— |
••• |
— ^t+i)Pr {Т’П Y/+X = |
••• = |
Yp = 0} |
|||||||
не зависит от выбора R p, |
..., |
Ri+\. |
|
|
|
|
|
|
|||||||
..., |
Теорема 6.4.1. П у с ть непересекающиеся множества R m, R m+ \,... |
||||||||||||||
R p выборочного |
пространства |
таковы, что |
R m (J |
(J ... |
|||||||||||
... |
(J |
R p есть все э то пространство и |
|
|
|
|
|
||||||||
(14) |
Рг{/?,• | Y,-= |
Yf+i = |
••• |
= Y P = 0) = PI , |
i |
= |
m + J , . . . , p |
||||||||
где |
|
pm~i |
+ |
••• + |
Рр < |
1. |
Тогда |
для |
каждого значения |
у( < .0 |
|||||
вероятность Pr {R t | Y<> Y<-H |
= |
• • • |
= |
YP = |
0} |
принимает мак |
симальное значение на множестве R it определяемом как пересечение
множества |
(10) при е, = р Д \ |
— рр— |
... — pi+i) и |
дополнения |
||
к множеству R p U ... О |
Ri+u t = m -f |
1,..., р. |
|
|||
Оптимальной, таким |
образом, является следующая |
процедура |
||||
|
R P = T ; |
|
|
|
|
|
|
Rp—i —Тр Г) Т'р—и |
|
|
|
|
|
(15) |
Я, = ГР П Тр*- 1 П |
... |
П |
^ *-и П T l |
|
|
|
Rm+1 —Тр П Тр—1П |
. . . |
П |
Тш+2 П Тmjr1, |
|
|
|
Rm — Тр П Тр—1П |
. . . |
П |
Тт-\-2 л Тгп^1. |
|
Эта процедура сводится, по существу, к следующему. Поочередно
проверяются гипотезы ур = 0 , ур-\ |
= |
0 |
и т. д. до тех пор пока |
либо какая-то из гипотез, например |
yt |
= |
0 , не будет отклонена и |
будет решено, что верна Hh либо будут приняты все гипотезы вплоть до Ят . Таким образом, указанная процедура является последова тельностью критериев. Этот факт обусловлен требованием незави симости от истинного порядка вероятности правильного решения О том, что порядок зависимости меньше данного натурального числа.
306 СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ Гл. 6.
Рассмотрим теперь процедуры, использующие двусторонние критерии. При этом будем накладывать требование несмещенности.
|
Теорема 6.4.2. П у с ть |
R m, |
R m+ь |
|
R p — непересекающиеся |
||||||||||||
множества |
|
выборочного |
пространства, |
|
объединение |
которых |
|||||||||||
R m U |
Rm+\ |
U |
••• |
U R p |
совпадает |
со всем этим пространством и |
|||||||||||
|
|
Pr {Ri |
и ... |
U Rp I Y; = |
Yi+1 = |
• • • |
= |
ъ |
= |
0} < |
|
|
|
||||
( 1 6 ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
• • • |
+ |
Р р , |
|
|
Pr [Ri |
U |
••• |
U Rp IVi = |
Yi+i = |
• • • |
= |
YP= |
0 } < |
|
|
|
|||||
|
|
|
|
|
|
<Pr{tf(- u ... |
U |
Rp IYi> Y«'+i = |
|
=YP = 0}> |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
i = |
m + |
1, . . . . p, |
||
где pm+\ + |
• • • |
+ |
pp < |
1. Тогда |
для любого значения |
yt вероят |
|||||||||||
ность |
Pr {Ri | Yi. Yi+i = |
••• |
= YP = |
0} |
будет |
максимальной |
на |
||||||||||
множестве |
R h |
представляющем |
собой . пересечение множества, |
||||||||||||||
указанного в следствии 6.3.2, |
для е( |
= ptl{1 |
— рр — ... |
— pi+i), |
|||||||||||||
и дополнения к множеству R i+\ у |
... у R p, |
i = m + |
1, |
..., |
р. |
||||||||||||
|
Мы не говорили еще о том, как следует выбирать вероятности |
||||||||||||||||
рт , pm+i, •••, Рр- Если все 8(- фиксированы и равны, например, |
е, |
||||||||||||||||
то |
рр = е , |
|
рр^ |
= 8 ( 1 |
— е), ...^ |
Pi = е ( 1 |
— е)р~г, .... |
pm+i = |
|||||||||
= |
е(1 |
— е)р |
m |
’, |
рт = |
(1 — е)р |
т. |
Вообще |
говоря, приходится |
идти на компромисс между нашими стремлениями не переоце нить порядок зависимости и сохранить чувствительность процедуры к ненулевым коэффициентам. Альтернатива состоит здесь в выборе Рр < Рр—! < ••• < рт +\- Причем, если для больших значений i значения р, задавать весьма малыми, можно позволить себе в ка честве максимального порядка р брать достаточно большое число.
Результаты этого параграфа приводят к критерию для проверки
гипотезы |
|
|
(17) |
Н : |
ym+i = ••• = yp = 0. |
При этом ■процедуры, |
указанные в теоремах 6.4.1 и 6.4.2, можно |
|
интерпретировать как |
критерии с уровнем значимости рт + 1 + ... |
|
... + рр, |
согласно которым гипотеза (17) отклоняется, если выбо |
рочная точка попадает в любую область, отличную от R m. Процедура, указанная теоремой 6.4.1, состоит из односторонних
критериев для проверки гипотез против односторонних альтерна тив, утверждающих факт положительной зависимости. Если аль тернативой к независимости служит отрицательная зависимость (Y; > 0), в этом случае также употребляется процедура, аналогич ная предыдущей, но состоящая уже из односторонних критериев вида (15) § 6.3. Кроме того, можно сконструировать состаэные
6.4. |
ВЫБОР ПОРЯДКА ЗАВИСИМОСТИ |
|
|
|
307 |
|
процедуры для |
случая, когда в качестве альтернативы |
к |
гипоте |
|||
зе у,- — 0 выступает гипотеза у,- < 0, |
у,- > 0 или |
у |
ф |
0, |
i = |
|
= т + 1, ..., |
р. |
относительно |
такого |
типа |
||
Замечания, |
сделанные в разд. 3.2.2 |
процедур со многими решениями, используемых для определения степени полиномиального тренда, применимы и в настоящем слу чае. С теоретической точки зрения преимущество этой процедуры состоит в том, что исследователь контролирует здесь вероятность ошибочного завышения порядка зависимости. Неудобством ее являет ся то, что максимальный порядок зависимости р должен быть установлен заранее. Частично это неудобство можно обойти, пола гая значение р весьма большим, но выбирая зато вероятности pt очень малыми для t, близких к р. Иными словами, устанавливаются весьма малыми значения вероятностей ошибочного решения о том, что порядок зависимости равен г, если это i велико.
Альтернативой к указанной последовательной процедуре явля ется процедура, использующая критерии значимости в обратном порядке. Если считается, что порядок зависимости не меньше т, то исследователь может проверить сначала гипотезу ym+i = 0 с уровнем значимости ет+1. Если эта гипотеза будет принята, то вы носится решение о том, что порядок зависимости равен т. В против ном случае проверяется гипотеза ут +2 = 0. Эту процедуру можно продолжать таким образом и дальше, используя указанную после довательность критериев значимости. Если впервые будет принята гипотеза у( = 0, то порядок зависимости принимается равным i — 1. Если гипотеза у, = 0 отвергается, то переходят к проверке гипоте зы у,+1 = 0. Если при этом отвергаются все гипотезы вплоть до гипотезы ур — 0 с номером р, заданным заранее, то порядок зави симости считается равным р. Преимущество этой процедуры состоит в том, что не всегда требуется вычислять в<;е р + 1 квадратичных форм, поскольку последовательность критериев может оборваться прежде, чем придется проверять гипотезу ур —0. Ввиду этого вопрос о том, как следует выбирать здесь р, является несуще ственным.
В разд. 3.2.2 было указано, что соответствующая процедура для определения степени полиномиального тренда имеет опреде ленное практическое неудобство. Это неудобство состоит в том, что если коэффициент при степени i имеет достаточно большое зна чение, то возникает тенденция к завышению оценок дисперсии ошибки, используемых для проверки ут+и .... у/-ь Это в свою очередь ведет к возрастанию вероятности принятия одной из гипо тез ут+1 = 0 , ..., y,_i = 0 . В результате, может увеличиться ве роятность ошибочного занижения степени полинома. Фактически чем больше yt, тем больше и вероятность такой ошибки (если счи тать остальные у,- фиксированными). Этот случай проверки порядка зависимости представляется более трудным для анализа. Если зави
308 СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ Гл. 6.
симость соседних наблюдений, отстоящих на две единицы времени,
велика, то вполне может оказаться, |
что вероятность отклоне |
|
ния гипотезы |
= 0 не будет велика. |
Так что при таком подходе |
может быть ошибочно решено, что порядок зависимости равен еди нице, в то время как на самом деле он не меньше двух.
По-видимому, такую процедуру можно использовать, если для некоторого частного значения i значения параметров ym+i, .... v<-i будут достаточны для того, чтобы нельзя было решить, что хотя бы один из них будет равен нулю без того, чтобы у{ Ф 0. Например, такая процедура может оказаться подходящей для случая, когда значения параметров Y; монотонно убывают (или просто быстро убывают). Однако никакого теоретического исследования оптималь ных свойств здесь не имеется.
До сих пор в этой главе мы предполагали, что <$у1 — ... = = %ут = 0 . Если средние отличны от нуля, но известны, то при тех же предположениях в качестве объекта изучения можно рассматри вать разности переменных и их математических ожиданий. Знание средних является, однако, предположением, далеким от реально сти. Мы рассмотрим случай неизвестных средних в § 6.6, после того как обсудим более конкретные модели в § 6.5. (См. Т. Андер сон (1963).)
6.5.МОДЕЛИ: СИСТЕМЫ КВАДРАТИЧНЫХ ФОРМ
6.5.1.Общее обсуждение
Плотности распределений случайных величин уъ ..., ут, со ставляющих наблюдаемые временные ряды, которые мы здесь рас сматриваем, предполагаются нормальными. В показателе экспонен-
ты этих плотностей будут стоять суммы |
где Qf = |
= у'А/у — квадратичная форма по у = (уъ ..., |
г/г)'. Сериальные |
коэффициенты корреляции, получаемые из таких сумм, равны /у = = QjlQo- В этом параграфе будет предложено несколько различных систем матриц А0, Аь ..., Ар. В каждой из них Q/ будет близка к
2 ytyt4 , как это предполагалось в §6.2. Коэффициенты гъ ..., гр
в каждой из этих систем можно использовать для проверки гипотез
о порядке зависимости, в соответствии с теорией § 6.3, |
и для выбо |
ра порядка зависимости согласно § 6.4. |
указанных |
Для того чтобы быть подготовленными к анализу |
систем матриц, рассмотрим сначала множества матриц в общем пла
не. Характеристические корни |
..., Хт и соответствующие им |
характеристические векторы |
..., vr матрицы А размера Т X Т |
6.5. |
МОДЕЛИ: СИСТЕМЫ КВАДРАТИЧНЫХ ФОРМ |
309 |
|
удовлетворяют соотношениям |
|
|
|
(1) |
Avs= Xsvs, s = 1, |
Т. |
|
Поскольку эти соотношения можно записать в виде (А — l sl) vs = О и при этом vs Ф 0, то матрица А — Я,81 должна быть вырожденной.
Иными словами, |
ks является корнем уравнения |
(2) |
|А — Ы| = 0. |
Если матрица А симметрична (а это мы предполагаем для квадра тичных форм у'Ау), то все корни (2) и компоненты характеристи ческих векторов будут вещественными. Если все эти корни различ ны, то характеристические векторы ортогональны. Если m корней совпадают и равны, скажем, к, то при этом существует пг линейно независимых решений уравнения (А — AJ) v = 0. Каждое такое множество может служить совокупностью характеристических век торов, соответствующих m-кратному корню к. Удобно выбирать это множество таким образом, чтобы входящие в него векторы были взаимно ортогональны. При этом они необходимо будут ортогональ ны и остальным характеристическим векторам. Если каждый ха рактеристический вектор нормировать так, чтобы сумма квадратов его компонент равнялась 1, то получим соотношения
(3) |
vsv, = |
6S/, |
s, t = 1..........T, |
|
где 6ss = 1 и |
8S< = 0 при s Ф |
t. |
||
Положим |
|
|
|
|
|
-kt |
0 |
. |
0 - |
(4) |
о |
к |
. |
0 |
A = |
|
|
V = (Vi, ... , Vr). |
|
|
0 |
0 |
... |
kf |
Тогда (1) и (3) можно записать соответственно в виде |
||||
(5) |
|
|
AV = VA, |
|
(6) |
|
|
V'V = I. |
.Если умножить обе части (5) слева на матрицу V', то придем к соот ношению
(7) |
V'AV = А. |
Иными словами, ортогональная матрица V диагонализирует сим метрическую матрицу А. При этом квадратичная форма у'Ау приво дится с помощью преобразования у = V x к диагональному виду х'Ах. Мы используем эти преобразования для того, чтобы упростить задачу отыскания распределений квадратичных форм и сериальных коэффициентов корреляции.
312 |
СЕРИАЛЬНАЯ КОРРЕЛЯЦИЯ |
Гл. 6. |
Определим, далее, |
|
|
(15) |
А/ = *4- [В' + (В')7] = 4 (В/ + В_/)’ |
1< Т Т- |
Эта матрица имеет элементы, равные 1/2, на диагоналях, распо ложенных соответственно на / единиц выше и ниже главной диаго
нали. Последние соответствуют квадратичной форме 2 */*//<-/> стоя‘
щей в показателе экспоненты плотности стационарного гауссовского процесса, имеющего порядок не ниже, чем /. Кроме того, матрица А; имеет элементы, равные 1/2, на диагоналях, расположенных соот ветственно на Г — / единиц выше и ниже главной диагонали. Вообще
(16) А?'= |
[В + В-1]2' = |
|
|
В2' + 2гВ2г~ 2 + |
2г |
|
в 2' - 4 + |
... 4 - 2гВ~(2г‘~2) 4- в-2'
= (4 - Г |
А2г 4- 2ГАо/-—2~\~ |
Ч |
- . |
М |
О |
|
|
|
|||||
(17) А: + | = Ш |
Агг+1 + |
(2г + 1) А2г_1 + |
• • • |
+ |
|
|
так что Aj можно записать в виде полинома от Ах: |
|
|
||||
|
2А2 - |
I, |
|
|
|
|
|
А3 = 4Aj |
3Aj, |
|
|
|
|
(18)А4 = 8Ai — 8А? 4 - 1,
|
|
|
А5 = |
16А? — 20А? 4- 5Alt |
|
|
|
|
|
||||
|
|
|
A. = |
32A? 48Ai -f 18A? — 1. |
|
|
|
||||||
|
Т е о р е м а |
6.5.2. Характеристические корни матрицы |
А4 равны |
||||||||||
/ 1 л\ |
л |
, |
|
2я |
|
2я |
|
4я |
. cos- |
4я |
|
|
|
( 1 9 ) |
C O S 0 = |
1, |
COS —7=r~ > cos |
|
> cos—— |
|
|
|
|||||
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
|
|
C O S |
я (Г — 1) |
|
|
я (Г — 1) |
|
если T нечетное, |
|||
|
|
|
|
- у — —» cos |
|
|
|
||||||
(20) cos 0 = |
1, |
cos |
2 JX |
COS ■ |
2Jl |
|
4n |
|
|
4я |
|
|
|
|
|
cos —■=— » cos |
|
|
|
||||||||
|
Л ( Г — 2) |
|
Я (Г —2) |
|
|
— |
, |
|
т |
четное. |
|||
|
cos----- -— —. cos— - у — —> cos я = |
1, еслц |
Т |