Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ временных рядов

..pdf
Скачиваний:
2
Добавлен:
19.11.2023
Размер:
47.02 Mб
Скачать

Глава 3

ТРЕНДЫ И СГЛАЖИВАНИЕ

3.1. ВВЕДЕНИЕ

Мы будем изучать так называемые модели ошибок, в которых наблюдаемые временные ряды интерпретируются как сумма систе матических составляющих, или тренда, и случайных составляющих, или ошибки. В этой главе мы рассмотрим модели, в которых подле­ жащий изучению тренд с течением времени гладко возрастает или убывает, но не повторяется регулярным образом. В следующей главе будут рассмотрены периодические тренды, поведение которых приблизительно одинаково на различных участках оси времени. Предполагается, что случайные составляющие имеют в каждый момент времени одинаковые дисперсии и некоррелированы. Они мо­ гут представлять собой ошибки наблюдения или нерегулярности ино го рода. Предположения о равенстве дисперсий и отсутствии корре­ ляции являются определенным приближением к действительному положению вещей. В гл. 10 мы рассмотрим трудности, возникающие в тех случаях, когда эти предположения не выполняются. Иногда наблюдения лучше соответствуют условиям равенства дисперсий и аддитивности ошибки, если преобразовать масштаб измерений изучаемой величины. Например, в ряде экономических исследова­ ний производится анализ не самих цен, а их логарифмов. Некото­ рые линейные комбинации значений переменной в последователь­ ные моменты времени могут быть коррелированы в значительно меньшей степени, по сравнению со значениями самой переменной. Если коэффициенты такой линейной комбинации (например, ко­ нечной разности) известны, то ее можно использовать в качестве объекта изучения.

В ряде случаев исследуемый тренд является известной функцией времени или других наблюдаемых величин и некоторых (возможно неизвестных) параметров. Если эта функция зависит от параметров линейно, то имеем обычную регрессию, о которой упоминалось в

44

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

гл. 2. Однако некоторые функции времени, как, например,

кривые

роста, не линейны по параметрам. В таких случаях оценка пара­ метров и проверка гипотез о значениях этих параметров являются далеко не простыми задачами. Мы кратко рассмотрим их в § 3.5.

В другой категории случаев тренд является функцией времени или каких-то иных величин, которая не известна, но может быть адекватно представлена в виде линейной комбинации известных функций времени. Периодический тренд может быть представлен в виде линейной комбинации тригонометрических составляющих (т. е. в виде конечного отрезка ряда Фурье). Статистические аспек­ ты этого приближения рассматриваются в гл. 4. Если тренд флукту­ ирует, явно смещаясь в сторону возрастания или в сторону убыва­ ния, то такой тренд часто можно хорошо приблизить полиномами. Исследование подобного случая производится в § 3.2.

Иногда тренд является неизвестной функцией времени, вид ко­ торой настолько меняется за большой промежуток времени, что она не может быть приближена полиномом низкой степени или корот­ ким отрезком ряда Фурье. Методы, использующие свойство «глад­ кости», изучаются в § 3.3 и 3.4. Эти методы являются непараметри­ ческими.

3.2. ПОЛИНОМИАЛЬНЫЕ ТРЕНДЫ

3.2.1. Ортогональные полиномы

Встречающиеся во многих исследованиях временные ряды наряду с флуктуациями и нерегулярностями имеют некоторую общую тенденцию изменения. Например, многие временные ряды в экономике являются, в первом приближении, возрастающими. Такого рода общую тенденцию мы будем называть трендом. Во многих случаях желательно сделать выводы о тренде на основании самого наблюдаемого временного ряда, хотя при этом может быть известно, что тренд возникает в силу действия каких-то иных факто­ ров. Так, рост временного ряда в экономике может быть обуслов­ лен ростом численности населения. В ряде случаев, когда теория не может указать явный вид тренда как функции времени, тем не менее бывает возможно приблизить тренд полиномом от t достаточно низ­ кой степени. В простейшем нетривиальном случае равномерного возрастания или убывания значений ряда адекватное представ­ ление тренда может дать полином первой степени, т. е. линейная фуцкция.

Полиномиальный тренд есть в первую очередь средство описания. Он содержит в сжатой форме общие характеристики ряда. Для ис­ пользования тренда в этом качестве полином должен иметь доста­ точно низкую степень. Во многих случаях коэффициентам полинома

3.2. ПОЛИНОМИАЛЬНЫЕ ТРЕНДЫ 45

нельзя придать никакого реального смысла. Такой полином служит заменой гораздо более сложной (но неизвестной) функции времени. Подобранный полином обычно может быть использован для интер­ поляции, однако использовать его для экстраполяции следует с осторожностью, поскольку вопрос о качестве приближения рассмат­ риваемого тренда данным полиномом не может быть решен исходя лишь из наблюденных значений.

В некоторых случаях первостепенный интерес представляют ко­ роткие по времени периоды, флуктуации и нерегулярности. В та­ ких случаях тренд желательно выделить, с тем чтобы получить ба­ зу, от которой можно было бы измерять быстрые изменения наблю­ даемого ряда.

Наша основная модель ошибок состоит в том, что наблюдаемая величина yt представлена в виде суммы временного тренда f (t) и

(ненаблюдаемой) ошибки щ\ т. е. yt =

f {t) +

uv

где все щ некор-

релированы, имеют средние значения

= О

и

дисперсии %и\ =

=

а2. В этом параграфе мы предполагаем, что тренд является поли­

номом степени q

 

(1)

/ (t) = ОС0-f- CLxt +

+ &qtq.

Полином первой степени отражает равномерное во времени возра­ стание или убывание значений ряда. Полином второй степени может выражать тенденцию возрастания и последующего убывания значе­ ний ряда или наоборот, и т. д. Обычно q будет мало по сравнению с Т. В данной модели может быть использована обычная техника ре­ грессионного анализа.

Как отмечалось в гл. 2, мы можем перейти от независимых пере­ менных, в данном случае 1, /, ..., f , к ортогональным независимым переменным фот (/), ..., удт(/). Поскольку полиномы будут исполь­ зоваться очень часто, имеет смысл ортогонализировать их заранее; тогда все последующие вычисления упрощаются. Степени перемен­ ной t — натуральные числа. Почти во всех случаях в регрессион­ ной формуле вместе с некоторой степенью переменной t присутству­ ют и все более низкие ее степени.

Пусть ортогональный полином степени k записан в виде

(2)

<р*г(О = tk + С*_, (k, T )tk- ' + ...

+ C 0 (k, T),

 

 

 

 

k = \ ......... 7 - 1 ,

и фог (/) =

1.

Поскольку (pki

(0 по предположению ортогонален

Фог (0. .... фй-i.r (0, или»что эквивалентно, ортогонален 1, /,

мы должны иметь

 

 

(3)

 

г

 

k 1,

2

Ф^г ( 0 t = 0 ,

i — 0 , 1, . . . ,

46 греНд ы и с гл а ж и в а н и е Гл. 3.

(4)

С0(k,

T ) ^ t l + Сх(k, Т) 2

/ж +

• • •

 

 

 

 

t=\

м

 

 

 

 

 

 

. . . +

С*_, (k, t) S ti+k~'

= -

i

ti+k, i = о, 1..........f t -

1.

 

 

<=i

 

<=i

 

 

 

 

Эти

уравнения представляют

собой

частный случай

уравнений

(16)

§ 2.3 (с очевидными изменениями

в

обозначениях).

При

k <.

< Т — 1 коэффициенты С0 (k, Т ),..., Ck-\ (k, Т) определяются одноз­ начным образом из системы (4). Например,

Фот = ^>

(5)Ф1Г = *-----Tl (T + 1),

<р2Г = <• - ( Г + 1) / + + 1)(Г + 2)/6.

Мы определили ортогональные полиномы таким образом, что их главные члены есть просто высшие степени переменной t. Без по­ тери свойства ортогональности

(6 )

g

Ф(Т( 0 ФЙГ(0 == О,

i=£k,

i ,

ft = 0, 1, . . . ,

Т — 1,

каждый

ф*г (f) можно умножать на константу. Множество ф0г (/), ...

.... фг_1( 0

в целом

задает

невырожденное

линейное

преобра­

зование

переменных 1 ,

t.......

tT~l

(максимального числа

линейно

независимых полиномов для t — 1,

..., Т).

 

 

 

 

 

С использованием ортогональных полиномов тренд (1) записы­

вается следующим

образом:

 

 

 

 

 

 

 

(7)

 

f

(0 =

То + Yi<Pir (0 +

• • • +

M V

(0-

 

 

При этом

 

 

 

 

 

 

 

 

 

 

 

(8 )

ak — yh -f

Ck(k +

1,

T)yk+]+

 

+

Ck (q,

T) yq,

 

 

 

 

 

 

 

 

 

 

 

 

k = 0 , 1, . .. , q.

Оценками коэффициентов

в представлении (7)

по

наблюдениям

Ух.......Ут являются величины

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

(9)

 

 

 

2

У№кт (0

 

ft —о, 1.........q.

 

 

 

 

 

 

 

 

 

 

 

2 < & < 9

3 .2 .

ПОЛИНОМИАЛЬНЫЕ ТРЕНДЫ

47

Несмещенной оценкой дисперсии служит

т

2 (л — со — сгф17-(0— •• — <VP?T(0P

(Ю)

т

Г - 9 - 1

 

т

фIT (0

4>1т

 

2

 

<=1

 

<=1

 

Г

- 9 - 1

 

Вычисления по формулам (9) и (10) обычно выполняются на клавишной вычислительной машине с помощью таблиц ортогональ­ ных полиномов. У Фишера и Иэйтса (1963) последние даны (табл. 23) для степеней до пяти включительно и для Т = 3, ..., 52, а у Андер­ сона и Хаузмана (1942) до значения Т = 104. Для данного значе­ ния Т (обозначаемого у Фишера и Иэйтса через п) табулированы ве­ личины

(И)

 

~ ^Р/кг (0 »

 

 

 

где \

— наименьшее рациональное число, для которого величины

%k(pkT (0 — целые

числа. (Следует заметить,

что

коэффициенты

С0 (к,

Т) , ..., Ck- 1 (k, Т) в выражении (4) — целые, а следовательно,

и рациональные числа.) Для примера рассмотрим

фц (/) = t

-+- 1)/2. Если

Т нечетное, то <pir (/) целое и Я.х =

1; если же

Т

четное, то фц- (t) равно целому плюс 1/2 и =

2. В конце каждой

колонки таблиц даны

значения21

 

(12)

2 ( Ы 2 = ^ 2 ф1 г ( 0

 

г=1

*=1

и Xk. Цель использования полиномов с целочисленными коэффи­ циентами состоит в том, чтобы не вносить ошибок округления при вычислениях в (9), вплоть до выполнения деления. Вычисления ^табулированными величинами дают значения ск/Хк, т. е. оценки от­

ношений yk/Xk (являющихся коэффициентами при {■**). Числовые примеры приведены в конце этого параграфа.

В случае применения быстродействующих вычислительных ма­ шин пользоваться указанными таблицами нет необходимости. Как отмечалось в гл. 2 , подбираемая регрессия будет одной и той же и для степеней переменной t и для ортогональных полиномов той же степени, причем одинаковыми будут и коэффициенты при высшей степени. Всякий метод накопления ведущих элементов дает и коэф­ фициенты при ортогональных полиномах и коэффициенты при степе­ нях переменной t. Коэффициенты ортогональных полиномов (нор­ мированные делением на корни квадратные из сумм квадратов ор­ тогональных полиномов) легко интерпретировать как показатели вклада, вносимого в регрессию соответствующей степенью, без уче­ та вклада, вносимого в регрессию членами более низкого порядка.

48

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

3.2.2. Определение степени полиномиального тренда

Из теории наименьших квадратов известно, что ск является несмещенной оценкой для укУ a s*2 — несмещенной оценкой для о2. Дисперсия оценки ск равна

(13)

8 (с * -ъ )* = - г ^ ------

.

2 фM-W

а сами величины ск некоррелированы. Будем предполагать, что уг нормально распределены. При этом с0, с19 ..., cq независимы и нор­ мально распределены, а отношение q — 1) s2/a2 имеет распре­ деление %2с Т q — 1 степенями свободы и не зависит от с0, cl9 ...

...,с<7, так что можно использовать обычные критерии и доверительные интервалы. Например, при проверке гипотезы Я: yq = 0 против альтернативы yq Ф 0 с уровнем значимости 8 нулевая гипотеза от­ вергается, если

(И)

1 Ч .1.Г Д««

>

tT^ - i (г),

где

 

т

 

 

 

 

(15)

ап = 2

Ф*7 (0,

а tT- q-

 

t= 1

1 (б) — двусторонняя

1 0 0 е-процентная точка !> ^-распреде­

ления с Т q — 1 степенями свободы. Нулевая гипотеза здесь со­ стоит в том, что полином, о котором известно, что его степень не больше q9на самом деле имеет степень меньшую, чем q. Указанный критерий для проверки гипотезы Я: yQ= 0 в предположении нор­ мальности является наилучшим при уровне значимости 8 в сле­ дующем смысле. Он является: (а) равномерно наиболее мощным не­ смещенным критерием; (б) равномерно наиболее мощным инвари­ антным критерием (инвариантным относительно преобразования

изменения масштаба ct kci9 i = 0 , 1 , ..., q9s2

k2s2, и сдвигов 2>

°i + ai9 i = 0 , 1 , ..., q 1); (в) равномерно

наиболее мощным

критерием, имеющим мощность, зависящую только от y2q!o2\ (г) рав­ номерно наиболее мощным симметричным (относительно cq) подобным критерием; (д) равномерно наиболее мощным подобным критерием с мощностью, зависящей только от | yq \ (т. е. не зависящей от знака уд). [См. Леман (1959, гл. 5, разд. 2) и упр. 11 из гл. 6)1.

То есть в

пределах от

j е до

tT__q__j е заключено

100(1—8)

процентов распределения.— Прим, перев.

 

 

 

2) Указанное

изменение

масштаба

равносильно

преобразованию

yt -> kyt,

t — \ У ...» Г, а совокупность

преобразования

сдвига

эквивалентна аддитивному

наложению на последовательность {yt}

полинома степени q— 1.

 

3.2.

ПОЛИНОМИАЛЬНЫЕ ТРЕНДЫ

49

Часто исследователь не знает заранее, какой степени полином следует подбирать. Поэтому он не просто интересуется тем, являет­ ся ли степень полинома величиной, не превосходящей некоторого натурального числа q, а стремится выбрать подходящую степень по­ линома среди некоторого множества возможных степеней. При этом определенные преимущества имеет выбор полинома более низкой степени. График его более гладкий, проще допускаемое толкование, более экономична запись функции. Однако если среднее значение наблюдаемой переменной плохо описывается полиномом низкой сте­ пени, то исследователь может оказаться вынужденным использо­ вать полином более высокой степени. (В терминах статистики недостатком выбора слишком низкой степени является наличие смещения при оценивании тренда, а недостатком выбора слишком вы­ сокой степени — большая вариабельность при оценивании тренда.) Будем предполагать, что существует некоторое число т (возможно, что т = 0 ), которое является минимально возможной степенью полинома, и что степень полинома не может превосходить некото­ рого <7, допуская при этом, что исследователь имеет какую-то апри­ орную информацию подобного рода.

Таким образом, исследователь сталкивается с задачей со мно­ гими решениями. Именно, он должен решить, равна ли степень поли­ нома m, т + 1, ..., q — 1 или q. Мы формализуем эту задачу, счи­ тая, что необходимо решить, к какому из следующих непересекающихся множеств принадлежит параметрическая точка (ут+ь •••

Те):

Hq' Уд^

Hq—h Уц —0 , Уч-i Ф

(16)

Я/n-fi: yq =

f i

II £

• • ' = Ym+ 2 = 0, Ут+\ 0,

• = Ym+1 = 0.

Принадлежность параметрической точки множеству Я,- означает, что полином имеет степень i. Альтернативная постановка задачи со­ стоит в том, что необходимо решить, какие из следующих нулевых гипотез верны (и верна ли хотя бы одна из них):

 

Н}.

Уд =

0 ,

 

(17)

н ' ч. ч -й

Уч =

Уч- i =

0.

 

Щ,ч-П • • • . т+1- Уч =

Т?-1 —

* • • = Ут+1 — о.

Если некоторая гипотеза из (17) верна, то предшествующие ей ги­ потезы также должны быть верны. Если же она неверна, то неверны

50

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

Рис. 3 .1 .

Семейства множеств в задаче с несколькими решениями.

и все последующие гипотезы. Таким образом, H*q,q- \....m+i С ...

... а Н*„. Семейства множеств (16) и (17) связаны соотношениями

 

я„ = я ?_1 и . .. и нт,

(18)

я ;,_ ,

=

я ?_ 2и ...\} Н т,

 

я ;,_ ,...... .+ 1

=

н т .

(См. рис. 3.1.)

Предположим, что исследователь намеревается ограничить ве­ роятности ошибок, связанных .с принятием решений о том, что коэффициенты отличны от нуля, в то время как на самом деле они равны нулю. Иными словами, ограничить вероятности ошибок, связанных с выбором степени полинома более высокой, чем это не­ обходимо. При заданных значениях этих вероятностей он стремится минимизировать вероятности принятия решений о том, что коэф­ фициенты равны нулю, в то время как на самом деле они отличны от нуля, т. е. минимизировать вероятности выбора степени полино­ ма, меньшей чем требуемая. Мы предполагаем, что исследователь приписывает каждой из нулевых гипотез определенный уровень зна­ чимости:

3,2. ПОЛИНОМИАЛЬНЫЕ ТРЕНДЫ 51

pq=

Рг (отвергнуть

H 'q \ //'},

 

P q + p q - 1 =

Р г {отв ер гн уть

U 'q,q- \ \

1},

(19)i

Pq + • • •

+ рт+ 1 = Рг {отвергнуть

Я’>?_ ь . ,от+, |

т+)} =

 

=

Рг {отвергнуть

Нт \ H J,

 

где pt >

0 и pq + ...

+ рт+ 1 < 1- Поскольку каждая

нулевая ги­

потеза включает в себя последующую (т. е. каждая последующая нулевая гипотеза является более сильной), то последовательность вероятностей отклонения в правых частях (19) берется монотонно неубывающей (т. е. вероятность отклонения более сильной нулевой гипотезы, когда она верна, не меньше, чем аналогичная вероятность для менее сильной гипотезы). Используя семейство попарно непересекающихся множеств //,, запишем указанное разнесение гипо­ тез по уровням значимости в виде

 

P q =

РГ (ПРИНЯТЬ

H q |

U . . . U Нт)>

(2 0 )

р„ - 1 =

Рг {принять

Я,_, I Hq2 U • • • U Нт),

 

Рт+ 1 =

РГ {ПРИНЯТЬ

Нт+1 | Нт).

Пусть рт = 1 p q — ... — рт + 1 = Рг {принять Нт | Нт }. Посредством соотношений (2 0 ) исследователь приписывает определен­ ные значения вероятностям принятия решений об использовании полинома степени i, когда на самом деле степень полинома меньше i (для каждого i).

Нерандомизированная статистическая процедура для этой зада­

чи со многими решениями состоит

в следующем.

Имеется

набор

q т + 1 областей, которые мы

обозначим Rm,

/?m+i,

Rqy

попарно непересекающихся и составляющих полную группу в про­

странстве значений с0Усъ ...,

сд и S

= —- q 1) s2 (или в исход­

ном пространстве у1у ..., ут).

Если

выборочная точка^попадает в

Riy то принимается гипотеза Ht. Приписывание уровней значимости приводит к тому, что эти области становятся «подобными» в том смыс­

ле, что при

= ... = yq = 0 вероятности попадания выборочной

точки

в Riy ...,

Rq равны соответственно р1У ..., рц (независимо от

Yo> Yi>

Tt-i и а2)- Другими словами, если степень полинома мень­

ше iyто вероятность ошибки от приписывания ему степени i не зави­ сит от того, какова его истинная (меньшая чем i) степень.

Во многих случаях исследователь стремится определить только, равен ли некоторый коэффициент нулю или отличен от нуля. При этом его не интересует знак коэффициента. Естественно в таком случае требовать, чтобы вероятности, связанные с указанной про­

52 ТРЕНДЫ И СГЛАЖИВАНИЕ Гл. 3.

цедурой, не меняли своих значений при изменении знака соответ­ ствующих коэффициентов, т. е. чтобы эти вероятности зависели от параметров только через |ym+i], ...» \yQ- (Из дальнейшего будет видно, что такое ограничение можно заменить присвоением ненулевым коэффициентам определенных знаков.)

Зафиксировав указанные ограничения, потребуем, чтобы обла­ сти Rt были наилучшими, т. е. чтобы вероятности попадания в Rt при условии, что верна гипотеза Hit i == т + 1, ..., q, были мак­ симально возможными. Следует отметить, что мы хотим одновремен­ но максимизировать вероятности попадания в q т различных областей (каждую для всех отличных от нуля значений соответству­ ющего параметра). Далее будет показано, что при указанных выше условиях при подборе одной области с целью максимизации веро­ ятности попадания в эту область не имеет значения то, как выбира­ ются остальные области. Этот факт позволяет оптимизировать об­ ласти Rq одновременно. Следует только подчеркнуть, что возможность этого основана на предположении о нормальности

Уъ .... Ут-

Как было отмечено выше, критерий с областью отклонения (14) является оптимальным для проверки гипотезы Я: уя = 0, обозна­

чаемой нами через Н*я и являющейся дополнительной к Ня. Отсюда следует, что наилучшая область Rq определяется соотношением

(14)

с е = ря. Наилучшая

процедура для

проверки гипотезы Я:

yt =

0 с уровнем

значимости eit

в предположении, что yi+\ = ...

... =

уд = 0 , состоит в ее отклонении при

 

/on

 

c2iaii

 

 

^

4 —*—1 (8*)

^ 1'

Л п

I . . .

\ Л п

 

I о ^

Т i — 1 ’

 

ci+\ai+\ti-\-\

-Г cqaqqТ"^

 

где S = (Т q 1) s2 и

 

 

 

 

(2 2 )

 

аи = 2

 

Фл (О*

 

 

 

 

t=\

 

 

Заметим далее, что если Tt — подобная область размера е, для проверки гипотезы yt = 0 , т. е. если

(23)

Pr {Т, | у, =

Т<+| = •' •

= Y, =

°)

= е<

 

для всех Vo, у,,

y/-i и <х2 (>

0), то Т, выделяет.условную вероят­

ность ei на почти всех комбинациях значений с0, сь

с/_I

и с2аи ~г ...

... +

c2qaqq + S

(достаточных

статистик

для

Vo. Yi.......

V/—1 и о8

при у{ = ... = yq — 0). Иначе говоря,

 

 

 

 

 

 

(24)

Рг [Т, | с0,

съ . . . .

се-i,

с2аи +

• • •

+

cqaqq+

S;

 

 

 

 

 

 

 

Y; =

■■•

= yq = °) = 8‘

почти всюду (с вероятностью 1). Именно такой, как говорят, «нейма­ новской» структурой подобных областей и определяются оптималь­