Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Многомерная математическая статистика)

..pdf
Скачиваний:
9
Добавлен:
12.11.2023
Размер:
11.62 Mб
Скачать

тренда для первых и последних m значений ряда. На графике (рис. 6.18) заметно отсутствие значений в начале и конце.

Метод медианного сглаживания. При наличии редких выбросов удобнее применять метод медианного сглаживания, в котором на «скользящем» интервале для получения сглаженного значения используется не среднее значение, а медиана (рис. 6.19) [32]. Необходимо иметь в виду что графики, полученные методом скользящего среднего и методом медианного сглаживания, отличаются (рис. 6.20). Их отличие возрастает при увеличении частоты возникновения аномальных выбросов. Если выбросы возникают в изучаемой временной зависимости достаточно часто, то они могут рассматриваться как неотъемлемая характеристика колебательной составляющей, и их устранение при сглаживании будет искажать адекватное описание случайного ряда [15; 80].

Рис. 6.19. Графики сглаживания скользящей медианой по трем и пяти точкам

Экспоненциальное сглаживание. Экспоненциальное сгла-

живание также даёт возможность получить сглаженную линию тренда, но в отличие от метода скользящих средних ещё и может быть использован для краткосрочных прогнозов будущей

211

тенденции на один период вперёд. Именно поэтому метод обладает некоторым преимуществом перед ранее рассмотренными. Название метода связано с тем, что при его применении получаются экспоненциально взвешенные скользящие средние по всему временному ряду, т.е. сглаженное значение в любой точке ряда является некоторой функцией всех предшествующих наблюдаемых значений.

Рис. 6.20. Совмещённые графики результатов сглаживания скользящей средней и скользящей медианой

При экспоненциальном сглаживании учитываются все предшествующие наблюдения. Кроме того, экспоненциальное сглаживание не зависит от последующих значений. При этом ближнее предыдущее значение учитывается с максимальным весом, предшествующее ему – с несколько меньшим, самое «старое» наблюдение влияет на результат с минимальным статистическим весом [80]:

yвi = α·yi +(1 – α)·yв(i – 1),

где yвi, yв(i – 1) – вычисляемое значение в текущей (i) точке и вычисленное ранее в предыдущей точке ряда (i – 1) ряда; α зада-

212

ваемый коэффициент сглаживания, постоянный по всему ряду, 0 < α < 1; yi – наблюдаемое значение в текущей точке ряда.

Выбор коэффициента сглаживания α в значительной степени влияет на результаты. Чем он ближе к единицы, тем больше вес последних значений и тем меньше вес предыдущих. Если α = 1, то предыдущие наблюдения полностью игнорируются, и тем менее будет расхождение между сглаженным рядом и исходным. Если α = 0, то игнорируются текущие наблюдения, тем в большей степени подавляются случайные колебания ряда и отчетливее вырисовывается его тенденция. Значения α между нулем и единицей дают промежуточные результаты. К сожалению, объективного правила при его выборе не существует.

Понятно, что в первой точке ряда нет сглаженного значения для предшествующей точки (нет самой такой точки) и сглаженным значением yв1 считается сама наблюдаемая в этой точке величина отклика y1. Результаты экспоненциального сглаживания могут быть использованы и для краткосрочных прогнозов на один шаг вперёд по временной шкале (рис. 6.21).

Рис. 6.21. Графики экспоненциального сглаживания временных рядов с разными коэффициентами сглаживания

213

Фильтрация временного ряда методом 4253H. Фильтра-

ция временного ряда методом 4253H, используемая в программе Statistica, включает несколько последовательных преобразований:

1)четырехточечная скользящая медиана;

2)пятиточечная скользящая медиана;

3)трехточечная скользящая медиана;

4)трехточечное взвешенное скользящее среднее с весами

(0,25; 0,5; 0,25);

5)вычисляются остатки вычитанием преобразованного ряда из исходного ряда;

6)шаги 1–4 повторяются для остатков;

7)преобразованные остатки добавляются к преобразованному ряду.

Результат фильтрации временного ряда методом 4253H представлен на рис. 6.22.

Рис. 6.22. График фильтрации исходного временного ряда методом 4253H

214

Разработчики программного модуля «Временные ряды» считают, что такая совокупность методов фильтрации дает сглаженный ряд, сохраняя основные характеристики исходного ряда.

Сравнение исходных и сглаженных графиков даёт основание предположить, что лучшие результаты получаются при равномерных колебаниях значений ряда, в которых не меняются условия протекания случайного процесса. Таким условиям в большей степени отвечают стационарные случайные процессы.

Обработка сезонных колебаний временного ряда. Если под сглаживанием временного ряда понималось получение оценки Tt St, то под фильтрацией компонент понимается процесс получения оценок Tt, St и et [32].

Простейший приемом выделения периодической компоненты основан на использовании сглаживания временного ряда по методу простой скользящей средней. Предварительно следует определиться с видом модели временного ряда – аддитивной или мультипликативной. Это можно сделать на основе анализа графика временного ряда. Если амплитуда периодических колебаний примерно постоянна, то следует выбрать аддитивную модель Y = T + S + E, в которой амплитуда колебаний периодической компоненты предполагается постоянной, не зависящей от времени [32]. Если амплитуда периодических колебаний возрастает или убывает с ростом уровней ряда, то следует выбрать мультипликативную модель временного ряда Y = T · S · E.

Выравнивание исходного ряда методом скользящей средней можно выполнить в следующем порядке:

1.Уровни ряда суммируются последовательно за каждые четыре квартала со сдвигом на один момент времени.

2.Итог за четыре квартала делится на четыре, и получаются скользящие средние, которые не содержат сезонной компоненты.

3.Полученные значения приводятся к текущему моменту времени, для чего находится среднее значение из двух последовательных скользящих средних – центрированные скользящие средние [32].

215

Выделение периодической компоненты основывается на том, что если исходный временной ряд содержит периодическую компоненту с периодом g, то сглаженный по методу простой скользящей средней временной ряд с интервалом сглаживания g такой компоненты уже не содержит. Периодическая составляющая в случае аддитивной модели выделяется путем нахождения разности между соответствующими уровнями исходного и сглаженного ряда. В случае мультипликативной модели периодическая компонента выделяется путем нахождения отношения между соответствующими уровнями исходного и сглаженного ряда. Затем вычисляются средние значения, соответствующие наблюдениям внутри одного периода колебаний [32].

Моделирование сезонных колебаний с помощью гармони-

ческого анализа. Согласно канонам гармонического анализа, временной ряд может быть представлен как совокупность гармонических колебательных процессов. В литературе можно найти информацию и про другие методы обработки [10; 16; 19; 32; 43; 62; 66].

6.2.5.Модели временных рядов

6.2.5.1.Модели авторегрессии

На графиках автокорреляционной функции (рис. 6.11) показаны величины корреляции между значениями временного ряда. Так, на первом лаге (между предыдущими и последующими наблюдениями) корреляция невелика r1 = – 0,29. На втором лаге она уже значима и составляет r2 = – 0,699. Практически нет зависимости и на третьем лаге r3 = – 0,16. На четвёртом лаге корреляция меняет знак и опять становится значимой, r4 = + 0,645. Чередование корреляции в дальнейшем повторяется с небольшим уменьшением величины корреляции. Такое свойство именуется автокорреляцией, его присутствие позволяет использовать предыдущие значения для прогнозирования на последующих шагах (лагах). Основная идея прогноза – выражение следующих значений ряда через предыдущие. Это наиболее распространенный подход, используемый в ситуациях, когда

216

никакой другой информации о системе, кроме заключенной в предыдущих значениях ряда, нет [10; 43].

Таким образом, модели авторегрессии (AR) – это класс моделей временных рядов, в которых текущее значение моделируемой переменной задается функцией от прошлых значений самой этой переменной.

Простейшая модель автокоррелированного стационарного ряда, которая часто используется на практике, имеет вид [32]:

yt yt – 1 t,

где ε – случайная величина с нулевым средним, величины i и j некоррелированы между собой при i j; α – коэффициент регрессии.

Такая модель называется моделью авторегрессии первого порядка (AR(1)). Модель авторегрессии второго порядка (AR(2)) записывается в виде

yt 1yt – 1 2yt – 2 + t.

В уравнении сохраняются сделанные ранее предположения. В общем виде модель авторегрессии порядка р (AR(p)) описывается уравнением [32]:

yt 1·yt – 1 2·yt – 2 +...+ p·yt – p + t.

Решение модели авторегрессии существует, если матрица корреляций невырождена8. Задача оценивания параметров авторегрессии, по существу, аналогична оцениванию параметров множественной линейной регрессии по методу наименьших квадратов, а значит, свойства оценок будут аналогичны: несмещенность, состоятельность, эффективность. Для того чтобы адекватно установить порядок авторегрессионной зависимости, необходим предварительный анализ характеристик процесса частных автокорреляций [32].

8 Невырожденная матрица (иначе, неособенная матрица) – квадратная матрица, определитель которой отличен от нуля.

217

Часто, для упрощения представления модели авторегрессии, вводят так называемые лаговый оператор функцию, согласно которой

В p yt yt p .

Само содержание оператора совершенно неважно, просто записывать модель авторегрессии высокого порядка с ним значительно легче. Например, модель авторегрессии порядка р (AR(p)) в общем виде с помощью лаговых операторов разных порядков может быть переписана в другой форме [63]:

yt c a1 B yt a2 B2 yt ... ap B p yt t .

Окончательный подбор порядка модели AR(p) процесса связан со статистической значимостью полученных коэффициентов модели и детальным изучением поведения остатков, получаемых вычитанием из исходного ряда y значений подобран-

ной AR(p)-модели yˆi . Если полученные остатки модели ведут

себя как белый шум, то процесс подбора модели можно считать завершенным. В противном случае следует изменить порядок подбираемой модели или перейти к более сложным комбинированным моделям авторегрессии – скользящего среднего.

В модели первого порядка AR(1) прогноз на один шаг ра-

вен [32]: yˆi 1 yt .

Прогноз на два шага: yˆi 2 yˆt 1 2 yt .

В общем случае прогнозировать на τ шагов можно по вы-

ражению yˆi yt .

В модели второго порядка AR(2) текущее значение зависит от двух предыдущих, поэтому прогноз на один шаг будет

равен [32]: yˆi 1 1 yt 2 yt 1.

Прогноз

на

два

шага

записывается

так:

yˆi 2 1 yˆt 1 2 yt .

Прогноз на τ шагов получается по следующей рекуррентной формуле: yˆi 1 yˆt 1 2 yˆt 2 .

218

В общем виде для AR(p) можно записать выражение для прогноза на τ шагов [32]:

yˆi 1 yˆt 1 2 yˆt 2 ... p yˆt p .

6.2.5.2. Модели скользящего среднего в прогнозировании

Модели скользящей средней в прогнозировании – это класс моделей временных рядов, в которых моделируемая величина задается функцией от прошлых ошибок. Модель скользящего среднего первого порядка (MA(1)) записывается в виде [32]

yt t t 1.

Соответственно оценивание параметра β сводится к реше-

нию квадратного уравнения [32]: 2

1

1 0 ,

 

 

j

где j – автокорреляционная функция процесса первого порядка.

Данное уравнение имеет два корня (j = 1 и j = 2), причем, согласно теореме Виета, произведение этих корней равно единице. В качестве оценки параметра β следует взять корень данного уравнения, по модулю меньший, чем единица. Это связано с условиями стационарности процесса.

Уравнение модели скользящего среднего второго порядка (MA(2)) записывается в виде [70]: yt t 1 t 1 2 t 2 .

Модель скользящего среднего порядка q (MA(q)) в общем виде записывается следующим образом: yt t 1 t 1

2 t 2 ... q t q .

Таким образом, автокорреляции процесса скользящего среднего порядка q эквивалентны нулю для всех j > q. Данный факт учитывается при подборе порядка модели по наблюдаемым данным. Общая схема построения оценок параметров аналогична той, которая применялась при оценивании моделей авторегрессии, и складывается из следующих шагов [32]:

1. По наблюдениям вычисляем выборочные оценки ˆ j автокорреляций процесса для всех j 1,2, ... , q.

219

2. Составляем систему q уравнений относительно неизвестных параметров β, в которой вместо теоретических значений автокорреляций стоят их оценки (вычисленные значения) ˆ j .

3. Решаем полученную систему уравнений относительно неизвестных параметров и получаем их оценки.

В модели MA(q) прогноз возможен лишь максимум на q шагов вперед. При прогнозировании в модели MA(q) по конечному числу наблюдений формула прогнозного значения при произвольном значении q является очень сложной. Однако для случая q = 1 можно пользоваться точной формулой для прогноза на один шаг вперед [32]:

n

j 1 2(n j 1) yt j

y

 

j 1

.

1 2n 2

ˆt 1

6.2.5.3. Авторегрессионные модели скользящего среднего

Задачи об экстраполяции, интерполяции и сглаживании, рассмотренные в этом и следующих разделах, можно рассматривать как единую задачу определения истинного значения реализации yt (t) при некотором значении аргумента Qt .

Более полное и точное название моделей, рассмотренных в данном разделе, – модели авторегрессии со скользящим средним (ARMA) в качестве ошибок. Данные модели являются естественным обобщением моделей авторегрессии и скользящего среднего. Модель авторегрессии – скользящего среднего порядков р и q (где р – порядок модели авторегрессии; q – порядок скользящего среднего), записывается как (ARMA(p, q)), имеет вид [32]:

yt 1 yt 1 2 yt 2

... p

yt p

 

.

t 1 t 1 2 t 2

... q

t q

 

 

 

Отметим основные принципиальные моменты, касающиеся анализа и оценивания подобных моделей:

220

Соседние файлы в папке книги