- •1. Общие положения
- •1.1. Цель и задачи кп
- •1.2. Содержание и объём кп
- •1.3. Этапы выполнения кп
- •2. Теоретические основы методов, применяемых в кп
- •2.1. Предварительная обработка статистических данных
- •2.2. Вейвлет анализ временного ряда
- •2.3. Сингулярный спектральный анализ временного ряда
- •2.4. Методы ssa-прогнозирования
- •2.4.1. Рекуррентное ssa-прогнозирование
- •2.4.2. Векторное ssa-прогнозирование
- •2.4.3. Формирование доверительных интервалов
- •2.5. Основы аналитического подхода к оценке риска спектральными методами
- •2.5.1. Относительные меры риска
- •Спектральная плотность Fu(ω) распределения дисперсии ущерба
- •Энергетические спектры ущерба Fu(ω) и гармонического сигнала Fг
- •2.5.2. Расчет прогностической меры риска
- •Ряд прогноза y[n]
- •3. Этапы выполнения основной части кп
- •4. Пример анализа временного ряда предложенными методами
- •4.1. Статистика количества почтовых писем, классифицированных как спам
- •4.1.1. Предварительная обработка статистических данных
- •4.1.2. Вейвлет анализ временного ряда
- •4.1.3. Сингулярный спектральный анализ временного ряда
- •4.1.4. Расчет прогностической меры риска
- •Исходный ряд и ряд прогноза
- •Ряд прогноза
- •4.2. Статистика случаев мошенничества с кредитными картами
- •4.2.1. Предварительная обработка статистических данных
- •4.2.2. Вейвлет анализ временного ряда
- •4.2.3. Сингулярный спектральный анализ временного ряда
- •4.2.4. Расчет прогностической меры риска
- •Восстановленный ряд и ряд прогноза
- •Прогноз ущерба от мошеннических операций с распределенными платежными системами на 2012 год
- •Распределения вероятностей нанесения ущербов
- •5. Требования к оформлению и объему кп
- •5.1. Общие требования
- •5.2. Правила оформления текстовых документов
- •5.3. Правила нумерации страниц
- •5.4. Правила оформления иллюстраций
- •5.5. Оформление таблиц
- •5.6. Приложение
- •5.7. Типичные ошибки при выполнении кп
- •5.8. Дополнительные рекомендации по выполнению кп
- •6. Порядок оценки работы
- •Библиографический список Основная литература
- •Дополнительная литература
- •Оглавление
- •394026 Воронеж, Московский просп., 14
2.4.3. Формирование доверительных интервалов
Согласно основным предположениям для SSA-прогнозирования, аддитивная компонента ряда Fn должна управляться ЛРФ относительно небольшой размерности и при этом ряд остатков должен приближенно сильно разделяться с для некоторой дайны окна L. В частности, предполагается, что ряд — это конечный подряд бесконечного ряда F(1) который является рекуррентным продолжением ряда . Эти предположения не могут быть проигнорированы, но, к счастью, они справедливы для достаточно широкого класса практических задач.
Чтобы ввести доверительные границы для точек прогноза, мы должны еще более усилить наши предположения, причем не только по отношению к , но также и для ряда . Во-первых, будем рассматривать ряд остатков как конечный подряд некоторого бесконечного случайного (шумового) ряда F(2) который «портит» сигнал F(1). Другие предположения связаны главным образом с рядом остатков где — восстановленная компонента ряда Fn. Так как ≈ то свойства ряда сильно связаны со свойствами . Более точная формулировка дополнительных предположений зависит от решаемой задачи и применяемого метода.
В этой связи, рассмотрим следующие две задачи, связанные с построением доверительных границ для прогноза. Первая задача связана с построением доверительных интервалов для прогнозирования значения всего ряда F = F(1) + F(2) целиком в некоторый будущий момент времени N + М, Вторая задача формулируется как построение доверительных границ для прогноза значения сигнала F(1) также в некоторый будущий момент времени. Эти две задачи решаются различными способами. Первый из них использует информацию, непосредственно полученную в процессе обработки временного ряда. Этот вариант будем называть эмпирическим. Второй требует дополнительной информации о модели ряда для того, чтобы можно было выполнить бутстреп-моделирование ряда Fn.
Опишем коротко обе задачи построения доверительных границ для R-SSA-прогнозирования. Для V-прогнозирования все построения полностью аналогичны.
Предположим, что мы уже получили значение М-й точки прогноза т. е. мы уже выполнили М шагов процедуры R-SSA-прогнозирования. По определению, мы используем как прогноз будущего значения сигнала F(1). Как уже упоминалось, нашей задачей является построение доверительного интервала для (будущего) значения FN+M-1 всего ряда F.
Рассмотрим процедуру мультистартового М-шагового рекуррентного продолжения. Возьмем относительно небольшое целое М и проведем М шагов рекуррентного продолжения с помощью прогнозирующей ЛРФ, беря в качестве начальных данных скользящие отрезки восстановленного ряда длины L — 1 от до , K=N-L+1.
Значения последних точек gj+M+L-1 этих продолжений можно сравнить со значениями fj+M+L-1 исходного ряда FN. Таким образом, мы получаем ряд мультистартовых М-шаговых остатков HK-M+1 с
Если мы предположим, что восстановленный ряд совпадает с рядом , который управляется ЛРФ, то мы получим, что и ряд мультистартовых M-шаговых остатков совпадает с последними К — М + 1 значениями стационарного шумового ряда .
Если эти предположения не верны, то не совпадают с . Но даже если совпадения нет, предположим, что ряд мультистартовых M-шаговых остатков является стационарным и эргодическим в том смысле, что его эмпирическая функция распределения сходится к некоторой теоретической при . Тогда, имея в распоряжении ряд HK-M+1 мы можем оценить квантили теоретического распределения (например, верхнюю и нижнюю 2.5% квантили).
Заметим, что значения gj+M+L-2 получены за то же число шагов с помощью той же ЛРФ, что и точки прогноза при этом начальные значения взяты из одного и того же восстановленного ряда. Так как прогнозирование требует предположения о сохранении структуры ряда в будущем, то полученная эмпирическая функция распределения ряда мультистартовых M-шаговых остатков может быть использована для построения доверительного интервала для значения FN+M-1.
Для построения доверительных интервалов фиксируется некоторый доверительный уровень . и – нижняя и верхняя α/2 -квантили, вычисленные на основе эмпирической функции распределения ряда остатков. Таким образом, строится эмпирический доверительный интервал
который содержит с вероятностью, близкой к .
Если ряд мультистартовых M-шаговых остатков можно рассматривать как белый шум, то можно предложить другую модификацию эмпирического доверительного интервала. Предполагая, что справедлива гипотеза о гауссовском белом шуме, можно построить стандартный симметричный доверительный интервал для FN+M-1 с помощью выборочных среднего и дисперсии ряда мультистартовых M-шаговых остатков. Конечно, гипотеза о белом шуме должна быть проверена с помощью стандартных статистических процедур[12].
Бутстреп-доверительные интервалы для прогноза сигнала. Рассмотрим метод построения доверительных границ для сигнала F(1) в момент времени N+M–1. В нереализуемой на практике ситуации, когда известны как сам сигнал, так и истинная модель шума, с помощью моделирования и метода Монте-Карло можно определять статистические свойства значения прогноза по отношению к истинному значению.
Действительно, предположим, что правило выбора набора собственных троек фиксировано. Тогда мы можем промоделировать S независимых реализаций процесса и затем применить процедуру прогноза к S независимым рядам FN,j + .
Результаты прогноза образуют выборку , которая и дает информацию о . Таким образом могут быть построены доверительные интервалы по методу Монте-Карло.
Так как на практике мы не знаем вид и значения сигнала , то мы не можем применить такую процедуру. Опишем бутстреп-вариант моделирования для построения доверительных интервалов для точек прогноза.
При подходящем выборе длины окна L и набора собственных троек, соответствующих сигналу, мы получаем представление FN= + , где (восстановленный ряд) аппроксимирует сигнал , a — ряд остатков. Предположим теперь, что (стохастическая) модель остатков известна. Например, мы постулируем некоторую модель для и, так как ≈ , применяем ту же самую модель для с оцениваемыми параметрами.
Тогда, моделируя S независимых реализаций ряда , мы получаем S временных рядов FN,j + и S раз проводим прогнозирование, получая так же как в варианте метода Монте-Карло.
Более точно, каждый временной ряд порождает свой восстановленный ряд и свою линейную рекуррентную формулу при выборе одной и той же длины окна L и одного и того же набора собственных троек. Поэтому для каждого ряда на основе последних L — 1 точек ряда в качестве начальных значений для рекуррентного прогноза по соответствующей ЛРФ, выполняется М шагов прогноза, результатом чего являются значения .
Как только выборка из спрогнозированных значений получена, мы можем вычислить (эмпирические) нижнюю и верхнюю квантили по заданному доверительному уровню и получить соответствующий доверительный интервал для прогноза сигнала. Этот интервал называется бутстреп-доверительным интервалом.
Простейшей моделью для является модель гауссовского белого шума. Соответствующая гипотеза может быть проверена с помощью стандартных тестов на случайность и нормальность.