Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Многомерная математическая статистика)

..pdf
Скачиваний:
9
Добавлен:
12.11.2023
Размер:
11.62 Mб
Скачать

Анализируя результаты спектрального анализа, можно сделать вывод, что основная нагрузка 43,77 отмечается на частоте 0,0125. Следующая по величине 24,36 – на частоте 0,063, далее идёт существенное уменьшение нагрузки с незначительным всплеском на частоте 0,0313. Нагрузка остальных частот близка к нулю, а их график представляет почти прямую, асимптотически приближающуюся к нулю линию.

Рис. 6.44. Графики АКФ и ЧАКФ для остатков

Рис. 6.45. Результаты спектрального анализа

Выведем итоговую таблицу результатов с частотами, периодами (табл. 6.9), коэффициентами при косинусах и синусах, значения периодограммы, оценки спектральной плотности (представлена её наиболее информативная часть). Частота определяется как число циклов в единицу времени [64]. В модуле «Временные ряды» за единицу времени берется одно наблюдение (т.е. частота выражается как часть цикла на одно наблюдение), последовательные частоты вычисляются как k / n (от k = 0 до n), где n = 160 – число наблюдений ряда. Например, частота

251

0,00625 означает, что каждое наблюдение составляет 0,00625 от целого цикла, или 1 / 160 = 0,00625.

Величина периода есть число, обратное частоте. Таким образом, это число наблюдений в полном цикле соответствующей частоты. Первый период соответствует всему ряду наблюдений и равен 160.

Косинус-коэффициенты – это коэффициенты регрессии. Они показывают степень корреляции функций косинусов с данными на соответствующих частотах. Аналогично и синускоэффициенты. Значения периодограммы вычисляются как суммы квадратов коэффициентов при синусах и косинусах для каждой частоты (n / 2 раза). Значения периодограммы – дисперсия (сумма квадратов) данных соответствующей частоты или периода [80].

Таблица 6.9 Результаты спектрального анализа остатков

Значения периодограммы рассчитываются по выражению Pk = (синус-коэффициент k2 + косинус-коэффициент k2) ∙ n / 2.

Коэффициенты при синусах и косинусах для каждой частоты являются мерой её вклада в нагрузку. В предыдущем выражении n – величина постоянная. Следовательно, значения периодограммы будут в основном зависеть от коэффициентов при

252

синусах и косинусах для каждой частоты. Для вычисления оценок спектральной плотности периодограмму сглаживают, чтобы убрать случайные колебания. Вид взвешенного скользящего среднего и ширина окна сглаживания выбирается в окне «Спектральные окна», которое находится в закладке «Дополнительно». Коэффициенты выбранного способа взвешивания печатаются в таблице. Сумма весов всегда составляет единицу.

а

б

Рис. 6.46. Графики периодограмм: а – спектральный анализ; б – спектральная плотность остатков

Оценки спектральной плотности вычисляются путем сглаживания значений периодограммы (рис. 6.46).

Данная периодограмма (см. рис. 6.46, а) демонстрирует по крайней мере два отчётливых периода. Первый период, лежащий на середине ВР, второй – равный всей длине наблюдений. На практике при анализе данных обычно не очень важно точно определять частоты основных функций синусов или косинусов. Поскольку значения периодограммы – это объект существенного случайного колебания, скорее можно столкнуться с проблемой многих хаотических пиков периодограммы. В этом случае лучше найти частоты с большими спектральными плотностями, т.е. частотные области, состоящие из многих близких частот, которые вносят наибольший вклад в периодическое поведение всего ряда. На графике спектральной плотности ряда выделяется первый период.

253

Анализ следует выполнять с удалённым трендом, чтобы приблизить ряд к стационарному виду. Иначе периодограмма и спектральная плотность «забьются» очень большим значением первого коэффициента при косинусе (с частотой 0,0). По существу, среднее – это цикл нулевой частоты в единицу времени, т.е. константа. Аналогично тренд также не представляет интереса, когда нужно выделить периодичность в ряде. Фактически оба этих эффекта могут заслонить более интересные периодичности в данных.

Корреляция на лаге 1 максимальная и далее медленно убывает. График частной автокорреляционной функции также подтверждает модель случайного блуждания.

Иными словами, каждое следующее наблюдение очень похоже на предыдущее, плюс некоторое случайное воздействие. Мы можем «удалить» сильную автокорреляцию, взяв разности ряда.

Вновь откроем «Преобразования переменных» и выберем «Разность (x = x – х(lag))» (рис. 6.47). Затем выберем опцию «Aвтокорреляции» в окне «Преобразования переменных» (см. рис. 6.39), чтобы построить график преобразованного ряда.

Рис. 6.47. Задаём разности ряда

254

Выбираем преобразование «Разности (x = x – x(lag))», установим lag = 1. Смысл этого преобразования в том, что из текущего значения ряда вычитается предыдущее (со сдвигом 1) и результат представляется в качестве значения нового ряда. Данное преобразование позволяет избавиться от линейного тренда в ряде.

Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и коррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз, как на рис. 6.48) обычно требуют взятия несезонной разности первого порядка (lag = 1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности [80].

Спектральный анализ показал, что ряд имеет сезонную составляющую, для периодов 80, 160 и 53 с довольно высокой плотностью. В этом случае необходимо взять сезонную разность, положив lag = 80, 160 и т.д. Но это уже больше похоже не на сезонную, а циклическую составляющую. Её пока рассматривать не будем, поскольку проще использовать нелинейный тренд.

Рис. 6.48. График остатков

255

В реальных данных часто нет отчётливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, тогда как необходимо не только выделить регулярные компоненты, но также построить прогноз. Методология «Авторегрессионное проинтегрированное скользящее среднее» АРПСС (ARIMA) позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях и практика подтвердила его мощность и гибкость [68; 80].

Подберём к временному ряду переменной KCl авторегрессионную модель, оценим её параметры и на основе наблюдаемых значений спрогнозируем изменение её показателей на несколько месяцев вперёд. Обрабатывать будем остаток после удаления тренда. Для проведения вычислений в стартовой панели ARIMA необходимо произвести идентификацию модели, т.е. определить, какое количество и каких параметров должно присутствовать в модели. В модели ARIMA имеется четыре типа параметров (p, P, Q, q), которые надо определить (рис. 6.49).

Рис. 6.49. Окно ввода параметров одномерной АРПСС: p-авторегр. – регулярный параметр авторегрессии; q-скользящее среднее – регулярный параметр скользящего среднего; P-сезонных – сезонный параметр авторегресии; Q-сезонных – сезонный параметр скользящего среднего

256

Введём ранее установленные ожидаемые величины параметров. Длина сезонного лага на графике остатков максимально равна 6, но расчёты показывают лучшую длину лага, равную 10. Система предлагает две вычислительные процедуры, реализующие метод максимального правдоподобия, приближенную и точную (Еxact).

После задания параметров модели можно запустить процедуру их нахождения нажатием на кнопку «Ok (Начать оценивание параметров)» (см. рис. 6.49). На рис. 6.50 выведены результаты вычислений. В информационной области диалогового окна результатов высвечиваются следующие сведения [57; 80]:

имя ряда наблюдений (KCl);

перечень преобразований, которым подвергалась входная переменная (D1);

вид модели: Model (p, d, q), где d – число преобразований типа взятия разностей первого или более высоких порядков;

количество наблюдений в исходном ряду (159);

начальное и конечное значения остаточной cуммы квадратов остатков (SS) и средний квадрат остатков (MS);

числовые значения коэффициентов уравнения и их стандартные ошибки.

Коэффициенты уравнения модели устойчивы, если они по меньшей мере в два раза превышают свои стандартные ошибки

[57].Красным цветом выделяются значимые коэффициенты. В таблице «Оценки параметров» (табл. 6.10) видно, что уровень значимости коэффициентов уравнения высокий. Если выбраны некорректные параметры модели, то и их оценки будут незначимы. В таком случае незначимые параметры надо изменить (значения р и q) с учетом рекомендаций по виду графиков автокорреляционной функции и частной автокорреляционной функции и пересчитать результаты модели [57].

Прогноз по модели. Параметры прогноза можно задать в окне результатов (рис. 6.51) на вкладке «Дополнительно» в поле «Прогноз»: число наблюдений; начать с; уровень доверия.

257

Рис. 6.50. Окно вычисления результатов АРПСС

Таблица 6.10 Результаты оценки параметров временного ряда

График временного ряда с добавленными спрогнозированными значениями красного цвета и доверительными интервалами для них можно получить, щелкнув по кнопке «График ряда и прогнозов» (см. рис. 6.51). Рекомендуется построить несколько моделей и выбрать лучший вариант [80].

Существуют два варианта задания ряда для прогноза, связанных с ограничениями модели. Если для прогноза задаётся имя исходного ряда, то модель автоматически учитывает преобразования только типа взятия разностей (параметр d) и выдает результаты для исходного ряда. Если при приведении ряда к стационарному виду использовались преобразования других типов, прогноз надо заказывать для преобразованного ряда. Так как результаты промежуточных преобразований хранятся в модуле, то пересчет спрогнозированных величин на ряд наблюдений не представляет сложностей [57].

258

Рис. 6.51. Окно задания параметров прогноза по модели

Вывести можно как график прогноза (рис. 6.52), так и табличные значения (табл. 6.11). Из таблицы видно, что погрешность прогноза (стандартная ошибка) увеличивается по мере удаления наблюдения от последнего исходного значения ряда. По этой причине прогноз выполняют небольшими шагами (по одному значению), которые добавляют в исходный ряд, запускают процесс формирования модели и выполняют следующий прогноз.

Таблица 6.11

Прогнозные значения переменной KCl на основе модели ВР

259

Рис. 6.52. График прогнозных значений переменной KCl на основе модели ВР

Проведем анализ остатков для проверки адекватности исследуемой модели. Выведем гистограмму (рис. 6.53) и нормальный вероятностный график остатков (рис. 6.54).

Рис. 6.53. Гистограмма распределения остатков прогнозируемых значений переменной KCl

260

Соседние файлы в папке книги