Модель авторегрессии — скользящего среднего
Модель авторегрессии — скользящего среднего (англ. autoregressive moving-average model, ARMA) — одна из математических моделей, использующихся для анализа и прогнозирования стационарных временных рядов в статистике. Модель ARMA обобщает две более простые модели временных рядов — модель авторегрессии (AR) и модель скользящего среднего (MA).
Определение
Моделью ARMA(p, q), где p и q — целые числа, задающие порядок модели, называется следующий процесс генерации временного ряда :
- ,
где — константа, — белый шум, то есть последовательность независимых и одинаково распределённых случайных величин (как правило, нормальных), с нулевым средним, а и — действительные числа, авторегрессионные коэффициенты и коэффициенты скользящего среднего, соответственно.
Такая модель может интерпретироваться как линейная модель множественной регрессии, в которой в качестве объясняющих переменных выступают прошлые значения самой зависимой переменной, а в качестве регрессионного остатка — скользящие средние из элементов белого шума. ARMA-процессы имеют более сложную структуру по сравнению со схожими по поведению AR- или MA-процессами в чистом виде, но при этом ARMA-процессы характеризуются меньшим количеством параметров, что является одним из их преимуществ[1].
Операторное представление. Стационарность и единичные корни
Если ввести в рассмотрение лаговый оператор , тогда ARMA-модель можно записать следующим образом
или, перенеся авторегрессионную часть в левую часть равенства:
Введя сокращенные обозначения для полиномов левой и правой частей окончательно можно записать:
Для того, чтобы процесс был стационарным, необходимо, чтобы корни характеристического многочлена авторегрессионной части лежали вне единичного круга в комплексной плоскости (были по модулю строго больше единицы). Стационарный ARMA-процесс можно представить как бесконечный MA-процесс:
Например, процесс ARMA(1,0)=AR(1) можно представить как MA-процесс бесконечного порядка с коэффициентами убывающей геометрической прогрессии:
Таким образом, ARMA-процессы можно считать MA-процессами бесконечного порядка с определенными ограничениями на структуру коэффициентов. Малым количеством параметров они позволяют описать процессы достаточно сложной структуры. Все стационарные процессы можно сколь угодно приблизить ARMA-моделью некоторого порядка с помощью существенно меньшего числа параметров, нежели только при использовании MA-моделей.
Нестационарные (интегрированные) ARMA
При наличии единичных корней авторегрессионного полинома процесс является нестационарным. Корни меньше единицы на практике не рассматриваются, поскольку это процессы взрывного характера. Соответственно, для проверки стационарности временных рядов один из базовых тестов — тесты на единичные корни. Если тесты подтверждают наличие единичного корня, то анализируются разности исходного временного ряда и для стационарного процесса разностей некоторого порядка (обычно достаточно первого порядка, иногда второго) строится ARMA-модель. Такие модели называются ARIMA-моделями (интегрированный ARMA) или моделями Бокса-Дженкинса. Модель ARIMA(p, d, q), где d-порядок интегрирования (порядок разностей исходного временного ряда), p и q — порядок AR и MA — частей ARMA-процесса разностей d-го порядка, можно записать в следующей операторной форме
Процесс ARIMA(p, d, q) эквивалентен процессу ARMA(p+d, q) с d единичными корнями.
Построение модели
Для построения модели ARMA по серии наблюдений необходимо определить порядок модели (числа p и q), а затем и сами коэффициенты. Для определения порядка модели может применяться исследование таких характеристик временного ряда, как его автокорреляционная функция и частная автокорреляционная функция. Для определения коэффициентов применяются такие методы, как метод наименьших квадратов и метод максимального правдоподобия.
ARMAX-модели
В классические ARMA-модели можно добавить некоторые экзогенные факторы x. Причем в общем случае в модели участвуют не только текущие значения этих факторов, но и лаговые значения. Такие модели принято обозначать ARMAX(p, q, k), где k-количество лагов экзогенных факторов. В операторной форме такие модели можно записать следующим образом (один экзогенный фактор)
где a(L), b(L), d(L) — полиномы порядка соответственно p, q, k от лагового оператора.
Такие модели можно интерпретировать иначе — как модели ADL(p, k) со случайными ошибками MA(q).
Примечания
- Дуброва Т.А. . — Москва: ЮНИТИ-ДАНА, 2003. — ISBN 5-238-00497-4.