Анализ и планирование хозяйственной деятельности ОАО "Приморское агентство авиационных компаний"
4.1 Экспоненциальное сглаживание
Рассмотрим анализ временных рядов на практике. Наша цель: построение модели и определения краткосрочного прогноза. Анализ с помощью АРПСС требует предварительной работы по идентификации модели. Требуются эксперименты, чтобы найти удовлетворительную модель. Часто цель АРПСС состоит не только в построении прогноза, но и в объяснение природы модели (интерпретация числа и типов параметров). В этих случаях экспоненциальное сглаживание является альтернативной, более легкой процедурой, дающей прогноз сопоставимого качества.
На графиках прогнозов представлено наиболее вероятное поведение ряда и допустимые интервалы, в которых ряд будет лежать с вероятностью 90%. Также эти данные представлены в таблицах прогнозов. Это позволяет сделать выводы, не только об ожидаемом значении, но и о максимально и минимально возможном. Исходя из этих данных, компания может распланировать деятельность в соответствии со своей политикой.
Методы STATISTICA Visual Basic позволяют автоматически найти нужный прогноз с нужной степенью точности простым методом перебора, не зная заранее природу модели. Это позволяет строить прогнозы "с нуля" - без каких либо подготовительных анализов и не обладая обширными знаниями в теории математической статистики.
Программа вычисляет практически все используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс, и так далее.
Для достижения нашей цели используем модели экспоненциального сглаживания и ARIMA модели, реализованные в программе STATISTICA. В качестве исходных данных взят временной ряд: количество страховых полисов РСТК, продаваемых компанией (данные компании «Приморское агентство авиационных компаний»). Данные представлены подекадно с января 2010 по октябрь 2011 года. (Таблица 1)
Таблица 1
Год |
Месяц |
Выручка по тарифу |
Кол-во полисов |
Год |
Месяц |
Выручка по тарифу |
Кол-во полисов |
|
(тыс. руб.) |
(тыс. руб.) |
|||||||
2010 |
январь |
22971,52 |
234 |
2010 |
декабрь |
122973,8 |
635 |
|
82083,03 |
761 |
92707,23 |
656 |
|||||
99947,27 |
697 |
94569,23 |
568 |
|||||
февраль |
108518,1 |
714 |
2011 |
январь |
31112,77 |
301 |
||
106792,9 |
693 |
100776 |
763 |
|||||
67402,77 |
401 |
116987,4 |
1239 |
|||||
март |
115847,3 |
667 |
февраль |
127019,8 |
1168 |
|||
149360,3 |
1031 |
111608,5 |
1021 |
|||||
160889,5 |
1048 |
95920,2 |
751 |
|||||
апрель |
156769,1 |
947 |
март |
132220,6 |
1092 |
|||
147773,6 |
842 |
181059,3 |
1216 |
|||||
179441,4 |
1329 |
202118,6 |
1467 |
|||||
май |
137264,6 |
970 |
апрель |
174007,3 |
1433 |
|||
212372,5 |
620 |
181694,2 |
1485 |
|||||
219605,3 |
959 |
190080 |
1485 |
|||||
июнь |
238988,3 |
1146 |
май |
184808,1 |
1276 |
|||
187257,2 |
1232 |
265757,4 |
1693 |
|||||
233866 |
974 |
240011,4 |
1532 |
|||||
июль |
225545,2 |
923 |
июнь |
269371,3 |
1879 |
|||
185872,2 |
822 |
206798,5 |
1503 |
|||||
184726 |
755 |
243919 |
1702 |
|||||
август |
137678,6 |
933 |
июль |
210499,9 |
1451 |
|||
133329 |
731 |
195758,5 |
1530 |
|||||
117240 |
914 |
168198,4 |
1479 |
|||||
сентябрь |
122187,8 |
834 |
август |
167167 |
1362 |
|||
103526,4 |
225 |
136008,8 |
1305 |
|||||
126591,6 |
326 |
138415,5 |
1548 |
|||||
октябрь |
115753 |
630 |
сентябрь |
131405,3 |
1451 |
|||
130693 |
485 |
131279,1 |
1379 |
|||||
125195,4 |
653 |
130217,6 |
1468 |
|||||
ноябрь |
108468,2 |
730 |
октябрь |
120881,5 |
1353 |
|||
120267,6 |
694 |
140335,8 |
1540 |
|||||
112404,6 |
652 |
125473,1 |
1479 |
Построим график, на котором будет показано наглядно, сколько полисов РСТК было продано компанией подекадно с января 2010 по октябрь 2011 года.
Рисунок 1. - График полисов РСТК
Очевидно, что исследуемый показатель (количество проданных полисов РСТК) гетероскедастичен, поскольку величина разброса различна, и носит сезонный характер. Заметно наличие возрастающего тренда. Оценку цикличности временного ряда можно сделать, построив коррелограммы АКФ и ЧАКФ.
Рисунок 2. - АКФ
Рисунок 3. - ЧАКФ
Построим линейную аддитивную модель с трендом и сезонной компонентой. Для этого выберем параметры на сетке, приняв начальные значения альфа и дельта, и шаг равными 0,05, а остановимся на значении 0,95.
Таблица 2. - Поиск на сетке
№ |
Альфа |
Дельта |
Гамма |
Ср. |
Ср. абс. |
Сумма |
Средние |
Ср. % |
Ср. абс. |
|
568 |
0,450 |
0,1000 |
0,100 |
-2,848 |
183,6957 |
349586 |
52967,63 |
-8,094 |
26,07857 |
|
973 |
0,700 |
0,1000 |
0,100 |
-1,589 |
184,2091 |
360497 |
54620,80 |
-7,383 |
25,59571 |
Для дальнейшего исследования выберем модели №568 (альфа = 0,45, дельта = 0,1, гамма = 0,1) и №973 (альфа = 0,7, дельта = 0,1, гамма = 0,1), так как здесь наибольшее количество ошибок принимают минимальное значение. Выполним экспоненциальное сглаживание модели №568.
Рисунок 4. - Экспоненциальное сглаживание модели №568
По графику видно, что исследуемый показатель (кол-во проданных полисов) и дальше будет колебаться. Также заметна некоторая тенденция к увеличению. При этом прогноз будет следующим:
Таблица 3. - Прогноз
№ |
Значение |
№ |
Значение |
|
67 |
1467 |
72 |
1528 |
|
68 |
1466 |
73 |
1501 |
|
69 |
1511 |
74 |
1500 |
|
70 |
1484 |
75 |
1445 |
|
71 |
1477 |
76 |
1418 |
Значения ошибок представим в таблице.
Таблица 4. - Значения ошибок
Итоговая ошибка |
Ошибка |
|
Средн. ош. |
-2,84835590 |
|
Ср. абсол. ошибка |
183,69565068 |
|
Суммы квадратов |
3495863,25116296 |
|
Ср. квадрат |
52967,62501762 |
|
Средн. относ. ошибка |
-8,09433151 |
|
Ср. абс. отн. ошибка |
26,07857084 |
Чтобы судить об адекватности модели необходимо оценить остатки экспоненциального сглаживания, построив коррелограмму АКФ, гистограмму и нормальный вероятностный график.
Рисунок 5. - АКФ остатков
Значения остатков не выходят за границы доверительного интервала, остатки представляют собой белый шум.
Рисунок 6. - Гистограмма остатков
Судя по гистограмме распределение остатков близко к нормальному, хотя и имеется отклонение.
Рисунок 7. - Нормально вероятностный график
Вероятностное распределение остатков довольно близко к красной линии. Разброс минимален. В целом модель хорошо описывает ряд и ее можно назвать адекватной. Выполним экспоненциальное сглаживание модели №973.
Рисунок 8. - Экспоненциальное сглаживание модели №973
По данному графику также заметен рост спроса на полиса РСТК. Прогнозные значения представлены в таблице:
Таблица 5
№ |
Значение |
№ |
Значение |
|
67 |
1477 |
72 |
1537 |
|
68 |
1472 |
73 |
1518 |
|
69 |
1516 |
74 |
1513 |
|
70 |
1497 |
75 |
1557 |
|
71 |
1493 |
76 |
1538 |
Значения ошибок для построенной модели следующие:
Таблица 6
Итоговая ошибка |
Ошибка |
|
Средн. ош. |
-1,58976437 |
|
Ср. абсол. ошибка |
184,20905129 |
|
Суммы квадратов |
3604973,05050938 |
|
Ср. квадрат |
54620,80379560 |
|
Средн. относ. ошибка |
-7,38398459 |
|
Ср. абс. отн. ошибка |
25,59570815 |
Определим, является ли построенная модель адекватной. Для этого построим график ЧАКФ остатков экспоненциального сглаживания, гистограмму и нормальный вероятностный график.
Рисунок 9. - АКФ
Судя по графику АКФ ненулевым является только значение с лагом 2, остальные коэффициенты корреляции незначимы.
Рисунок 10. - Гистограмма остатков
Распределение остатков экспоненциального сглаживания близко к нормальному.
Рисунок 11. - Нормально вероятностный график
Распределение остатков близко к белому шуму. Модель можно назвать адекватной.
Построенные мультипликативные модели с трендом и сезонной компонентой дали худшие результаты. Следовательно, выбор осуществляется из двух аддитивных моделей. Так как АКФ модели 568 (№1) является белым шумом и распределение остатков более приближено к нормальному, следовательно, выберем ее, в качестве наиболее лучше описывающей временной ряд.