Анализ и планирование хозяйственной деятельности ОАО "Приморское агентство авиационных компаний"

отчет по практике

4.1 Экспоненциальное сглаживание

Рассмотрим анализ временных рядов на практике. Наша цель: построение модели и определения краткосрочного прогноза. Анализ с помощью АРПСС требует предварительной работы по идентификации модели. Требуются эксперименты, чтобы найти удовлетворительную модель. Часто цель АРПСС состоит не только в построении прогноза, но и в объяснение природы модели (интерпретация числа и типов параметров). В этих случаях экспоненциальное сглаживание является альтернативной, более легкой процедурой, дающей прогноз сопоставимого качества.

На графиках прогнозов представлено наиболее вероятное поведение ряда и допустимые интервалы, в которых ряд будет лежать с вероятностью 90%. Также эти данные представлены в таблицах прогнозов. Это позволяет сделать выводы, не только об ожидаемом значении, но и о максимально и минимально возможном. Исходя из этих данных, компания может распланировать деятельность в соответствии со своей политикой.

Методы STATISTICA Visual Basic позволяют автоматически найти нужный прогноз с нужной степенью точности простым методом перебора, не зная заранее природу модели. Это позволяет строить прогнозы "с нуля" - без каких либо подготовительных анализов и не обладая обширными знаниями в теории математической статистики.

Программа вычисляет практически все используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс, и так далее.

Для достижения нашей цели используем модели экспоненциального сглаживания и ARIMA модели, реализованные в программе STATISTICA. В качестве исходных данных взят временной ряд: количество страховых полисов РСТК, продаваемых компанией (данные компании «Приморское агентство авиационных компаний»). Данные представлены подекадно с января 2010 по октябрь 2011 года. (Таблица 1)

Таблица 1

Год

Месяц

Выручка по тарифу

Кол-во полисов

Год

Месяц

Выручка по тарифу

Кол-во полисов

(тыс. руб.)

(тыс. руб.)

2010

январь

22971,52

234

2010

декабрь

122973,8

635

82083,03

761

92707,23

656

99947,27

697

94569,23

568

февраль

108518,1

714

2011

январь

31112,77

301

106792,9

693

100776

763

67402,77

401

116987,4

1239

март

115847,3

667

февраль

127019,8

1168

149360,3

1031

111608,5

1021

160889,5

1048

95920,2

751

апрель

156769,1

947

март

132220,6

1092

147773,6

842

181059,3

1216

179441,4

1329

202118,6

1467

май

137264,6

970

апрель

174007,3

1433

212372,5

620

181694,2

1485

219605,3

959

190080

1485

июнь

238988,3

1146

май

184808,1

1276

187257,2

1232

265757,4

1693

233866

974

240011,4

1532

июль

225545,2

923

июнь

269371,3

1879

185872,2

822

206798,5

1503

184726

755

243919

1702

август

137678,6

933

июль

210499,9

1451

133329

731

195758,5

1530

117240

914

168198,4

1479

сентябрь

122187,8

834

август

167167

1362

103526,4

225

136008,8

1305

126591,6

326

138415,5

1548

октябрь

115753

630

сентябрь

131405,3

1451

130693

485

131279,1

1379

125195,4

653

130217,6

1468

ноябрь

108468,2

730

октябрь

120881,5

1353

120267,6

694

140335,8

1540

112404,6

652

125473,1

1479

Построим график, на котором будет показано наглядно, сколько полисов РСТК было продано компанией подекадно с января 2010 по октябрь 2011 года.

Рисунок 1. - График полисов РСТК

Очевидно, что исследуемый показатель (количество проданных полисов РСТК) гетероскедастичен, поскольку величина разброса различна, и носит сезонный характер. Заметно наличие возрастающего тренда. Оценку цикличности временного ряда можно сделать, построив коррелограммы АКФ и ЧАКФ.

Рисунок 2. - АКФ

Рисунок 3. - ЧАКФ

Построим линейную аддитивную модель с трендом и сезонной компонентой. Для этого выберем параметры на сетке, приняв начальные значения альфа и дельта, и шаг равными 0,05, а остановимся на значении 0,95.

Таблица 2. - Поиск на сетке

Альфа

Дельта

Гамма

Ср.

Ср. абс.

Сумма

Средние

Ср. %

Ср. абс.

568

0,450

0,1000

0,100

-2,848

183,6957

349586

52967,63

-8,094

26,07857

973

0,700

0,1000

0,100

-1,589

184,2091

360497

54620,80

-7,383

25,59571

Для дальнейшего исследования выберем модели №568 (альфа = 0,45, дельта = 0,1, гамма = 0,1) и №973 (альфа = 0,7, дельта = 0,1, гамма = 0,1), так как здесь наибольшее количество ошибок принимают минимальное значение. Выполним экспоненциальное сглаживание модели №568.

Рисунок 4. - Экспоненциальное сглаживание модели №568

По графику видно, что исследуемый показатель (кол-во проданных полисов) и дальше будет колебаться. Также заметна некоторая тенденция к увеличению. При этом прогноз будет следующим:

Таблица 3. - Прогноз

Значение

Значение

67

1467

72

1528

68

1466

73

1501

69

1511

74

1500

70

1484

75

1445

71

1477

76

1418

Значения ошибок представим в таблице.

Таблица 4. - Значения ошибок

Итоговая ошибка

Ошибка

Средн. ош.

-2,84835590

Ср. абсол. ошибка

183,69565068

Суммы квадратов

3495863,25116296

Ср. квадрат

52967,62501762

Средн. относ. ошибка

-8,09433151

Ср. абс. отн. ошибка

26,07857084

Чтобы судить об адекватности модели необходимо оценить остатки экспоненциального сглаживания, построив коррелограмму АКФ, гистограмму и нормальный вероятностный график.

Рисунок 5. - АКФ остатков

Значения остатков не выходят за границы доверительного интервала, остатки представляют собой белый шум.

Рисунок 6. - Гистограмма остатков

Судя по гистограмме распределение остатков близко к нормальному, хотя и имеется отклонение.

Рисунок 7. - Нормально вероятностный график

Вероятностное распределение остатков довольно близко к красной линии. Разброс минимален. В целом модель хорошо описывает ряд и ее можно назвать адекватной. Выполним экспоненциальное сглаживание модели №973.

Рисунок 8. - Экспоненциальное сглаживание модели №973

По данному графику также заметен рост спроса на полиса РСТК. Прогнозные значения представлены в таблице:

Таблица 5

Значение

Значение

67

1477

72

1537

68

1472

73

1518

69

1516

74

1513

70

1497

75

1557

71

1493

76

1538

Значения ошибок для построенной модели следующие:

Таблица 6

Итоговая ошибка

Ошибка

Средн. ош.

-1,58976437

Ср. абсол. ошибка

184,20905129

Суммы квадратов

3604973,05050938

Ср. квадрат

54620,80379560

Средн. относ. ошибка

-7,38398459

Ср. абс. отн. ошибка

25,59570815

Определим, является ли построенная модель адекватной. Для этого построим график ЧАКФ остатков экспоненциального сглаживания, гистограмму и нормальный вероятностный график.

Рисунок 9. - АКФ

Судя по графику АКФ ненулевым является только значение с лагом 2, остальные коэффициенты корреляции незначимы.

Рисунок 10. - Гистограмма остатков

Распределение остатков экспоненциального сглаживания близко к нормальному.

Рисунок 11. - Нормально вероятностный график

Распределение остатков близко к белому шуму. Модель можно назвать адекватной.

Построенные мультипликативные модели с трендом и сезонной компонентой дали худшие результаты. Следовательно, выбор осуществляется из двух аддитивных моделей. Так как АКФ модели 568 (№1) является белым шумом и распределение остатков более приближено к нормальному, следовательно, выберем ее, в качестве наиболее лучше описывающей временной ряд.

Делись добром ;)