logo
Моделирование и прогнозирование цен на бензин 2007

2.1. Предварительная обработка данных

Предварительная обработка данных необходима для определения возможности использования методов динамических рядов и корреляционно-регрессионного анализа для построения моделей, описывающих изменение цен на бензин.

Расчет выборочных характеристик:

Средняя

15,60077

Медиана

15,51

Мода

16,79

Минимум

11,34

Максимум

18,94

Размах вариации

7,6

Дисперсия

5,393387

Среднеквадратическое отклонение

2,322367

Коэффициент вариации

14,9%

По соотношению средней, моды, медианы можно сказать, что распределение приблизительно близко к нормальному закону, а по значению коэффициента вариации видно, что совокупность достаточно однородна, следовательно, средняя достаточно типична.

2) Аномальных наблюдений не обнаружено на уровне значимости 5%

3)Проверка гипотезы о нормальном законе распределения.

На основе исходных данных, представленных в таблице Приложения 1, можно построить гистограмму и график на нормальной вероятностной бумаге для исследуемого показателя Yt.

По гистограмме и графику на нормальной вероятностной бумаге видно, что распределение величины Yt относительно близко к нормальному закону. (см. Приложение 2).

По диаграмме рассеивания видно, что можно построить такую прямую, которая бы описывала имеющуюся тенденцию цен к повышению, т.е. распределение Yt не случайно. Следовательно, результирующий показатель Yt имеет прямую функциональную зависимость от времени, а значит, необходимо проверить его на автокорреляцию уровней временного ряда. Для этого вычисляются коэффициенты автокорреляции. Величина максимального лага определяется по формуле , где Т- объем выборки. Следовательно, .

Коррелограмма имеет вид:

Все коэффициенты автокорреляции положительны и постепенно снижаются Следовательно, можно сделать вывод о том, что в ряду наблюдается долгосрочная тенденция, для такого ряда лучше всего подходит трендовая модель вида