logo search
Анализ продажной цены автомобиля

2. Эконометрическое моделирование исходных данных

И так, мы располагаем 129 наблюдениями переменных, из которых 2 количественные, продажа стоимости автомобиля и его пробег, 3 различные качественные бинарные переменные, 1 качественную переменную с 4 градациями, которую используем в виде набора 3-х “бинарных” переменных (см. параграф 2 предыдущей главы).

Мы так же будем использовать две дополнительных переменные LN_price и LN_run. Первая, в нашем случае приводит к нормальности распределения зависимой случайной переменной. Вторая - даёт простое представление о функции эластичности цены автомобиля по его пробегу.

В качестве конкурирующих, мы будем рассматривать модели для логарифма цены (LN_price), использующие либо переменную пробег (run), либо его лоарифм (LN_run) в составе объясняющих переменных. Дальнейшему улучшению подвергнется наилучшая из них.

Так же, дополнительно, мы построим аналогичную простую модель зависимости непосредственно для цены (price) автомобиля. Последняя модель, возможно менее пригодна с точки зрения теории, но весьма удобна на практике, как для быстрого отсева явно не пригодных предложений, так и для использования простыми обывателями, которые вряд ли помнят что такое логарифм.

В процессе анализа автором было исследовано 5 типов моделей, первые две модели использовали непосредственно возраст автомобиля эта зависимость оказалась в обоих случаях существенно не линейной. Кроме того они показались автору бесперспективными для дальнейшего улучшения. Эти модели в дальнейшем не использовались и в работе не описывались.

Этот факт привел к необходимости введения замены переменной year на фиктивную переменную. Все модели используют mark, state, power и константу.