Анализ продажной цены автомобиля
2. Эконометрическое моделирование исходных данных
И так, мы располагаем 129 наблюдениями переменных, из которых 2 количественные, продажа стоимости автомобиля и его пробег, 3 различные качественные бинарные переменные, 1 качественную переменную с 4 градациями, которую используем в виде набора 3-х “бинарных” переменных (см. параграф 2 предыдущей главы).
Мы так же будем использовать две дополнительных переменные LN_price и LN_run. Первая, в нашем случае приводит к нормальности распределения зависимой случайной переменной. Вторая - даёт простое представление о функции эластичности цены автомобиля по его пробегу.
В качестве конкурирующих, мы будем рассматривать модели для логарифма цены (LN_price), использующие либо переменную пробег (run), либо его лоарифм (LN_run) в составе объясняющих переменных. Дальнейшему улучшению подвергнется наилучшая из них.
Так же, дополнительно, мы построим аналогичную простую модель зависимости непосредственно для цены (price) автомобиля. Последняя модель, возможно менее пригодна с точки зрения теории, но весьма удобна на практике, как для быстрого отсева явно не пригодных предложений, так и для использования простыми обывателями, которые вряд ли помнят что такое логарифм.
В процессе анализа автором было исследовано 5 типов моделей, первые две модели использовали непосредственно возраст автомобиля эта зависимость оказалась в обоих случаях существенно не линейной. Кроме того они показались автору бесперспективными для дальнейшего улучшения. Эти модели в дальнейшем не использовались и в работе не описывались.
Этот факт привел к необходимости введения замены переменной year на фиктивную переменную. Все модели используют mark, state, power и константу.