logo search
Анализ продажной цены автомобиля

2.3 Анализ остатков

Проверка на гетероскедактичность [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001; Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.; Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. "Библиотека Солев";] остатков показала наличие средней (R-squared = 0.42) зависимости квадратов остатков от зависимой величины.

А тест на зависимость остатков от исходных переменных дал отрицательный результат. Данное оценивание не приводится. Модель зависимости дана ниже.

EPSILON2 = 45.18038 - 7.425410 x LN_price + 0.304176 x LN_price + EPSILON1,

F-statistic = 45.40328 (Prob. F-Stat = 0.00000)

Через LN_price обозначена вторая степень переменной LN_price, а через EPSILON - остатки этой регрессии.

Эта зависимость является значимой. Об этом свидетельствуют значения критериев (F-statistic = 45.40328 Prob. F-Stat = 0.00000).

Но эта зависимость не очень существенна (R-squered =0,41).

Не приводя аналогичных расчетов, отметим лишь то, что увеличение степени полинома по переменной LN_price улучшает эту зависимость не существенно.

Однако, как будет понятно из дальнейшего, не стоит торопиться с выводами и переходить сразу к взвешенной регрессии.

Попробуем поступить по-другому - построить модель, учитывающую дополнительный анализ исходных данных на наличие выбросов.

Рассмотрим график остатков регрессии и определим наиболее выделяющееся значения (выбросы):

Рисунок 3. График значений остатков регрессии для второго уравнения (по оси абсцисс - номера наблюдений упорядоченных по возрастанию логарифма цены).

Стандартный анализ выбросов [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001; Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. "Библиотека Солев";] дал результаты, приведенные в таблице

Таблица 4. Значения всех рассматриваемых переменных для пяти наблюдений с наибольшими по абсолютному значению остатками регрессии для второго уравнения.

Номер наблюд.

Перем.

price

Перем.

ln_price

Перем.

mark

Перем.

year

Перем.

state

Перем.

power

Перем.

run (км.)

84

850

тыс. руб.

13.6530

1

1

1

1

2500

80

650

тыс. руб.

13.3847

1

2

1

1

24000

82

700

тыс. руб

13.4588

1

1

1

1

4500

4

260

тыс. руб

12.4684

1

1

1

1

10000

86

140

тыс. руб

11.8494

0

3

0

1

116000

Теперь посмотрим на таблицу 4 значений всех рассматриваемых переменных для пяти наблюдений с наибольшими по абсолютному значению остатками регрессии для второго уравнения.

Четыре наблюдения относятся к автомобилям марки Hunter с мощностью 128 л. с., в отличном состоянии, и только одно последнее наблюдение относится к автомобилям марки Patriot, 2006г. выпуска, 128 л. с., в хорошем состоянии (см. значения по переменным mark, year, power, state в таблице 4).

Первый автомобиль в таблице 4 (под номером 84) имеет положительный максимальный по модулю остаток регрессии. Этот автомобиль 2008г. выпуска, его продажная стоимость максимальна и составляет 850 тыс. рублей (для сравнений см. описательные статистики в таблице 1). Все значения переменных для этого автомобиля в классе автомобилей марки Hunter имеют самые лучшие значения, в том числе и пробег в км., поскольку он прошел обкатку 2500 км., и обычно за этот пробег выявляются и устраняются все его недостатки.

Второй автомобиль в таблице 4 (под номером 80) имеет второй положительный максимальный остаток регрессии. Этот автомобиль 2007г. выпуска и его продажная стоимость составляет 650 тыс. рублей. Все значения переменных для этого автомобиля для этого автомобиля в классе автомобилей марки Hunter также имеют самые лучшие значения, за исключением 2007г. выпуска и пробега 24000 км.

Третий автомобиль в таблице 4 (под номером 82) 2008г. выпуска имеет третий положительный максимальный остаток регрессии. Его продажная стоимость составляет 700 тыс. рублей. Все значения переменных для этого автомобиля для этого автомобиля в классе автомобилей марки Hunter также имеют самые лучшие значения, за исключением пробега, равного 4500 км.

Четвертый автомобиль в таблице 4 (под номером 4) имеет отрицательный максимальный остаток регрессии. Его продажная стоимость составляет 260 тыс. рублей. Все значения переменных для этого автомобиля в классе автомобилей марки Hunter также имеют самые лучшие значения, за исключением пробега, составляющего 10000 км.

Пятый автомобиль в классе автомобилей марки Patriot в таблице 4 (под номером 86) имеет отрицательный максимальный остаток регрессии. Его продажная стоимость по сравнению с другими автомобилями небольшая и составляет 140 тыс. рублей. Он имеет 2006г. выпуска и большой пробег, составляющий 116000 км.