2.3 Анализ остатков
Проверка на гетероскедактичность [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001; Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.; Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. "Библиотека Солев";] остатков показала наличие средней (R-squared = 0.42) зависимости квадратов остатков от зависимой величины.
А тест на зависимость остатков от исходных переменных дал отрицательный результат. Данное оценивание не приводится. Модель зависимости дана ниже.
EPSILON2 = 45.18038 - 7.425410 x LN_price + 0.304176 x LN_price + EPSILON1,
F-statistic = 45.40328 (Prob. F-Stat = 0.00000)
Через LN_price обозначена вторая степень переменной LN_price, а через EPSILON - остатки этой регрессии.
Эта зависимость является значимой. Об этом свидетельствуют значения критериев (F-statistic = 45.40328 Prob. F-Stat = 0.00000).
Но эта зависимость не очень существенна (R-squered =0,41).
Не приводя аналогичных расчетов, отметим лишь то, что увеличение степени полинома по переменной LN_price улучшает эту зависимость не существенно.
Однако, как будет понятно из дальнейшего, не стоит торопиться с выводами и переходить сразу к взвешенной регрессии.
Попробуем поступить по-другому - построить модель, учитывающую дополнительный анализ исходных данных на наличие выбросов.
Рассмотрим график остатков регрессии и определим наиболее выделяющееся значения (выбросы):
Рисунок 3. График значений остатков регрессии для второго уравнения (по оси абсцисс - номера наблюдений упорядоченных по возрастанию логарифма цены).
Стандартный анализ выбросов [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001; Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. "Библиотека Солев";] дал результаты, приведенные в таблице
Таблица 4. Значения всех рассматриваемых переменных для пяти наблюдений с наибольшими по абсолютному значению остатками регрессии для второго уравнения.
Номер наблюд. |
Перем. price |
Перем. ln_price |
Перем. mark |
Перем. year |
Перем. state |
Перем. power |
Перем. run (км.) |
|
84 |
850 тыс. руб. |
13.6530 |
1 |
1 |
1 |
1 |
2500 |
|
80 |
650 тыс. руб. |
13.3847 |
1 |
2 |
1 |
1 |
24000 |
|
82 |
700 тыс. руб |
13.4588 |
1 |
1 |
1 |
1 |
4500 |
|
4 |
260 тыс. руб |
12.4684 |
1 |
1 |
1 |
1 |
10000 |
|
86 |
140 тыс. руб |
11.8494 |
0 |
3 |
0 |
1 |
116000 |
Теперь посмотрим на таблицу 4 значений всех рассматриваемых переменных для пяти наблюдений с наибольшими по абсолютному значению остатками регрессии для второго уравнения.
Четыре наблюдения относятся к автомобилям марки Hunter с мощностью 128 л. с., в отличном состоянии, и только одно последнее наблюдение относится к автомобилям марки Patriot, 2006г. выпуска, 128 л. с., в хорошем состоянии (см. значения по переменным mark, year, power, state в таблице 4).
Первый автомобиль в таблице 4 (под номером 84) имеет положительный максимальный по модулю остаток регрессии. Этот автомобиль 2008г. выпуска, его продажная стоимость максимальна и составляет 850 тыс. рублей (для сравнений см. описательные статистики в таблице 1). Все значения переменных для этого автомобиля в классе автомобилей марки Hunter имеют самые лучшие значения, в том числе и пробег в км., поскольку он прошел обкатку 2500 км., и обычно за этот пробег выявляются и устраняются все его недостатки.
Второй автомобиль в таблице 4 (под номером 80) имеет второй положительный максимальный остаток регрессии. Этот автомобиль 2007г. выпуска и его продажная стоимость составляет 650 тыс. рублей. Все значения переменных для этого автомобиля для этого автомобиля в классе автомобилей марки Hunter также имеют самые лучшие значения, за исключением 2007г. выпуска и пробега 24000 км.
Третий автомобиль в таблице 4 (под номером 82) 2008г. выпуска имеет третий положительный максимальный остаток регрессии. Его продажная стоимость составляет 700 тыс. рублей. Все значения переменных для этого автомобиля для этого автомобиля в классе автомобилей марки Hunter также имеют самые лучшие значения, за исключением пробега, равного 4500 км.
Четвертый автомобиль в таблице 4 (под номером 4) имеет отрицательный максимальный остаток регрессии. Его продажная стоимость составляет 260 тыс. рублей. Все значения переменных для этого автомобиля в классе автомобилей марки Hunter также имеют самые лучшие значения, за исключением пробега, составляющего 10000 км.
Пятый автомобиль в классе автомобилей марки Patriot в таблице 4 (под номером 86) имеет отрицательный максимальный остаток регрессии. Его продажная стоимость по сравнению с другими автомобилями небольшая и составляет 140 тыс. рублей. Он имеет 2006г. выпуска и большой пробег, составляющий 116000 км.
- Введение
- 1. Описание факторов рынка подержанных автомобилей
- 1.1 Статистическое описание переменных
- 2. Эконометрическое моделирование исходных данных
- 2.1 Первая конкурирующая модель
- 2.2 Вторая конкурирующая модель
- 2.3 Анализ остатков
- 2.4 Третья модель регрессии с добавленными фиктивными переменными наблюдений
- 2.5 Построение утилитарной модели
- 2.6 Проверка гипотезы об отсутствии гетероскедастичности в остатках третьего уравнения регрессии
- 3. Точечные и интервальные внутри-выборочные прогнозы для продажной стоимости автомобилей
- Выводы
- Продажная цена и скидки
- 9.2. Определение продажных цен на продукцию
- 1.2 Структура продажной цены на готовую продукцию.
- Структура продажной цены
- 4.3.6 Расчет продажной цены
- Учет продажи товаров по продажным ценам.
- Учет товаров по продажным ценам
- Покупные и продажные цены
- Формирование продажной цены
- Формирование продажной цены