logo
Анализ продажной цены автомобиля

2.6 Проверка гипотезы об отсутствии гетероскедастичности в остатках третьего уравнения регрессии

Если остатки регрессии являются н.о.р. (независимыми и одинаково распределенными) остатками, то по теореме Гаусса-Маркова [ Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.] применение метода наименьших квадратов (МНК) приводит к состоятельным и эффективным оценкам коэффициентов регрессии.

Предположение о н.о.р. несправедливо, если остатки регрессии не распределены одинаково или независимо (или то и другое).

“Когда дисперсия остатков регрессии, условная по регрессорам, изменяется по наблюдениям, то предположение об одинаковом распределении остатков “регрессии” несправедливо.

Это явление, известное как гетероскедастичность (остатки регрессии статистически могут быть зависимы и имеют неравные дисперсии), противоположна гомоскедастичности (остатки регрессии независимы и имеют равные дисперсии).

В случае справедливости предположения нормальности и однородности распределения остатков регрессии предполагается, что остатки условно гомоскедастичны: о дисперсии ошибок в регрессорах у нас нет никакой информации.

Если справедливо предположение о нулевом условном среднем, , но остатки регрессии не являются н.о.р. остатками, то применение МНК все еще приводит к состоятельным оценкам коэффициентов регрессии, но они являются неэффективными.

В этом случае выборочное распределение оценок коэффициентов регрессии асимптотически (для больших выборок) все еще будет подчиняться нормальному закону распределения со средним значением в точке истинных значений коэффициентов, но оцененная ковариационная матрица оценок коэффициентов регрессии, не будет являться состоятельной оценкой”. [ Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. - 616с. "Библиотека Солев";]

Теперь с помощью теста Бреуша-Пагана-Годфрея [2] (Breusch-Pagan-Godfrey) проверим нулевую гипотезу о гомоскедастичности остатков третьего уравнения регрессии (остатки регрессии имеют равные дисперсию).

Вместе со значениями этих двух статистик в пакете Eviews также приводится значение F-статистики. (Для теста на избыточность состава переменных во вспомогательной регрессии).

Вывод в пакете Eviews результатов тестирования остатков третьей регрессии по Бреушу-Пагану-Годфрею для проверки нулевой гипотезы отсутствия гетероскедастичности против альтернативной гипотезы присутствия гетероскедастичности представлен в таблице 6.

Значение основной ЛМ-статистики Бреуша-Пагана-Годфрея, обозначенное в верхнем блоке вывода в пакете Eviews как Scaled explained SS, равно 41,39 с p-значением, равным нулю.

Две другие вспомогательные статистики F-статистика и статистика Кроенкера [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001] (в выводе пакета Eviews в таблицы 5 они помечены как F-statistic и Obs*R-squared), которые представлены для сравнения, также имеют соответствующие p-значения.

Таблица 7. Результат тестирования остатков на гетероскедастичность.

Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic

4.024856

Prob. F(12,117)

0.0000

Obs*R-squared

37.98452

Prob. Chi-Square(12)

0.0002

Scaled explained SS

41.39384

Prob. Chi-Square(12)

0.0000

Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 05/16/13 Time: 11:10

Sample: 1 132

Included observations: 130

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-0.030726

0.024893

-1.234327

0.2196

MARK

0.045033

0.008508

5.293059

0.0000

STATE

0.013190

0.009722

1.356701

0.1775

POWER

0.060343

0.023049

2.618020

0.0100

DUM2_YEAR

-0.024596

0.010074

-2.441479

0.0161

DUM4_YEAR

-0.032814

0.013734

-2.389215

0.0185

DUM3_YEAR

-0.054954

0.014489

-3.792851

0.0002

DUM84

-0.087765

0.044004

-1.994463

0.0484

DUM80

-0.062519

0.043828

-1.426445

0.1564

DUM82

-0.087704

0.043999

-1.993340

0.0486

DUM4

-0.087538

0.043995

-1.989735

0.0490

DUM86

0.028846

0.045679

0.631480

0.5290

RUN

-3.02E-08

1.56E-07

-0.193652

0.8468

R-squared

0.292189

Mean dependent var

0.029499

Adjusted R-squared

0.219593

S.D. dependent var

0.048576

S.E. of regression

0.042913

Akaike info criterion

Sum squared resid

0.215454

Schwarz criterion

Log likelihood

231.7034

Hannan-Quinn criter.

F-statistic

4.024856

Durbin-Watson stat

Prob(F-statistic)

0.000032

В нижнем блоке вывода в таблице 7 представлены результаты оценивания соответствующей вспомогательной регрессии, необходимой для вычисления значений трех названных статистик.

P-значение основной ЛМ-статистики Бреуша-Пагана-Годфрея, равное нулю, говорит нам о том, что нулевую гипотезу отсутствия гетероскедастичности следует отклонить. Таким образом, принимается альтернативная гипотеза о наличие гетероскедастичности в остатках регрессии третьего уравнения.

Тест показывает практическое присутствие гетероскедастичности, хотя и слабой (R-squared =0.3), но объясняющим переменным.

Для объяснения зависимой переменной продажная стоимость автомобиля третье уравнение регрессии выбрано нами как “наилучшее”.

Переоценку коэффициентов регрессии с помощью взвешиваной регрессии этом случае я считаю ненужной, потому, что гетероскедактичность слаба, а оценки все равно состоятельны и несмещенные.