logo
Анализ продажной цены автомобиля

2.1 Первая конкурирующая модель

Далее мы будем рассматривать две модели, сначала для LN_price, а потом отдельно построим модель для цены (price) нужной в систему ее практической полезности (утилитарности).

Первая модель содержит переменную run в качестве фактора, вторая - переменную LN_run.

LN_PRICE = C + C1 х MARK + C2 x STATE + C3 x POWER +

C4 x DUM2_YEAR + C5 x DUM2_YEAR + C6 x DUM4_YEAR

+ C7 x RUN + EPSILON.

Где: C - константа,

C1 - C7 - коэффициенты уравнения,

EPSILON - случайная составляющая.

Результат оценивания первой модели дан в таблице 3.

Таблица 3. Вывод в пакете EViews результатов оценивания первой пробной конкурирующей модели регрессии.

Dependent Variable: LN_PRICE

Method: Least Squares

Date: 05/13/13 Time: 18:25

Sample: 1 132

Included observations: 130

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

12.79760

0.127811

100.1295

0.0000

MARK

-0.179599

0.040512

-4.433281

0.0000

STATE

0.127830

0.048364

2.643105

0.0093

POWER

0.233384

0.112824

2.068564

0.0407

DUM2_YEAR

-0.107976

0.049881

-2.164681

0.0324

DUM3_YEAR

-0.324490

0.071259

-4.553654

0.0000

DUM4_YEAR

-0.344819

0.068436

-5.038564

0.0000

RUN

-3.35E-06

7.68E-07

-4.360340

0.0000

R-squared

0.647120

Mean dependent var

12.76526

Adjusted R-squared

0.626873

S.D. dependent var

0.349080

S.E. of regression

0.213232

Akaike info criterion

-0.193304

Sum squared resid

5.547107

Schwarz criterion

-0.016840

Log likelihood

20.56476

Hannan-Quinn criter.

-0.121601

F-statistic

31.96096

Durbin-Watson stat

0.527893

Prob(F-statistic)

0.000000

Далее мы представим соответствующие объяснения, связанные с интерпретацией вывода результатов оценивания для нашего первого пробного уравнения регрессии.

В выводе результатов оценивания в Eviews в первом столбце, помеченном “Variable”, в верхнем блоке таблицы 2 приводится список объясняющих (независимых) переменных, входящих в матрицу исходных данных.

Эта матрица состоит из восьми столбцов (первого столбца из единиц, второго столбца из значений фиктивной переменной mark и т.д., и последнего столбца из значений переменной run.) 130 строк - каждая соответствует своему номеру наблюдения.

Таким образом, число оцениваемых параметров в данной регрессии равно 8.

Объем выборки равен 130 наблюдений, (в выводе результатов оценивания смотри Included observations: 130).

В столбце, помеченном “Coefficient” [ Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.;], отображаются оцененные коэффициенты регрессии нашего пробного уравнения.

Коэффициент с - это свободный член, который имеет значение основного уровня прогнозирования, когда все другие объясняющие переменные нулевые.

В столбце “Std. Error” [ Основы эконометрики. Прикладная статистика. С.А. Айвазян., В.С. Мхитарян. М.: Юнити 2001], показывается оцененные стандартные ошибки для оценок коэффициентов.

Стандартные ошибки измеряют статистическую надежность оценок коэффициентов - чем больше стандартные ошибки, тем больше статистический шум в оценках.

Если ошибки распределены нормально, то существует приблизительно 2 шанса из 3, что истинный коэффициент регрессии находится в пределах одной стандартной ошибки от оцененного коэффициента, и приблизительно 95 шансов из 100, что истинный коэффициент находится в пределах двух стандартных ошибок от оцененного коэффициента.

t-статистика [ Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. "Библиотека Солев";] (в столбце “t-Statistic”) мы вычислили как отношение оцененного коэффициента регрессии к его стандартной ошибке, и применяется для тестирования нулевой гипотезы, что истинный коэффициент регрессии равен нулю.

Значение статистики R-квадрат (R-squared) служит оценкой измерения, насколько хорошо из построенной регрессии прогнозируются внутри выборочные значения объясняемой (зависимой) переменной, и, следовательно, является измерителем качества соответствия модели наблюдаемым данным.

Одна из проблем при применении в измерении качества соответствия модели наблюдаемым данным состоит в том, что при добавлении в модель новых регрессоров, значение никогда не уменьшится. Или всегда можно получить значение равное единице, если включить столько независимых регрессоров, сколько в выборке имеется наблюдений. В нашем случае такой опасности нет.

Для скорректированного (Adjusted R-squared) [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001], обычно обозначаемого как, на обычный при добавлении регрессоров в модель налагается штраф, который не вносит свой вклад в объяснительную мощность модели.

Стандартная ошибка регрессии (S.E. of regression) [ Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.] является итоговой статистикой на основе оцененной дисперсии остатков.

F-статистика [ Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008 "Библиотека Солев";] (F-statistic), применяется для тестирования нулевой гипотезы, все коэффициенты наклона в регрессии (за исключением свободного члена) равны нулю.

p-значение, предоставленное ниже F-статистики (Prob(F-statistic)) [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001], является предельным уровнем значимости F-критерия.

Если p-значение меньше уровня значимости, например, меньше 0,05, то при тестировании совместная нулевая гипотеза, что все коэффициенты наклона равны нулю, отклоняется.

В нашей первой пробной модели p-значение равно нулю, и, таким образом, мы отклоняем нулевую гипотезу, что все коэффициенты нашей регрессии равняются нулю.

На этом мы завершаем соответствующие объяснения, связанные с интерпретацией вывода результатов оценивания в таблице 2.

Все коэффициенты этого уравнения регрессии являются значимыми на уровне 95% и имеют хорошо экономически интерпретируемые знаки коэффициентов регрессии.

Например, при более раннем годе выпуска автомобиля его продажная стоимость при прочих равных условиях снижается.

Значение статистики R-квадрат для этого уравнения равно 0,647, и, следовательно, 64,7% вариации переменной продажная стоимость автомобиля объясняется независимыми переменными, включенными в правую часть первого уравнения регрессии. И это значение дает нам вывод о приемлимом качестве соответствия модели наблюдаемым данным.

Наше первое пробное уравнение регрессии включает все имеющиеся у нас переменные, и является линейным, как по параметрам, так и по переменным.