2.1 Первая конкурирующая модель
Далее мы будем рассматривать две модели, сначала для LN_price, а потом отдельно построим модель для цены (price) нужной в систему ее практической полезности (утилитарности).
Первая модель содержит переменную run в качестве фактора, вторая - переменную LN_run.
LN_PRICE = C + C1 х MARK + C2 x STATE + C3 x POWER +
C4 x DUM2_YEAR + C5 x DUM2_YEAR + C6 x DUM4_YEAR
+ C7 x RUN + EPSILON.
Где: C - константа,
C1 - C7 - коэффициенты уравнения,
EPSILON - случайная составляющая.
Результат оценивания первой модели дан в таблице 3.
Таблица 3. Вывод в пакете EViews результатов оценивания первой пробной конкурирующей модели регрессии.
Dependent Variable: LN_PRICE |
|||||
Method: Least Squares |
|||||
Date: 05/13/13 Time: 18:25 |
|||||
Sample: 1 132 |
|||||
Included observations: 130 |
|||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
C |
12.79760 |
0.127811 |
100.1295 |
0.0000 |
|
MARK |
-0.179599 |
0.040512 |
-4.433281 |
0.0000 |
|
STATE |
0.127830 |
0.048364 |
2.643105 |
0.0093 |
|
POWER |
0.233384 |
0.112824 |
2.068564 |
0.0407 |
|
DUM2_YEAR |
-0.107976 |
0.049881 |
-2.164681 |
0.0324 |
|
DUM3_YEAR |
-0.324490 |
0.071259 |
-4.553654 |
0.0000 |
|
DUM4_YEAR |
-0.344819 |
0.068436 |
-5.038564 |
0.0000 |
|
RUN |
-3.35E-06 |
7.68E-07 |
-4.360340 |
0.0000 |
|
R-squared |
0.647120 |
Mean dependent var |
12.76526 |
||
Adjusted R-squared |
0.626873 |
S.D. dependent var |
0.349080 |
||
S.E. of regression |
0.213232 |
Akaike info criterion |
-0.193304 |
||
Sum squared resid |
5.547107 |
Schwarz criterion |
-0.016840 |
||
Log likelihood |
20.56476 |
Hannan-Quinn criter. |
-0.121601 |
||
F-statistic |
31.96096 |
Durbin-Watson stat |
0.527893 |
||
Prob(F-statistic) |
0.000000 |
Далее мы представим соответствующие объяснения, связанные с интерпретацией вывода результатов оценивания для нашего первого пробного уравнения регрессии.
В выводе результатов оценивания в Eviews в первом столбце, помеченном “Variable”, в верхнем блоке таблицы 2 приводится список объясняющих (независимых) переменных, входящих в матрицу исходных данных.
Эта матрица состоит из восьми столбцов (первого столбца из единиц, второго столбца из значений фиктивной переменной mark и т.д., и последнего столбца из значений переменной run.) 130 строк - каждая соответствует своему номеру наблюдения.
Таким образом, число оцениваемых параметров в данной регрессии равно 8.
Объем выборки равен 130 наблюдений, (в выводе результатов оценивания смотри Included observations: 130).
В столбце, помеченном “Coefficient” [ Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.;], отображаются оцененные коэффициенты регрессии нашего пробного уравнения.
Коэффициент с - это свободный член, который имеет значение основного уровня прогнозирования, когда все другие объясняющие переменные нулевые.
В столбце “Std. Error” [ Основы эконометрики. Прикладная статистика. С.А. Айвазян., В.С. Мхитарян. М.: Юнити 2001], показывается оцененные стандартные ошибки для оценок коэффициентов.
Стандартные ошибки измеряют статистическую надежность оценок коэффициентов - чем больше стандартные ошибки, тем больше статистический шум в оценках.
Если ошибки распределены нормально, то существует приблизительно 2 шанса из 3, что истинный коэффициент регрессии находится в пределах одной стандартной ошибки от оцененного коэффициента, и приблизительно 95 шансов из 100, что истинный коэффициент находится в пределах двух стандартных ошибок от оцененного коэффициента.
t-статистика [ Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008. "Библиотека Солев";] (в столбце “t-Statistic”) мы вычислили как отношение оцененного коэффициента регрессии к его стандартной ошибке, и применяется для тестирования нулевой гипотезы, что истинный коэффициент регрессии равен нулю.
Значение статистики R-квадрат (R-squared) служит оценкой измерения, насколько хорошо из построенной регрессии прогнозируются внутри выборочные значения объясняемой (зависимой) переменной, и, следовательно, является измерителем качества соответствия модели наблюдаемым данным.
Одна из проблем при применении в измерении качества соответствия модели наблюдаемым данным состоит в том, что при добавлении в модель новых регрессоров, значение никогда не уменьшится. Или всегда можно получить значение равное единице, если включить столько независимых регрессоров, сколько в выборке имеется наблюдений. В нашем случае такой опасности нет.
Для скорректированного (Adjusted R-squared) [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001], обычно обозначаемого как, на обычный при добавлении регрессоров в модель налагается штраф, который не вносит свой вклад в объяснительную мощность модели.
Стандартная ошибка регрессии (S.E. of regression) [ Эконометрика. Начальный курс (7-ое издание). Катышев П.К., Магнус Я.Р., Пересецкий А.А. М.:Дело, 2005.] является итоговой статистикой на основе оцененной дисперсии остатков.
F-статистика [ Путеводитель по современной эконометрике. Вербик М. Пер. с англ. В.А. Банников. Научн. ред. и предисл. С.А. Айвазян. - М.: Научная книга, 2008 "Библиотека Солев";] (F-statistic), применяется для тестирования нулевой гипотезы, все коэффициенты наклона в регрессии (за исключением свободного члена) равны нулю.
p-значение, предоставленное ниже F-статистики (Prob(F-statistic)) [ Основы эконометрики. Прикладная статистика. С.А. Айвазян, В.С. Мхитарян. М.: Юнити 2001], является предельным уровнем значимости F-критерия.
Если p-значение меньше уровня значимости, например, меньше 0,05, то при тестировании совместная нулевая гипотеза, что все коэффициенты наклона равны нулю, отклоняется.
В нашей первой пробной модели p-значение равно нулю, и, таким образом, мы отклоняем нулевую гипотезу, что все коэффициенты нашей регрессии равняются нулю.
На этом мы завершаем соответствующие объяснения, связанные с интерпретацией вывода результатов оценивания в таблице 2.
Все коэффициенты этого уравнения регрессии являются значимыми на уровне 95% и имеют хорошо экономически интерпретируемые знаки коэффициентов регрессии.
Например, при более раннем годе выпуска автомобиля его продажная стоимость при прочих равных условиях снижается.
Значение статистики R-квадрат для этого уравнения равно 0,647, и, следовательно, 64,7% вариации переменной продажная стоимость автомобиля объясняется независимыми переменными, включенными в правую часть первого уравнения регрессии. И это значение дает нам вывод о приемлимом качестве соответствия модели наблюдаемым данным.
Наше первое пробное уравнение регрессии включает все имеющиеся у нас переменные, и является линейным, как по параметрам, так и по переменным.
- Введение
- 1. Описание факторов рынка подержанных автомобилей
- 1.1 Статистическое описание переменных
- 2. Эконометрическое моделирование исходных данных
- 2.1 Первая конкурирующая модель
- 2.2 Вторая конкурирующая модель
- 2.3 Анализ остатков
- 2.4 Третья модель регрессии с добавленными фиктивными переменными наблюдений
- 2.5 Построение утилитарной модели
- 2.6 Проверка гипотезы об отсутствии гетероскедастичности в остатках третьего уравнения регрессии
- 3. Точечные и интервальные внутри-выборочные прогнозы для продажной стоимости автомобилей
- Выводы
- Продажная цена и скидки
- 9.2. Определение продажных цен на продукцию
- 1.2 Структура продажной цены на готовую продукцию.
- Структура продажной цены
- 4.3.6 Расчет продажной цены
- Учет продажи товаров по продажным ценам.
- Учет товаров по продажным ценам
- Покупные и продажные цены
- Формирование продажной цены
- Формирование продажной цены