2.3 Числовой пример модели множественной регрессии и выводы множественной регрессии
1. Построим линейную модель множественной регрессии с помощью Microsoft Office Excel. Регрессионный анализ предназначен для исследования зависимости исследуемой переменной Y от различных факторов и отображение их взаимосвязи в форме регрессионной модели.
В зависимости от количества включенных в модель факторов Х модели делятся на:
Однофакторные (парная модель регрессии).
Многофакторные (модель множественной регрессии).
Линейная модель множественной регрессии имеет вид:
=b0+ b 1*x1+ b 2*x2+…+ b n*xn
Для построения линейной модели множественной регрессии на листе Microsoft Office Excel (2007) создадим табличку с нашими данными (Рис.1) и построим регрессию. Для этого на закладке Данные выберем строку Анализ данных и в качестве инструмента данных - Регрессия - ок. В открывшемся окне Регрессии зададим Входной интервал Yи Х (рис.2,3).
Рис. 1. Линейная модель множественной регрессии
Рис. 2. Окно Анализ данных
Рис. 3. Окно Регрессия.
Получим результаты регрессионного анализа на новом листе Регрессия (Рис. 4)
Рис. 4. Лист Регрессия.
По данным регрессионной статистики мы получили следующие данные:
Множественный R - это vR2, где R2 - коэффициент детерминации.
R-квадрат - это R2. В нашем примере значение R2=0,9883 свидетельствует о том, что изменения зависимой переменной Y (объём валового национального продукта (ВНП)) в основном (на 98,83%) можно объяснить изменениями включенных в модель объясняющих переменных - Х1, Х2 (потребление и инвестиции). И лишь на 1,17% (100-98,83) объём ВНП зависит от других неучтённых факторов. Такое значение свидетельствует об адекватности модели.
Нормированный R-квадрат - поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.
Стандартная ошибка регрессии S=vS2, где S2=? (еi2/ (n-m)) - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); n - число наблюдений (в нашем случае 10), m - число объясняющих переменных (в нашем примере равно 2).
Наблюдения - число наблюдений n (10).
Рассмотрим таблицу с результатами дисперсионного анализа:
df - число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант (m+1).
SS - сумма квадратов (регрессионная RSS, остаточная ESS и общая TSS соответственно).
MS - сумма квадратов на одну степень свободы. MS=SS/df.
F - расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости б=0,05 уравнение регрессии признается значимым в целом, если Значимость F<0,05, и незначимым, если Значимость F?0,05.
Для нашего примера имеем следующие значения:
Таблица 2
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
m=2 |
RSS=97,74 |
RSS/df=48,87 |
(RSS/ESS) * ( (n-m-1) /m) =295,50 |
1,73534E-07 |
|
Остаток |
n-m - =7 |
ESS=1,15 |
ESS/df=0,165 |
|||
Итого |
n-1=9 |
TSS= 98,9 |
В нашем случае расчетное значение F-критерия Фишера составляет 295,50. Значимость F=1,74E-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.
В последней таблице приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критериев Стьюдента для оценки значимости отдельных параметров модели.
Таблица 4
Коэффи-циенты |
Стандарт-ная ошибка |
t-статистика |
Р-значение |
Нижние 95% |
Верхние 95% |
||
Y |
b0=-0,26 |
mb0=0,58 |
tb0=-0,44 |
0,67 |
-1,62? b0? 1,11 |
||
X1 |
b1=0,47 |
mb1=0,88 |
tb1=0,53 |
0,61 |
-1,62? b1? 2,56 |
||
X2 |
b2=0,56 |
mb2=0,10 |
tb2=5,53 |
0,0008 |
0,32? b2? 0,79 |
Анализ данной таблицы позволяет сделать вывод о том, что на уровне значимости б=0,05 значимым оказывается лишь коэффициент при факторе X2, так как лишь для него Р-значение меньше 0,05. Таким образом, фактор Х1 не существенен и его включение в модель не целесообразно. Поскольку коэффициент регрессии в экономических исследованиях имеют четкую экономическую интерпретацию, то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, как например, - 1,62? b1? 2,56. Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Это также подтверждает вывод о статистической незначимости коэффициентов регрессии при факторе Х1. Таким образом, целесообразно исключить несущественный фактор Х1. Но мы оставим этот фактор, так как у нас всего 2 переменных и в случае его исключения, модель не будет многофакторной. Поэтому мы будем иметь ввиду, что фактор Х1 малозначим и построим уравнение зависимости Y (объёма валового национального продукта) от значимой объясняющей переменной X2 (инвестиции) и незначимой Х1 (потребление).
- Введение
- Глава I. Аналитическая часть
- 1.1 Основы построения и тестирования адекватности экономических моделей множественной регрессии
- 1.2 Проблема спецификации экономических моделей множественной регрессии
- 1.3 Последствия ошибок спецификации экономических моделей множественной регрессии
- Глава II. Проектная часть
- 2.1 Методическое обеспечение множественной регрессии
- 2.2 Информационное обеспечение множественной регрессии
- 2.3 Числовой пример модели множественной регрессии и выводы множественной регрессии