4.6 Фиктивные переменные
При построении моделей часто приходится учитывать не только количественные, но и качественные признаки. Например, при исследовании стоимости квартиры от различных факторов может возникнуть вопрос, влияет ли на цену квартиры наличие лифта в доме, телефона или балкона. Часто в качестве фиктивных переменных используют пол (мужской или женский), уровень образования и т.д.
Для ввода таких переменных в модель качественным признакам необходимо присвоить количественные значения. Чаще всего для ввода фиктивных переменных используют переменные бинарного типа “0-1”.
Например, переменная lift описывает наличие или отсутствие лифта в доме, тогда она может принимать значения:
(4.6.1)
Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменой при переходе от одной категории (нет лифта) к другой (есть лифт).
Значимость коэффициентов при фиктивных переменных определяется с помощью t – критерия Стьюдента.
Часто фиктивные переменные используются для выявления сезонности для временных рядов.
Пусть – приток туристов в Сочи в месяц t. Очевидно, что количество отдыхающих в Сочи зависит от времени года. Для выявления влияния сезонности можно ввести три бинарные переменных :
, если месяц t зимний и 0 в остальных случаях
, если месяц t весенний и 0 в остальных случаях
, если месяц t летний и 0 в остальных случаях
и оценивать уравнение (4.6.2)
Необходимо отметить, что в уравнение не вводится четвертая переменная , относящаяся к осени, т.к. тогда выполнялось бы тождество
(4.6.3),
что привело бы к линейной зависимости регрессоров и как следствие невозможности однозначного получения оценок МНК.
Интерпретация коэффициентов регрессии:
– среднее потребление для осенних месяцев;
– для зимних;
– для весенних;
– для летних.
Контрольные вопросы
1. В каком случае применяются модели множественной регрессии? Какие переменные входят в состав данных переменных?
2. Какие виды функций наиболее часто применяют на практике при построении моделей множественной регрессии? Приведите реальные примеры использования данных моделей.
3. Какие требования предъявляются к объясняющим переменным? Какие могут быть последствия при несоблюдении данных требований?
4. Каким методом находятся оценки неизвестных параметров в моделях множественной регрессии?
5. Каким условиям должны удовлетворять оценки коэффициентов в регрессионной модели?
6. Какой показатель используется для оценки качества подгонки модели к исходным данным? Каковы его свойства?
7. Каким образом можно устранить эффект, вызывающий рост коэффициента детерминации при увеличении числа регрессоров?
8. Какие тесты используются для оценки значимости модели и оценки значимости коэффициентов?
9. Какой возникает эффект при наличии сильной линейной статистической зависимости между факторами?
10. Что может вызвать эффект гетероскедастичности? Какое свойство оценок теряется при нарушении гомоскедастичности? Как оценить и исключить гетероскедастичность?
11. Что такое автокорреляция?
12. Как учесть качественные признаки в уравнении регрессии?
13. Влияние качества определенного вида продукции (Q) предприятия ЗАО “Колбасы” и времени ее изготовления (Т) на стоимость продукции (Р) описывается регрессионной моделью, построенной на основе тридцати статистических данных, собранных в декабре 2010 года: . Найдены оценки коэффициентов методом наименьших квадратов: a=3,80, b=2,15, с=0,91.
а) можно ли принять гипотезу о значимости коэффициента с с уровнем значимости 0,01, если расчетное значение t – статистики для показателя времени изготовления продукции (Т) равно 3,71, а критическое значение t – статистики из таблицы Стьюдента равно 2,6?
б) исходя из полученного коэффициента детерминации, равного 0,79, оцените соответствие построенной модели выборочным данным;
в) оцените значимость уравнения, если расчетное значение F – статистики Фишера равно 11,5, а табличное значение статистики Фишера с доверительной вероятностью 95% равно 3,81?
г) интерпретируйте полученные результаты;
д) как изменится стоимость конечной продукции, если время изготовления сократится в 2 раза?
14. Исследуется влияние размера заработной платы (L) и объема основных фондов (K) на машиностроительных предприятиях области на объем производимой продукции (Q). В результате исследования была построена регрессии на 25 наблюдениях , и найдены оценки ее коэффициентов методом наименьших квадратов: а=10,04, b=2,99, с=1,5.
а) можно ли принять гипотезу о значимости коэффициента b с уровнем значимости 0,01, если расчетное значение t – статистики для показателя объема основных фондов (K) равно 1,70, а критическое значение t – статистики из таблицы Стьюдента равно 2,53?
б) исходя из полученного коэффициента детерминации, равного 0,39, оцените соответствие построенной модели выборочным данным;
в) оцените значимость уравнения, если расчетное значение F – статистики Фишера равно 2,15, а табличное значение статистики Фишера с доверительной вероятностью 95% равно 3,59?
г) интерпретируйте полученные результаты;
д) как изменится стоимость конечной продукции, если заработная плата возрастет в 1,5 раза?
Тестовые вопросы
1. Переход к стандартизированному уравнению регрессии осуществляется для
сравнения влияния факторов на результирующий признак;
приведения уравнения регрессии к нормальному виду;
линеаризации модели.
2. Если в исследуемое уравнение регрессии добавить новый фактор , то
новой модели не изменится;
новой модели не увеличится;
новой модели не уменьшится.
3. Если не выполнено предположение о сильной статистической независимости факторов, то присутствует эффект
гетероскедастичности;
гомоскедастичности;
мультиколлинеарности.
4. Если значение выборочного коэффициента корреляции =-0,9, то
связь между факторами слабая и обратная;
связь между факторами сильная и обратная;
связь между факторами слабая и прямая.
5. Если в регрессионной модели присутствует эффект гетероскедастичности, то нарушено условие
постоянства дисперсии остатков;
несмещенности оценок.
сильной статистической зависимости между регрессорами.
6. Если статистика =2, то
корреляция в остатках регрессии отсутствует;
корреляция в остатках регрессии положительная;
корреляция в остатках регрессии отрицательная.
7. Была оценена регрессия , t – статистики для коэффициентов =2,65, = 2,85, если =2,77, тогда
оба коэффициента незначимы;
коэффициент незначим, коэффициент значим;
коэффициент значим, коэффициент незначим.
Список литературы
Айвазян С.А. Основы эконометрики: Учебник для вузов, т.2. – М.: ЮНИТИ – ДАНА, 2001. – 432 с;
Айвазян С.А., Мхитрян В.С. Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998;
Берндт Э. Практика эконометрики: классика и современность. – М.: ЮНИТИ, 2005;
Бородич С.А. Эконометрика. – Минск: Новое знание, 2001;
Доугерти К. Введение в эконометрику: Перев. с англ. – М.: ИНФРА – М, 1997. – 402 с;
Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. – 2-е изд., перераб. и доп. – М.: Дело, 2002. – 208 с;
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб.- 6-е изд., перераб. и доп. – М.: Дело, 2004. – 576 с;
Практикум по эконометрике: Учеб. пособие (под ред. И.И. Елисеевой). – М.: Финансы и статистика, 2001. – 192 с;
Эконометрика: Учебник (под ред. И.И. Елисеевой). – М.: Финансы и статистика, 2001. – 344 с.
- 1. Что такое эконометрика?
- 1. Что такое эконометрика?
- 2. Основные типы эконометрических моделей
- 2.1. Регрессионные модели с одним уравнением
- 2.2. Модели временных рядов
- 2.3. Системы одновременных уравнений
- 3. Однофакторная парная регрессионная модель
- 3.1. Функциональная спецификация модели
- 3.2. Парная линейная регрессия
- 4. Множественная регрессия
- 4.1. Нахождение оценок неизвестных параметров
- 4.2. Значимость модели множественной регрессии
- 4.3. Мультиколлинеарность
- 4.4. Гетероскедастичность
- 4.5. Автокорреляция
- 4.6 Фиктивные переменные
- 5. Реализация типовых задач на компьютере
- 5.1 Регрессионный анализ в ms Excel
- 5.2 Другие возможности ms Excel
- 5.3 Анализ полученной модели
- 6. Задачи
- Глоссарий
- Список вопросов к экзамену (зачету)