logo search
Metodicheskie_ukazania_po_kursu

4.6 Фиктивные переменные

При построении моделей часто приходится учитывать не только количественные, но и качественные признаки. Например, при исследовании стоимости квартиры от различных факторов может возникнуть вопрос, влияет ли на цену квартиры наличие лифта в доме, телефона или балкона. Часто в качестве фиктивных переменных используют пол (мужской или женский), уровень образования и т.д.

Для ввода таких переменных в модель качественным признакам необходимо присвоить количественные значения. Чаще всего для ввода фиктивных переменных используют переменные бинарного типа “0-1”.

Например, переменная lift описывает наличие или отсутствие лифта в доме, тогда она может принимать значения:

(4.6.1)

Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменой при переходе от одной категории (нет лифта) к другой (есть лифт).

Значимость коэффициентов при фиктивных переменных определяется с помощью t – критерия Стьюдента.

Часто фиктивные переменные используются для выявления сезонности для временных рядов.

Пусть – приток туристов в Сочи в месяц t. Очевидно, что количество отдыхающих в Сочи зависит от времени года. Для выявления влияния сезонности можно ввести три бинарные переменных :

, если месяц t зимний и 0 в остальных случаях

, если месяц t весенний и 0 в остальных случаях

, если месяц t летний и 0 в остальных случаях

и оценивать уравнение (4.6.2)

Необходимо отметить, что в уравнение не вводится четвертая переменная , относящаяся к осени, т.к. тогда выполнялось бы тождество

(4.6.3),

что привело бы к линейной зависимости регрессоров и как следствие невозможности однозначного получения оценок МНК.

Интерпретация коэффициентов регрессии:

– среднее потребление для осенних месяцев;

– для зимних;

– для весенних;

– для летних.

Контрольные вопросы

1. В каком случае применяются модели множественной регрессии? Какие переменные входят в состав данных переменных?

2. Какие виды функций наиболее часто применяют на практике при построении моделей множественной регрессии? Приведите реальные примеры использования данных моделей.

3. Какие требования предъявляются к объясняющим переменным? Какие могут быть последствия при несоблюдении данных требований?

4. Каким методом находятся оценки неизвестных параметров в моделях множественной регрессии?

5. Каким условиям должны удовлетворять оценки коэффициентов в регрессионной модели?

6. Какой показатель используется для оценки качества подгонки модели к исходным данным? Каковы его свойства?

7. Каким образом можно устранить эффект, вызывающий рост коэффициента детерминации при увеличении числа регрессоров?

8. Какие тесты используются для оценки значимости модели и оценки значимости коэффициентов?

9. Какой возникает эффект при наличии сильной линейной статистической зависимости между факторами?

10. Что может вызвать эффект гетероскедастичности? Какое свойство оценок теряется при нарушении гомоскедастичности? Как оценить и исключить гетероскедастичность?

11. Что такое автокорреляция?

12. Как учесть качественные признаки в уравнении регрессии?

13. Влияние качества определенного вида продукции (Q) предприятия ЗАО “Колбасы” и времени ее изготовления (Т) на стоимость продукции (Р) описывается регрессионной моделью, построенной на основе тридцати статистических данных, собранных в декабре 2010 года: . Найдены оценки коэффициентов методом наименьших квадратов: a=3,80, b=2,15, с=0,91.

а) можно ли принять гипотезу о значимости коэффициента с с уровнем значимости 0,01, если расчетное значение t – статистики для показателя времени изготовления продукции (Т) равно 3,71, а критическое значение t – статистики из таблицы Стьюдента равно 2,6?

б) исходя из полученного коэффициента детерминации, равного 0,79, оцените соответствие построенной модели выборочным данным;

в) оцените значимость уравнения, если расчетное значение F – статистики Фишера равно 11,5, а табличное значение статистики Фишера с доверительной вероятностью 95% равно 3,81?

г) интерпретируйте полученные результаты;

д) как изменится стоимость конечной продукции, если время изготовления сократится в 2 раза?

14. Исследуется влияние размера заработной платы (L) и объема основных фондов (K) на машиностроительных предприятиях области на объем производимой продукции (Q). В результате исследования была построена регрессии на 25 наблюдениях , и найдены оценки ее коэффициентов методом наименьших квадратов: а=10,04, b=2,99, с=1,5.

а) можно ли принять гипотезу о значимости коэффициента b с уровнем значимости 0,01, если расчетное значение t – статистики для показателя объема основных фондов (K) равно 1,70, а критическое значение t – статистики из таблицы Стьюдента равно 2,53?

б) исходя из полученного коэффициента детерминации, равного 0,39, оцените соответствие построенной модели выборочным данным;

в) оцените значимость уравнения, если расчетное значение F – статистики Фишера равно 2,15, а табличное значение статистики Фишера с доверительной вероятностью 95% равно 3,59?

г) интерпретируйте полученные результаты;

д) как изменится стоимость конечной продукции, если заработная плата возрастет в 1,5 раза?

Тестовые вопросы

1. Переход к стандартизированному уравнению регрессии осуществляется для

  1. сравнения влияния факторов на результирующий признак;

  2. приведения уравнения регрессии к нормальному виду;

  3. линеаризации модели.

2. Если в исследуемое уравнение регрессии добавить новый фактор , то

  1. новой модели не изменится;

  2. новой модели не увеличится;

  3. новой модели не уменьшится.

3. Если не выполнено предположение о сильной статистической независимости факторов, то присутствует эффект

  1. гетероскедастичности;

  2. гомоскедастичности;

  3. мультиколлинеарности.

4. Если значение выборочного коэффициента корреляции =-0,9, то

  1. связь между факторами слабая и обратная;

  2. связь между факторами сильная и обратная;

  3. связь между факторами слабая и прямая.

5. Если в регрессионной модели присутствует эффект гетероскедастичности, то нарушено условие

  1. постоянства дисперсии остатков;

  2. несмещенности оценок.

  3. сильной статистической зависимости между регрессорами.

6. Если статистика =2, то

  1. корреляция в остатках регрессии отсутствует;

  2. корреляция в остатках регрессии положительная;

  3. корреляция в остатках регрессии отрицательная.

7. Была оценена регрессия , t – статистики для коэффициентов =2,65, = 2,85, если =2,77, тогда

  1. оба коэффициента незначимы;

  2. коэффициент незначим, коэффициент значим;

  3. коэффициент значим, коэффициент незначим.

Список литературы

  1. Айвазян С.А. Основы эконометрики: Учебник для вузов, т.2. – М.: ЮНИТИ – ДАНА, 2001. – 432 с;

  2. Айвазян С.А., Мхитрян В.С. Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998;

  3. Берндт Э. Практика эконометрики: классика и современность. – М.: ЮНИТИ, 2005;

  4. Бородич С.А. Эконометрика. – Минск: Новое знание, 2001;

  5. Доугерти К. Введение в эконометрику: Перев. с англ. – М.: ИНФРА – М, 1997. – 402 с;

  6. Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. – 2-е изд., перераб. и доп. – М.: Дело, 2002. – 208 с;

  7. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб.- 6-е изд., перераб. и доп. – М.: Дело, 2004. – 576 с;

  8. Практикум по эконометрике: Учеб. пособие (под ред. И.И. Елисеевой). – М.: Финансы и статистика, 2001. – 192 с;

  9. Эконометрика: Учебник (под ред. И.И. Елисеевой). – М.: Финансы и статистика, 2001. – 344 с.