logo search
Voprosy_po_ekonometrike_2012_1

Замещающие переменные. Фиктивные переменные.

Часто бывает, что вы не можете найти данных по переменной, которую хо­телось бы включить в уравнение регрессии. Некоторые переменные, относящи­еся к социально-экономическому положению или к качеству образования, имеют такое расплывчатое определение, что их в принципе даже невозможно изме­рить. Другие могут поддаваться измерению, но оно требует столько времени и энергии, что на практике их приходится отбрасывать. Иногда вы можете быть расстроены тем, что пользуетесь какими-то данными, собранными другим человеком, в которых (с вашей точки зрения) опущена важная переменная.

Независимо от причины обычно бывает полезно вместо отсутствующей пе­ременной использовать некоторый ее заменитель (proxy), а не пренебрегать ею совершенно. В качестве показателя общего социально-экономического положе­ния вы можете использовать его заменитель — показатель дохода, если данные о нем имеются. В качестве показателя качества образования можно использовать отношение числа преподавателей и сотрудников к числу студентов или расхо­ды на одного студента. Вместо переменной, опущенной в каком-либо обзоре, вы можете обратиться к другим, уже фактически собранным данным, если в них имеется подходящая замещающая переменная.

Имеются две причины для поиска такой переменной. Во-первых, если вы просто опустите важную переменную, то регрессия может пострадать от сме­щения оценок, описанного выше, и статистическая проверка будет не­полноценной. Во-вторых, результаты оценки регрессии с включением замеща­ющей переменной могут дать косвенную информацию о той переменной, ко­торая замещена данной переменной.

Иногда случается, что вы используете замещающую переменную, не осоз­навая этого. Вы полагаете, что у зависит от z, а в действительности эта величи­на зависит от х.

Если корреляция между величинами z и х незначительна, то результаты бу­дут плохими, и вы поймете, что тут что-то неладно. Но если корреляция тес­ная, то результаты окажутся удовлетворительными (коэффициент R2 будет бли­зок к желаемому уровню и т. п.), и вы можете даже не подозревать, что полу­ченное соотношение неверно.

Имеет ли это какое-то значение? Это, во-первых, зависит от того, с какой целью вы строите данную регрессию. Если целью оценивания регрессии явля­ется предсказание будущих значений величины у, то использование замещаю­щей переменной не будет иметь большого значения при условии, конечно, что корреляция тесная и не является в то же время статистической счастливой слу­чайностью. Однако если вы намерены использовать объясняющую переменную в качестве инструмента экономической политики для оказания влияния на по­ведение зависимой переменной, то последствия могут оказаться катастрофи­ческими. Если только не будет функциональной связи между замещающей пе­ременной и истинной объясняющей переменной, манипулирование замещаю­щей переменной не окажет никакого влияния на зависимую переменную. Если мотивом построения регрессии является чисто научное любопытство, то исход будет столь же неудовлетворительным.

Непреднамеренное использование замещающих переменных особенно рас­пространено при анализе временных рядов, в частности в макроэкономических моделях. Если истинная объясняющая переменная имеет временной тренд, то вы, вероятно, получите хорошую оценку формулы, если замените (преднаме­ренно или нет) ее на любую другую переменную с временным трендом. Даже если вы связываете приращения зависимой переменной с приращениями объяс­няющей переменной, вы, вероятно, получите аналогичные результаты незави­симо от того, используется ли правильная объясняющая переменная или же замещающая переменная, поскольку макроэкономические переменные обыч­но изменяются взаимосвязанно, в соответствии с экономическим циклом.

Фиктивная переменная – это атрибутивная или качественная, факторная переменная, которая представлена с помощью определенного цифрового кода.

При исследовании влияния качественных признаков в модель следует вводить фиктивные переменные, принимающие, как правило два значения: 1, если данный признак присутствует в наблюдении; 0 — при его отсутствии.

Если включаемый в рассмотрение качественный признак име­ет не два, а несколько значений, то используют несколько фиктив­ных переменных, число которых должно быть на единицу меньше числа значений признака. При назначении фиктивных переменных исследуемая совокупность по числу значений качественного при­знака разбивается на группы. Одну из групп выбирают как эталон­ную и определяют фиктивные переменные для остальных.

Если качественный признак имеет 2 значения, то это можно отразить, введя 1 фиктивную переменную. Например, строится модель, характеризующая показатели предприятий двух отраслей промышленности: электроэнергетики и газовой промышленности. Вводится фиктивная переменная, которой присваивается значе­ние 0, если данные относятся к предприятиям электроэнергети­ки, и значение 1, если данные относятся к предприятиям газовой промышленности.

Если качественный признак имеет 3 значения, то это можно отразить, введя 2 фиктивных переменных. Например, строится модель, характеризующая показатели предприятий 3 регионов. Вводится 1 фиктивная переменная, которой присваивается значе­ние 0, если данные относятся к предприятиям первого региона, и значение 1, если данные относятся к предприятиям двух других регионов. Второй фиктивной переменной присваивается значение О, если данные относятся ко второму региону, и 1, если данные относятся к первому и третьему регионам.

Введение в регрессию фиктивных переменных существенно улучшает качество оценивания.