logo
Измерение взаимосвязей экономических переменных в различных ситуациях

11. Линейные регрессионные модели с переменной структурой. Фиктивные переменные. Критерий Г. Чоу

До сих пор мы рассматривали регрессионную модель, в которой в качестве объясняющих переменных (регрессоров) выступали количественные переменные (производительность труда, себестоимость продукции, доход и т. п.). Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней (градаций). К числу таких признаков можно отнести: пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т. п.

Качественные признаки могут существенно влиять на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или построении регрессионных моделей по неоднородным данным.

Например, нам надо изучить зависимость размера заработной платы Y работников не только от количественных факторов Х1, X2,,.., Хn, но и от качественного признака Z1 (например, фактора «пол работника»).

В принципе можно было получить оценки регрессионной модели

(11.1)

для каждого уровня качественного признака (т. е. выборочное уравнение регрессии отдельно для работников-мужчин и отдельно -- для женщин), а затем изучать различия между ними.

Но есть и другой подход, позволяющий оценивать влияние значений количественных переменных и уровней качественных признаков с помощью одного уравнения регрессии. Этот подход связан с введением так называемых фиктивных (манекенных) переменных, или манекенов.

В качестве фиктивных переменных обычно используются дихотомические (бинарные, булевы) переменные, которые принимают всего два значения: «0» или «1» (например, значение такой переменной Z1 по фактору «пол»: Z1= 0 для работников-женщин и Z1=1 -- для мужчин).

В этом случае первоначальная регрессионная модель заработной платы изменится и примет вид:

(11.2)

если i-й работник мужского пола

если i-й работник мужского пола

Таким образом, принимая модель , мы считаем, что средняя заработная плата у мужчин на выше , чем у женщин, при неизменных значениях других параметров модели. А проверяя гипотезу мы можем установить существенность влияния фактора «пол» на размер заработной платы работника.

В практике эконометриста нередки случаи, когда имеются две выборки пар значений зависимой и объясняющих переменных (хi, yi). Например, одна выборка пар значений переменных объемом п получена при одних условиях, а другая, объемом n2, -- при несколько измененных условиях. Необходимо выяснить, действительно ли две выборки однородны в регрессионном смысле? Другими словами, можно ли объединить две выборки в одну и рассматривать единую модель регрессии Y по X?

При достаточных объемах выборок можно было, например, построить интервальные оценки параметров регрессии по каждой из выборок и в случае пересечения соответствующих доверительных интервалов сделать вывод о единой модели регрессии. Возможны и другие подходы. В случае, если объем хотя бы одной из выборок незначителен, то возможности такого (и аналогичных) подходов резко сужаются из-за невозможности построения сколько-нибудь надежных оценок.