logo
УДК 330-8

1.6. Нелинейная регрессия

До сих пор мы рассматривали лишь линейнуюмодель регрессионной зависимостиуотх(3). В то же время многие важные связи в экономике являются нелинейными.Примерами такого рода регрессионных моделей являются производственные функции (зависимости между объемом произведенной продукции и основными факторами производства - трудом, капиталом и т.п.) и функции спроса (зависимости между спросом на какой-либо вид товаров или услуг, с одной стороны, и доходом и ценами на этот и другие товары - с другой).

При анализе нелинейных регрессионных зависимостей наиболее важным вопросом применения классического МНК является способ их линеаризации. В случае линеаризации нелинейной зависимости получаем линейное регрессионное уравнение типа (3), параметры которого оцениваются обычным МНК, после чего можно записать исходное нелинейное соотношение.

Несколько особняком в этом смысле стоит полиномиальная модель произвольной степени:

(34)

к которой обычный МНК можно применять без всякой предварительной линеаризации.

Рассмотрим указанную процедуру применительно к параболе второй степени:

(35)

Такая зависимость целесообразна в случае, если для некоторого интервала значений фактора возрастающая зависимость меняется на убывающую или наоборот. В этом случае можно определить значение фактора, при котором достигается максимальное или минимальное значение результативного признака. Если исходные данные не обнаруживают изменение направленности связи, параметры параболы становятся трудно интерпретируемыми, и форму связи лучше заменить другими нелинейными моделями.

Применение МНК для оценки параметров параболы второй степени сводится к дифференцированию суммы квадратов остатков регрессии по каждому из оцениваемых параметров и приравниванию полученных выражений нулю. Получается система нормальных уравнений, число которых равно числу оцениваемых параметров, т.е. трем:

(36)

Решать эту систему можно любым способом, в частности, методом определителей.

Экстремальное значение функции наблюдается при значении фактора, равном:

.

Если b>0, с<0,имеет место максимум, т.е. зависимость сначала растет, а затем падает. Такого рода зависимости наблюдаются в экономике труда при изучении заработной платы работников физического труда, когда в роли фактора выступает возраст. Приb<0, с>0парабола имеет минимум, что обычно проявляется в удельных затратах на производство в зависимости от объема выпускаемой продукции.

В нелинейных зависимостях, не являющихся классическими полиномами, обязательно проводится предварительная линеаризация, которая заключается в преобразовании или переменных, или параметров модели, или в комбинации этих преобразований. Рассмотрим некоторые классы таких зависимостей.

Зависимости гиперболического типа имеют вид:

(37)

Примером такой зависимости является кривая Филлипса, констатирующая обратную зависимость процента прироста заработной платы от уровня безработицы. В этом случае значение параметра bбудет больше нуля. Другим примером зависимости (37) являются кривые Энгеля, формулирующие следующую закономерность: с ростом дохода доля доходов, расходуемых на продовольствие, уменьшается, а доля доходов, расходуемых на непродовольственные товары, будет возрастать. В этом случаеb<0, а результативный признак в (37) показывает долю расходов на непродовольственные товары.

Линеаризация уравнения (37) сводится к замене фактора z=1/х, и уравнение регрессии имеет вид (3), в котором вместо факторахиспользуем факторz:

(38)

К такому же линейному уравнению сводится полулогарифмическая кривая:

(39)

которая может быть использована для описания кривых Энгеля. Здесь 1п(х)заменяется наz, и получается уравнение (38).

Достаточно широкий класс экономических показателей характеризуется приблизительно постоянным темпом относительного прироста во времени. Этому соответствуют зависимости показательного (экспоненциального) типа, которые записываются в виде:

(40)

или в виде

(41)

Возможна такая зависимость:

(42)

В регрессиях типа (40) - (42) применяется один и тот же способ линеаризации - логарифмирование. Уравнение (40) приводится к виду:

(43)

Замена переменной Y =ln усводит его к линейному виду:

(44)

где .ЕслиЕудовлетворяет условиям Гаусса-Маркова, параметры уравнения (40) оцениваются по МНК из уравнения (44). Уравнение (41) приводится к виду:

(45)

который отличается от (43) только видом свободного члена, и линейное уравнение выглядит так:

Y=A+bx+E (46)

где A=lna. ПараметрыАиbполучаются обычным МНК, затем параметрав зависимости (41) получается как антилогарифмА.При логарифмировании (42) получаем линейную зависимость:

Y=A+Bx+E (47)

где B=lnb, а остальные обозначения те же, что и выше. Здесь также применяется МНК к преобразованным данным, а параметрbдля (42) получается как антилогарифм коэффициентаВ.

Широко распространеныв практике социально-экономических исследований степенные зависимости. Они используются для построения и анализа производственных функций. В функциях вида:

(48)

особенно ценным является то обстоятельство, что параметр b равен коэффициенту эластичности результативного признака по факторух.Преобразуя (48) путем логарифмирования, получаем линейную регрессию:

Y=A+bX+E(49)

где Y=lny, A=lna, X=lnx, E=lnε.

Еще одним видом нелинейности, приводимым к линейному виду, является обратная зависимость:

(50)

Проводя замену и=1/у, получим:

(51)

Наконец, следует отметить зависимость логистического типа:

(52)

Графиком функции (52) является так называемая «кривая насыщения», которая имеет две горизонтальные асимптоты у=0 иу=1/аи точку перегибаx=ln(b/a), у=1/(2а), а также точку пересечения с осью ординату=1/(а+b):

Уравнение (52) приводится к линейному виду заменами переменных и=1/у, z=e-x.

Любое уравнение нелинейной регрессии, как и линейной зависимости, дополняется показателем корреляции, который в данном случае называется индексом корреляции:

(53)

Здесь - общая дисперсиярезультативногопризнакау, остаточная дисперсия, определяемая по уравнению нелинейной регрессии. Следует обратить внимание на то, что разности в соответствующих суммахиберутся не в преобразованных, а в исходных значениях результативного признака. Иначе говоря, при вычислении этих сумм следует использовать не преобразованные (линеаризованные) зависимости, а именно исходные нелинейные уравнения регрессии. По-другому (53) можно записать так:

(54)

Величина Rнаходится в границах 0 ≤R1, и чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии. При этом индекс корреляции совпадает с линейным коэффициентом корреляции в случае, когда преобразование переменных с целью линеаризации уравнения регрессии не проводится с величинами результативного признака. Так обстоит дело с полулогарифмической и полиномиальной регрессией, а также с равносторонней гиперболой (37). Определив линейный коэффициент корреляции для линеаризованных уравнений, например, н пакетеExcelс помощью функции ЛИНЕЙН, можно использовать его и для нелинейной зависимости.

Иначе обстоит дело в случае, когда преобразование проводится также с величиной у,например, взятие обратной величины или логарифмирование. Тогда значениеR,вычисленное той же функцией ЛИНЕЙН, будет относиться к линеаризованному уравнению регрессии, а не к исходному нелинейному уравнению, и величины разностей под суммами в (54) будут относиться к преобразованным величинам, а не к исходным, что не одно и то же. При этом, как было сказано выше, для расчетаRследует воспользоваться выражением (54), вычисленным по исходному нелинейному уравнению.

Поскольку в расчете индекса корреляции используется соотношение факторной и общей СКО, то R2имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величинуR2для нелинейных связей называют индексом детерминации.

Оценка существенности индекса корреляции проводится так же, как и оценка надежности коэффициента корреляции.

Индекс детерминации используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера:

(55)

где n-число наблюдений,m-число параметров при переменныхх.Во всех рассмотренных нами случаях, кроме полиномиальной регрессии,m=1, для полиномов (34)m=k, т.е. степени полинома. Величинатхарактеризует число степеней свободы для факторной СКО, а(п-т-1) -число степеней свободы для остаточной СКО.

Индекс детерминации R2можно сравнивать с коэффициентом детерминацииr2для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем больше разница междуR2иr2.Близость этих показателей означает, что усложнять форму уравнения регрессии не следует и можно использовать линейную функцию. Практически, если величина(R2-r2) не превышает 0,1, то линейная зависимость считается оправданной. В противном случае проводится оценка существенности различия показателей детерминации, вычисленных по одним и тем же данным, черезt-критерий Стьюдента:

(56)

Здесь в знаменателе находится ошибка разности (R2-r2),определяемая по формуле:

(57)

Если t >tтабл(α;n-m-1),то различия между показателями корреляции существенны и замена нелинейной регрессии линейной нецелесообразна.

В заключение приведем формулы расчета коэффициентов эластичности для наиболее распространенных уравнений регрессии:

Вид уравнения регрессии

Коэффициент эластичности

y=a+b·x+ε

y=a+b·x+cx2

y=a·bx·ε

x lnb

y=a·xb

b

y=a+blnx+ε