1.6. Нелинейная регрессия
До сих пор мы рассматривали лишь линейнуюмодель регрессионной зависимостиуотх(3). В то же время многие важные связи в экономике являются нелинейными.Примерами такого рода регрессионных моделей являются производственные функции (зависимости между объемом произведенной продукции и основными факторами производства - трудом, капиталом и т.п.) и функции спроса (зависимости между спросом на какой-либо вид товаров или услуг, с одной стороны, и доходом и ценами на этот и другие товары - с другой).
При анализе нелинейных регрессионных зависимостей наиболее важным вопросом применения классического МНК является способ их линеаризации. В случае линеаризации нелинейной зависимости получаем линейное регрессионное уравнение типа (3), параметры которого оцениваются обычным МНК, после чего можно записать исходное нелинейное соотношение.
Несколько особняком в этом смысле стоит полиномиальная модель произвольной степени:
(34)
к которой обычный МНК можно применять без всякой предварительной линеаризации.
Рассмотрим указанную процедуру применительно к параболе второй степени:
(35)
Такая зависимость целесообразна в случае, если для некоторого интервала значений фактора возрастающая зависимость меняется на убывающую или наоборот. В этом случае можно определить значение фактора, при котором достигается максимальное или минимальное значение результативного признака. Если исходные данные не обнаруживают изменение направленности связи, параметры параболы становятся трудно интерпретируемыми, и форму связи лучше заменить другими нелинейными моделями.
Применение МНК для оценки параметров параболы второй степени сводится к дифференцированию суммы квадратов остатков регрессии по каждому из оцениваемых параметров и приравниванию полученных выражений нулю. Получается система нормальных уравнений, число которых равно числу оцениваемых параметров, т.е. трем:
(36)
Решать эту систему можно любым способом, в частности, методом определителей.
Экстремальное значение функции наблюдается при значении фактора, равном:
.
Если b>0, с<0,имеет место максимум, т.е. зависимость сначала растет, а затем падает. Такого рода зависимости наблюдаются в экономике труда при изучении заработной платы работников физического труда, когда в роли фактора выступает возраст. Приb<0, с>0парабола имеет минимум, что обычно проявляется в удельных затратах на производство в зависимости от объема выпускаемой продукции.
В нелинейных зависимостях, не являющихся классическими полиномами, обязательно проводится предварительная линеаризация, которая заключается в преобразовании или переменных, или параметров модели, или в комбинации этих преобразований. Рассмотрим некоторые классы таких зависимостей.
Зависимости гиперболического типа имеют вид:
(37)
Примером такой зависимости является кривая Филлипса, констатирующая обратную зависимость процента прироста заработной платы от уровня безработицы. В этом случае значение параметра bбудет больше нуля. Другим примером зависимости (37) являются кривые Энгеля, формулирующие следующую закономерность: с ростом дохода доля доходов, расходуемых на продовольствие, уменьшается, а доля доходов, расходуемых на непродовольственные товары, будет возрастать. В этом случаеb<0, а результативный признак в (37) показывает долю расходов на непродовольственные товары.
Линеаризация уравнения (37) сводится к замене фактора z=1/х, и уравнение регрессии имеет вид (3), в котором вместо факторахиспользуем факторz:
(38)
К такому же линейному уравнению сводится полулогарифмическая кривая:
(39)
которая может быть использована для описания кривых Энгеля. Здесь 1п(х)заменяется наz, и получается уравнение (38).
Достаточно широкий класс экономических показателей характеризуется приблизительно постоянным темпом относительного прироста во времени. Этому соответствуют зависимости показательного (экспоненциального) типа, которые записываются в виде:
(40)
или в виде
(41)
Возможна такая зависимость:
(42)
В регрессиях типа (40) - (42) применяется один и тот же способ линеаризации - логарифмирование. Уравнение (40) приводится к виду:
(43)
Замена переменной Y =ln усводит его к линейному виду:
(44)
где .ЕслиЕудовлетворяет условиям Гаусса-Маркова, параметры уравнения (40) оцениваются по МНК из уравнения (44). Уравнение (41) приводится к виду:
(45)
который отличается от (43) только видом свободного члена, и линейное уравнение выглядит так:
Y=A+bx+E (46)
где A=lna. ПараметрыАиbполучаются обычным МНК, затем параметрав зависимости (41) получается как антилогарифмА.При логарифмировании (42) получаем линейную зависимость:
Y=A+Bx+E (47)
где B=lnb, а остальные обозначения те же, что и выше. Здесь также применяется МНК к преобразованным данным, а параметрbдля (42) получается как антилогарифм коэффициентаВ.
Широко распространеныв практике социально-экономических исследований степенные зависимости. Они используются для построения и анализа производственных функций. В функциях вида:
(48)
особенно ценным является то обстоятельство, что параметр b равен коэффициенту эластичности результативного признака по факторух.Преобразуя (48) путем логарифмирования, получаем линейную регрессию:
Y=A+bX+E(49)
где Y=lny, A=lna, X=lnx, E=lnε.
Еще одним видом нелинейности, приводимым к линейному виду, является обратная зависимость:
(50)
Проводя замену и=1/у, получим:
(51)
Наконец, следует отметить зависимость логистического типа:
(52)
Графиком функции (52) является так называемая «кривая насыщения», которая имеет две горизонтальные асимптоты у=0 иу=1/аи точку перегибаx=ln(b/a), у=1/(2а), а также точку пересечения с осью ординату=1/(а+b):
Уравнение (52) приводится к линейному виду заменами переменных и=1/у, z=e-x.
Любое уравнение нелинейной регрессии, как и линейной зависимости, дополняется показателем корреляции, который в данном случае называется индексом корреляции:
(53)
Здесь - общая дисперсиярезультативногопризнакау, остаточная дисперсия, определяемая по уравнению нелинейной регрессии. Следует обратить внимание на то, что разности в соответствующих суммахиберутся не в преобразованных, а в исходных значениях результативного признака. Иначе говоря, при вычислении этих сумм следует использовать не преобразованные (линеаризованные) зависимости, а именно исходные нелинейные уравнения регрессии. По-другому (53) можно записать так:
(54)
Величина Rнаходится в границах 0 ≤R ≤1, и чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии. При этом индекс корреляции совпадает с линейным коэффициентом корреляции в случае, когда преобразование переменных с целью линеаризации уравнения регрессии не проводится с величинами результативного признака. Так обстоит дело с полулогарифмической и полиномиальной регрессией, а также с равносторонней гиперболой (37). Определив линейный коэффициент корреляции для линеаризованных уравнений, например, н пакетеExcelс помощью функции ЛИНЕЙН, можно использовать его и для нелинейной зависимости.
Иначе обстоит дело в случае, когда преобразование проводится также с величиной у,например, взятие обратной величины или логарифмирование. Тогда значениеR,вычисленное той же функцией ЛИНЕЙН, будет относиться к линеаризованному уравнению регрессии, а не к исходному нелинейному уравнению, и величины разностей под суммами в (54) будут относиться к преобразованным величинам, а не к исходным, что не одно и то же. При этом, как было сказано выше, для расчетаRследует воспользоваться выражением (54), вычисленным по исходному нелинейному уравнению.
Поскольку в расчете индекса корреляции используется соотношение факторной и общей СКО, то R2имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величинуR2для нелинейных связей называют индексом детерминации.
Оценка существенности индекса корреляции проводится так же, как и оценка надежности коэффициента корреляции.
Индекс детерминации используется для проверки существенности в целом уравнения нелинейной регрессии по F-критерию Фишера:
(55)
где n-число наблюдений,m-число параметров при переменныхх.Во всех рассмотренных нами случаях, кроме полиномиальной регрессии,m=1, для полиномов (34)m=k, т.е. степени полинома. Величинатхарактеризует число степеней свободы для факторной СКО, а(п-т-1) -число степеней свободы для остаточной СКО.
Индекс детерминации R2можно сравнивать с коэффициентом детерминацииr2для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем больше разница междуR2иr2.Близость этих показателей означает, что усложнять форму уравнения регрессии не следует и можно использовать линейную функцию. Практически, если величина(R2-r2) не превышает 0,1, то линейная зависимость считается оправданной. В противном случае проводится оценка существенности различия показателей детерминации, вычисленных по одним и тем же данным, черезt-критерий Стьюдента:
(56)
Здесь в знаменателе находится ошибка разности (R2-r2),определяемая по формуле:
(57)
Если t >tтабл(α;n-m-1),то различия между показателями корреляции существенны и замена нелинейной регрессии линейной нецелесообразна.
В заключение приведем формулы расчета коэффициентов эластичности для наиболее распространенных уравнений регрессии:
-
Вид уравнения регрессии
Коэффициент эластичности
y=a+b·x+ε
y=a+b·x+cx2+ε
y=a·bx·ε
x lnb
y=a·xb
b
y=a+blnx+ε
- Isbn 5-8399-0094-х
- Содержание
- Введение
- Парная регрессия
- 1.1. Спецификация модели
- 1.2. Оценка параметров линейной регрессии
- 1.3. Предпосылки мнк (условия Гаусса-Маркова)
- 1.4. Оценка существенности параметров линейной регрессии и корреляции
- 1.5. Интервалы прогноза по линейному уравнению регрессии
- 1.6. Нелинейная регрессия
- 11. Модель множественной регрессии
- 2.1. Оценка параметров линейного уравнения множественной регрессии
- 2.2 Частные уравнения регрессии
- 2.3. Анализ качества эмпирического уравнения множественной линейной регрессии
- 2.4. Спецификация модели
- 2.5. Гетероскедастичность
- 2.6. Автокорреляция остатков
- 2.7. Фиктивные переменные в регрессионных моделях
- III. Системы эконометрических уравнений
- 3.1. Структурная и приведенная формы модели
- 3.2. Проблема идентификации
- 3.3. Оценивание параметров структурной модели
- 3.4. Применение систем эконометрических уравнений |
- IV. Временные ряды в эконометрических исследованиях
- 4.1. Выявление структуры временного ряда
- 4.2. Динамические эконометрические модели
- Список учебной литературы