logo
УДК 330-8

1.1. Спецификация модели

Регрессияпредставляет собой зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от функциональной зависимости, когда каждому значению независимой переменнойхсоответствует одно определенное значение величиныу, при регрессионной связи одному и тому же значениюх могут соответствовать в зависимости от случая различные значения величиныу.

В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.

Простая регрессия представляет собой регрессию между двумя переменными - уих, т.е. модель вида:

, (1)

где у -зависимая переменная (результативный признак);х -независимая, или объясняющая переменная (признак-фактор, или регрессор).

Множественная регрессияпредставляет собой регрессию результативного признака с двумя и большим числом факторов, т.е. модель вида:

. (2)

Любое эконометрическое исследование начинается со спецификации модели,т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными.

Из всего круга факторов, влияющих на результативный признак, необходимо выделить наибольшие, существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Например, выдвигается гипотеза о том, что величина спроса на товар находится в обратной зависимости от цены х, т.е. .

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как закономерность лишь в среднемпо совокупности наблюдений. (Например, если зависимость спросауот ценых: у = 5000 – 2·х означает, что с ростом цены на 1 д.е. спрос в среднем уменьшается на 2 д.е.).

В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи. В каждом отдельном случае величина ускладывается из двух слагаемых:

,

где yj- фактическое значение результативного признака;- значение признака, найденное из математической функции связи у и х, т.е. из уравнения регрессии;– случайная величина, характеризующая отклонение реального значения признака от найденного по уравнению регрессии.

Случайная величина εназывается также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее порождают 3 источника: спецификация модели, выборочный характер исходных данных и ошибки измерения.

Например, зависимость спроса от цены точнее следует записывать так:

В данном случае слева записано просто у,что означает фактическое значение, а не ,отвечающее значению, рассчитанному по уравнению регрессии.

Ошибки спецификации.Это прежде всего неправильно выбранная форма модели. В частности, зависимость спроса от цены может быть выражена линейно

,

но возможны и другие соотношения, например

, , .

Ошибки спецификации тем меньше, чем в большей мере теоретические значения признака подходят к фактическим данным.

К ошибкам спецификации относится также недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной. Например, спрос на конкретный товар может определяться не только ценой, но и доходом надушу населения.

Ошибки выборки.Исследователь при установлении связи между признаками имеет дело с выборочными данными. При изучении экономических процессов данные в исходной совокупности часто являются неоднородными. В этом случае уравнение регрессии не имеет практического смысла. Поэтому для получения хорошего результата из выборки исключают единицы с аномальными значениями исследуемых признаков.

Ошибки измерения.Представляют наибольшую опасность в практическом использовании методов регрессии. Ошибки спецификации можно уменьшить, изменяя форму модели, ошибки выборки - увеличивая объем исходных данных, ошибки измерения сводят на нет все усилия по количественной оценке связи между признаками. Например, статистическое измерение дохода на душу населения может иметь ошибку в результате наличия сокрытых доходов. Другой пример: органы государственной статистики получают балансы предприятий, достоверность которых никто не подтверждает.

В эконометрических исследованиях предполагается, что ошибки измерения сведены к минимуму. Поэтому основное внимание уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции (1) может быть осуществлен тремя методами: графическим, аналитическим и экспериментальным.

Графический методдостаточно нагляден. Он основан на поле корреляции. Рассмотрим типы кривых.

Используются и другие типы кривых:

; ;; ; ; .

Аналитический методвыбора типа уравнения регрессии основан на изучении материальной природы связи исследуемых признаков.

Пусть, например, изучается потребность предприятия в электроэнергии у в зависимости от объема выпускаемой продукциих.Все потребление электроэнергии можно подразделить на 2 части:

- не связанное с производством продукции a;

-непосредственно связанное с объемом выпускаемой продукции, пропорционально возрастающее с увеличением объема выпускаbx;

Тогда зависимость потребления электроэнергии от объема продукции можно выразить уравнением регрессии вида:

Разделив на х, получим удельный расход электроэнергии на единицу продукцииzx=у/х;

Это равносторонняя гипербола.

Аналогично затраты предприятия могут быть условно-переменные, изменяющиеся пропорционально изменению объема продукции (расход материала, оплата труда и др.) и условно-постоянные, не изменяющиеся с изменением объема производства (арендная плата, содержание администрации и др.). Соответствующая зависимость затрат на производство yот объема продукцииххарактеризуется линейной функцией.

y=a+bx,

а зависимость себестоимости единицы продукции zxот объема продукции - равносторонней гиперболой:

Экспериментальный методиспользуется при обработке информации на компьютере путем сравнения величины остаточной дисперсииDост,рассчитанной на разных моделях. В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих, не учитываемых в уравнении регрессии факторов:

Чем меньше Dост,тем меньше наблюдается влияние прочих факторов, тем лучше уравнение регрессии подходит к исходным данным. При обработке данных на компьютере разные математические функции перебираются в автоматическом режиме, и из них выбирается та, для которойDост является наименьшей.

Если Dостпримерно одинакова для нескольких функций, то на практике выбирают более простую, так как она в большей степени поддается интерпретации и требует меньшего объема наблюдений. Результаты многих исследований подтверждают, что число наблюдений должно в 6-7 раз превышать число рассчитываемых параметров при переменнойх.Это означает, что искать линейную регрессию, имея менее 7 наблюдений, вообще не имеет смысла. Если вид функции усложняется, то требуется увеличение объема наблюдений. Для рядов динамики, ограниченных по протяженности - 10, 20, 30 лет, - предпочтительна модель с меньшим числом параметров прих.