logo
Основы эконометрического анализа

1.3 Спецификация модели парной линейной регрессии

В случае парной регрессии рассматривается один объясняющий фактор: через y обозначим изучаемый эконометрический показатель; через x -- объясняющий фактор. Эконометрическая модель, приводящая к парной регрессии, имеет следующий вид

y = f (x) + е,

где f(x) -- неизвестная функциональная зависимость (теоретическая регрессия); е -- возмущение, случайное слагаемое, представляющее собой совокупное действие не включенных в модель факторов, погрешностей.

Основная задача эконометрического моделирования -- построение по выборке эмпирической модели, выборочной парной регрессии

f (x), являющейся оценкой теоретической регрессии (функции f(x)):

y = f (x),

здесь f (x) -- эмпирическая (выборочная) регрессия, описывающая усредненную по x зависимость между изучаемым показателем и объясняющим фактором. После построения выборочной регрессии обычно производится верификация модели -- проверка статистической значимости и адекватности построенной парной регрессии имеющимся эмпирическим данным.

Экспериментальная основа построения парной эмпирической регрессии -- двумерная выборка:

(,),k,(,),

где n -- объем выборки (объем массива экспериментальных данных).

Основная задача спецификации модели -- выбор вида функциональной зависимости. В случае парной регрессии обычно рассматриваются функциональные зависимости следующего вида:

- линейная:

(1.3.3)

- полиномиальная

(1.3.4)

- степенная:

(1.3.5)

- экспоненциальная:

(1.3.6)

- логистическая:

(1.3.7)

Основные методы выбора функциональной зависимости f (x):

1) Геометрический;

2) Эмпирический;

3) Аналитический.

Геометрический метод выбора функциональной зависимости сводится к следующему. На координатной плоскости Oxy наносятся

Рисунок 1. Геометрический метод выбора функциональной зависимости

точки (, ), i = 1,K, n, соответствующие выборке. Полученное графическое изображение называется полем корреляции (диаграммой рассеяния).

Исходя из получившейся конфигурации точек, выбирается наиболее подходящий вид параметрической функциональной зависимости f(x). На рисунке 1.3.1 приведен пример поля корреляции для некоторой выборки объемом 11 наблюдений (каждому наблюдению соответствует одна точка) с графиками двух функциональных зависимостей -- линейной функции и параболы.

Эмпирический метод состоит в следующем. Выбирается некоторая параметрическая функциональная зависимость f(x) (см., например, 1.3.3-1.3.7). Для построения по выборке оценки f(x) этой зависимости чаще всего используется метод наименьших квадратов (МНК).

Согласно методу наименьших квадратов значения параметров функции f(x) (будем обозначать их через a, b) выбираются таким образом, чтобы сумма квадратов отклонений выборочных значений f(x) от значений f() была минимальной

, (1.3.8)

минимум ищется по параметрам a b , которые входят в зависимость f (x).

Найденные значения параметров, которые минимизируют указанную сумму квадратов разностей, называются оценками неизвестных параметров регрессии по методу наименьших квадратов (оценками МНК). Выборочная регрессия y = f (x) (или = f(), i = 1,K, n), в которую подставлены найденные значения, уже не содержит неизвестных параметров и является оценкой теоретической регрессии. Именно эту зависимость f(x) будем рассматривать как эмпирическую усредненную зависимость изучаемого показателя от объясняющего фактора.

После нахождения эмпирического уравнения регрессии вычисляются значения = f() и остатки = ?, i = 1, n . По величине n остаточной суммы квадратов

можно судить о качестве соответствия эмпирической функции f(x) имеющимся в наличии статистическим наблюдениям. Перебирая разные функциональные зависимости и, каждый раз, действуя подобным образом можно практически подобрать наиболее подходящую функцию для описания имеющихся данных.

Аналитический метод сводится к попытке выяснения содержательного смысла зависимости изучаемого показателя от объясняющего фактора и последующего выбора на этой основе соответствующей функциональной зависимости. Так, если y -- расходы фирмы, x -- объем выпущенной продукции за месяц, то нетрудно получить следующую модель зависимости расходов от объема выпущенной продукции:

y =б + в x+е,

где б -- условно-постоянные расходы, в x -- условно-переменные расходы.

В практике эконометрического анализа часто используют линейную парную регрессию. В модели парной линейной регрессии зависимость 1.3.1 между переменными представляется в виде

y =б + в x +е, (1.3.9)

т.е. теоретическая регрессия имеет вид 1.3.3.

На основе выборочных наблюдений оценка теоретической регрессии -- выборочная (эмпирическая) регрессия y строится в виде:

y = a + bx , (1.3.10)

где a,b являются оценками параметров б,в теоретической регрессии.