logo
УДК 330-8

2.1. Оценка параметров линейного уравнения множественной регрессии

Рассмотрим три метода расчета параметров множественной линейной регрессии.

1. Матричный метод.Представим данные наблюдений и параметры модели в матричной форме.

Y = [y1, y2,…,yn]'- п- мерный вектор - столбец наблюдений зависимой переменной;

В =[a, b1, b2, … bp]' - (р+1)- мерный вектор - столбец параметров уравнения регрессии (3);

e =[e1, e2, … en]' - n- мерный вектор - столбец отклонений выборочных значенийуi, от значений, получаемых по уравнению (4).

Для удобства записи столбцы записаны как строки и поэтому снабжены штрихом для обозначения операции транспонирования.

Наконец, значения независимых переменных запишем в виде прямоугольной матрицы размерности n (p+1):

Каждому столбцу этой матрицы отвечает набор из пзначений одного из факторов, а первый столбец состоит из единиц, которые соответствуют значениям переменной при свободном члене.

В этих обозначениях эмпирическое уравнение регрессии выглядит так:

Y=XB+e(6)

Отсюда вектор остатков регрессии можно выразить таким образом:

e=Y-XB(7)

Таким образом, функционал , который, собственно, и минимизируется по МНК, можно записать как произведение вектора – строкиe'на вектор – столбецe:

(8)

В соответствии с МНК дифференцирование Qпо векторуBприводит к выражению:

(9)

которое для нахождения экстремума следует приравнять к нулю. В результате преобразований получаем выражение для вектора параметров регрессии:

(10)

Здесь (X’X)-1- матрица, обратная кX' Х.

Пример. Бюджетное обследование пяти случайно выбранных семей дало следующие результаты (в тыс. руб.):

Семья

Накопления,

S

Доход,

Y

Имущество,

W

1

3

40

60

2

6

55

36

3

5

45

36

4

3,5

30

15

5

1,5

30

90

Оценить регрессию S наY и W. Введем обозначения:

S=[3;6;5;3,5;1,5]' - вектор наблюдений зависимой переменной;

B=[a; b1; b2]’вектор параметров уравнения регрессии:

- матрица значений независимых переменных.

Далее с помощью матричных операций вычисляем (используем табличный процессор MSExcelи функцииТРАНСП, МУМНОЖ и МОБРв нем):

;

Регрессионная модель в скалярном виде:

  1. Скалярный метод.При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии:

(11)

Решить эту систему можно любым подходящим способом, например, методом определителей или методом Гаусса. При небольшом количестве определяемых параметров использование определителей предпочтительнее.

Рассмотрим пример, приведенный выше. Здесь для двух факторов, YиW,система нормальных уравнений запишется так:

Рассчитываем значения сумм, получаем:

Рассчитаем значения определителей этой системы, используем функцию МОПРЕДвEXCEL:

Отсюда получим оценки параметров модели:

Обратите внимание, что коэффициенты в левой части системы нормальных уравнений совпадают с соответствующими элементами матрицы XX.

  1. Регрессионная модель в стандартизированном масштабе.

Уравнение регрессии в стандартизированном масштабе имеет вид:

(12)

где , - стандартизированные переменные:

,, (13)

для которых среднее значение равно нулю:

а среднее квадратическое отклонение равно единице:

- стандартизированные коэффициенты регрессии, илиβ– коэффициенты (не следует путать их с параметрами уравнения (2)).

Применяя МНК к уравнению (12), после соответствующих преобразований получим систему нормальных уравнений:

(14)

В этой системе,,- элементы расширенной матрицы парных коэффициентов корреляции или, другими словами, коэффициенты парной корреляции между различными факторами или между факторами и результативным признаком. Имея измеренные значения всех переменных, вычислить матрицу парных коэффициентов корреляции на компьютере не составляет большого труда, используя, например, табличный процессорMSExcelили программуStatistica.

Решением системы (14) определяются β-коэффициенты. Эти коэффициенты показывают, на сколько значений с.к.о. изменится в среднем результат, если соответствующий факторxjизменится на одну с.к.о. при неизменном среднем уровне других факторов. Поскольку все переменные заданы как центрированные и нормированные,β-коэффициенты сравнимы между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов обычной регрессии, которые несравнимы между собой.

Пусть функция издержек производства y(тыс. руб.) характеризуется уравнением вида:

у= 200 +1,2x1+ 1,1х2+ε,

где факторами являются основные производственные фонды (тыс. руб.) и численность занятых в производстве (чел.). Отсюда видно, что при постоянной занятости рост стоимости основных производственных фондов на 1 тыс. руб. влечет за собой увеличение затрат в среднем на 1,2 тыс. руб., а увеличение числа занятых на одного человека при неизменной технической оснащенности приводит к росту затрат в среднем на 1,1 тыс. руб. Однако это не означает, что первый фактор сильнее влияет на издержки производства по сравнению со вторым. Такое сравнение возможно, если обратиться к уравнению регрессии в стандартизованном масштабе. Пусть оно выглядит так:

Это означает, что с ростом первого фактора на одно с.к.о. при неизменном числе занятых затраты на продукцию увеличиваются в среднем на 0,5 с.к.о. Так как β12(0,5<0,8), то можно заключить, что большее влияние на производство продукции оказывает второй фактор, а не первый, как кажется из уравнения регрессии в натуральном масштабе.

В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции r.Подобно тому, как в парной зависимости коэффициенты регрессии и корреляции связаны между собой, так и во множественной регрессии коэффициенты «чистой» регрессииbjсвязаны сβ-коэффициентами:

(15)

Это позволяет от уравнения регрессии в стандартизованном масштабе:

(16)

переходить к уравнению регрессии в натуральном масштабе (4). Параметр аопределяется так:

(17)

Свободный член в уравнении (16) отсутствует, поскольку все стандартизованные переменные имеют нулевое среднее значение.

Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет использовать их при отсеве факторов - из модели исключаются факторы с наименьшим значением βj.

Компьютерные программы построения уравнения множественной регрессии в зависимости от использованного в них алгоритма решения позволяют получить либо только уравнение регрессии для исходных данных, либо, кроме того, уравнение регрессии в стандартизованном масштабе.

В заключение приведем расчет стандартизованного уравнения регрессии по данным рассмотренного выше числового примера. Используя функцию КОРРЕЛвExcel, рассчитаем расширенную матрицу парных коэффициентов корреляции:

,

в которой последний столбец состоит из элементов rSY()иrSW() соответственно, а неединичные элементы в первых Двух столбцах соответствуютrYW ().Эта матрица является расширенной матрицей системы уравнений для определенияβ-коэффициентов:

Решаем систему методом определителей, получаем:

Тогда стандартизированное уравнение регрессии запишется так:

Отсюда видно, что первый фактор оказывает большее воздействие на результат, чем второй (), однако эта разница не так велика, как для коэффициентов в натуральном масштабе (0,1229 и –0,0294). От этого уравнения можно перейти к уравнению в натуральном масштабе. Для этого с помощью функции СТАНДОТКЛОН в Excel определим стандартные отклонения всех переменных:

а с помощью функции СРЗНАЧ – среднее значения:

Далее определяем оценки параметров:

Эти значения оценок совпадают с оценками, полученными ранее.