logo
статистика экономическая - 2003

Парная линейная регрессия

Следующий этап исследования корреляционной связи заключается в том, чтобы описать зависимость признака-результата от признака-фактора некоторым аналитическим выражением.

,

где − средний уровень показателя y при данном значении x.

Если рассчитан коэффициент корреляции r , то коэффициенты a0 и a1 могут быть определены следующим образом

, .

В общем случае такая задача может решаться с помощью метода наименьших квадратов (МНК).

Рассмотрим использование метода наименьших квадратов для оценки параметров регрессии .

На практике имеется серия наблюдений (xi;yi) (i=1,..,n).

Будем считать, что

.

Тогда

.

Продифференцировав Q по a0 и a1 и приравняв частные производные нулю, получим следующую систему уравнений

;

,

решая которую получим оценки и

,

.

Основное назначение регрессионной модели – использование ее для прогноза экономического показателя y. Прогноз осуществляется подстановкой значения фактора в оценку детерминированной составляющей:

Чтобы определить точность этой оценки и построить доверительный интервал необходимо найти дисперсию оценки .

На практике для оценки дисперсии ошибки прогноза можно пользоваться следующим выражением

.

Из этого выражения следует, что с ростом дисперсия ошибки прогноза увеличивается.

Пример.

Исследуем зависимость розничного товарооборота магазинов (млрд р.) от среднесписочного числа работников. Обозначим:

x – число работников;

y – товарооборот.

Исходные данные и результаты расчетов приведены в таблице

Номер магазина

1

79

0,5

39,5

6 241

0,25

2

85

0,7

59,5

7 225

0,49

3

102

0,9

91,8

10 404

0,81

4

115

1,1

126,5

13 225

1,21

5

122

1,4

170,8

14 884

1,96

6

126

1,4

176,4

15 876

1,96

7

134

1,7

227,8

17 956

2,89

8

147

1,9

279,3

21 609

3,61

Итого

910

9,6

1171,6

107 420

13,18

;

; ;

;

Вычислим выборочный коэффициент корреляции:

;

;

.

Тогда

Проверим значимость выборочного коэффициента корреляции. Для этого вычислим статистику t:

Табличное значение критерия Стьюдента для = n-2 = 6 и

Так как 15,65 > 2,45 , то полученный коэффициент статистически значим.

Найдем коэффициенты парной линейной регрессии:

;

и регрессия имеет вид

.

Прогнозное значение розничного товарооборота при составит

Задание 5. С помощью корреляционного и регрессионного анализа изучить связь между показателями, указанными в Вашем варианте.

    1. Рассчитать значение коэффициента корреляции для несгруппированных данных табл. 1.

2. По данным аналитической группировки (задание 1) найти межгрупповую дисперсию признака-результата и с учетом полной дисперсии (задание 2) определить коэффициент детерминации и корреляционное отношение.

  1. Сделать вывод о тесноте и форме статистической связи.

  2. Найти коэффициенты парной линейной регрессии и сделать прогноз признака-результата, если признак-фактор принимает свое среднее значение.

  3. На одном рисунке изобразить эмпирическую (по данным аналитической группировки) и теоретическую регрессии. Провести анализ степени их совпадения.