Парная линейная регрессия
Следующий этап исследования корреляционной связи заключается в том, чтобы описать зависимость признака-результата от признака-фактора некоторым аналитическим выражением.
,
где − средний уровень показателя y при данном значении x.
Если рассчитан коэффициент корреляции r , то коэффициенты a0 и a1 могут быть определены следующим образом
, .
В общем случае такая задача может решаться с помощью метода наименьших квадратов (МНК).
Рассмотрим использование метода наименьших квадратов для оценки параметров регрессии .
На практике имеется серия наблюдений (xi;yi) (i=1,..,n).
Будем считать, что
.
Тогда
.
Продифференцировав Q по a0 и a1 и приравняв частные производные нулю, получим следующую систему уравнений
;
,
решая которую получим оценки и
,
.
Основное назначение регрессионной модели – использование ее для прогноза экономического показателя y. Прогноз осуществляется подстановкой значения фактора в оценку детерминированной составляющей:
Чтобы определить точность этой оценки и построить доверительный интервал необходимо найти дисперсию оценки .
На практике для оценки дисперсии ошибки прогноза можно пользоваться следующим выражением
.
Из этого выражения следует, что с ростом дисперсия ошибки прогноза увеличивается.
Пример.
Исследуем зависимость розничного товарооборота магазинов (млрд р.) от среднесписочного числа работников. Обозначим:
x – число работников;
y – товарооборот.
Исходные данные и результаты расчетов приведены в таблице
Номер магазина |
|
|
|
|
|
1 | 79 | 0,5 | 39,5 | 6 241 | 0,25 |
2 | 85 | 0,7 | 59,5 | 7 225 | 0,49 |
3 | 102 | 0,9 | 91,8 | 10 404 | 0,81 |
4 | 115 | 1,1 | 126,5 | 13 225 | 1,21 |
5 | 122 | 1,4 | 170,8 | 14 884 | 1,96 |
6 | 126 | 1,4 | 176,4 | 15 876 | 1,96 |
7 | 134 | 1,7 | 227,8 | 17 956 | 2,89 |
8 | 147 | 1,9 | 279,3 | 21 609 | 3,61 |
Итого | 910 | 9,6 | 1171,6 | 107 420 | 13,18 |
;
; ;
;
Вычислим выборочный коэффициент корреляции:
;
;
.
Тогда
Проверим значимость выборочного коэффициента корреляции. Для этого вычислим статистику t:
Табличное значение критерия Стьюдента для = n-2 = 6 и
Так как 15,65 > 2,45 , то полученный коэффициент статистически значим.
Найдем коэффициенты парной линейной регрессии:
;
и регрессия имеет вид
.
Прогнозное значение розничного товарооборота при составит
Задание 5. С помощью корреляционного и регрессионного анализа изучить связь между показателями, указанными в Вашем варианте.
Рассчитать значение коэффициента корреляции для несгруппированных данных табл. 1.
2. По данным аналитической группировки (задание 1) найти межгрупповую дисперсию признака-результата и с учетом полной дисперсии (задание 2) определить коэффициент детерминации и корреляционное отношение.
Сделать вывод о тесноте и форме статистической связи.
Найти коэффициенты парной линейной регрессии и сделать прогноз признака-результата, если признак-фактор принимает свое среднее значение.
На одном рисунке изобразить эмпирическую (по данным аналитической группировки) и теоретическую регрессии. Провести анализ степени их совпадения.
- Общие требования к выполнению контрольной работы
- Введение
- 1. Организация и виды статистического наблюдения
- 2. Группировка статистических данных
- Вариационный ряд, полигон и гистограмма
- Статистические показатели центра распределения
- Средняя арифметическая
- Медиана Ме(X)
- Статистические показатели вариации
- Абсолютные и относительные статистические показатели. Вычисление средних значений относительных показателей.
- Анализ временных рядов
- Формулы для расчета показателей представлены в табл.
- Показатели динамики
- Предположим, что имеет место линейная зависимость т. Е.
- Первое уравнение системы (3) можно преобразовать к виду
- Ошибки оценки характеристик генеральной совокупности по выборке
- Корреляционный и регрессионный анализ
- Парная линейная регрессия
- Применение индексов в экономическом анализе