logo
статистика экономическая - 2003

Корреляционный и регрессионный анализ

Во многих науках (физика, экономика и т. д.) используются модели, в которых некоторые переменные (не случайные) связаны функциональной зависимостью. Примером таких зависимостей является закон Бойля-Мариотта или формула Ф. Котлера.

При статистической зависимости переменные (случайные величины) не связаны функционально. Однако закон распределения одной из них зависит от того, какое значение приняла другая случайная величина. Поэтому речь идет об условном распределении Y при заданном х.

В частности, можно рассматривать M(Y/x) как некоторую функцию х (регрессия).

При исследовании статистической зависимости между признаками пытаются ответить на следующие вопросы:

Первые два вопроса решаются на основании корреляционного анализа. В качестве меры тесноты связи обычно используется коэффициент корреляции - . При связь становится функциональной.

Выборочный коэффициент корреляции r рассчитывается по формуле

.

На практике используются следующие формулы для «ручных» вычислений

;

;

.

После того, как вычислен выборочный коэффициент корреляции r следует проверить гипотезу об отсутствии корреляционной связи для генеральной совокупности Н0: .

Для этого вычисляется критерий

и сравнивается с табличным значением критерия Стьюдента с степенями свободы уровня значимости .

Если , то с надежностью можно отвергнуть гипотезу Н0 и считать, что корреляция имеется.

Для измерения тесноты связи используется не только коэффициент корреляции, но и корреляционное отношение.

Рассмотрим аналитическую группировку. Имеет место следующее соотношение

,

где − полная дисперсия признака-результата;

− внутригрупповая дисперсия;

− межгрупповая дисперсия.

Внутригрупповая дисперсия характеризует ту часть дисперсии признака-результата, которая не зависит от признака-фактора. Ее оценка определяется по формуле

,

где - оценка дисперсии признака – результата в пределах отдельной

группы по признаку-фактору;

ni – численность i-й группы.

Межгрупповая дисперсия отражает ту часть общей дисперсии признака-результата, которая объясняется влиянием признака-фактора. Ее оценка определяется по формуле

,

где − групповое среднее i-й группы.

Коэффициент детерминации определяет долю объясненной дисперсии в общей дисперсии признака-результата

.

Корреляционное отношение определяется как

.

Оно является мерой тесноты связи при любой форме зависимости, а не только линейной, как коэффициент корреляции.