logo
текст 16 консп лекц МЕТОДОЛОГИЯ

3.2.2. Формулы расчёта основных характеристик связи

Коэффициент ковариации (ковариация) определяется как среднее произведений отклонений от выборочных средних значений и для каждой пары изn точек данных:

cov (x y) = (2.1)

Формула (2.1) показывает, что ковариация значительна, когда большое отклонение от сочетается с большим отклонениемот .

Значения коэффициента корреляции колеблются от -1 до +1. Знак плюс указывает на "положительную корреляциционную связь", а знак минус - на отрицатель­ную. Коэффициент корреляции, равный ±1, указывает на функци­ональную зависимость между переменными.

Следует подчеркнуть, что обращение в нуль ковариации переменных X и Y является не достаточным, а только необходимым условием для суждения об их независимости. С другой стороны, ненулевое значение ковариации говорит о некоторой связи случайных величин, но не позволяет судить о степени тесноты и достоверности этой связи. Из формулы (2.1) можно сделать заключение, что при переходе к другой единице измерения (например, от метров к сантиметрам) значение ковариации также изменяется.

Коэффициент корреляции Пирсона (обозначается r или ρ) называется также «коэффициентом линейной корреляции», так как измеряет степень линейной связи между переменными. Иначе говоря, он определяет степень пропорциональности друг другу значений двух переменных коэффициент корреляции Пирсона можно рассчитать по формулам:

(2.2)

или (2.3)

где σx (Sx), σy (Sy) - среднеквадратические отклонения генеральных совокупностей (или выборок) переменных X и Y.

Анализ формул (2.2) - (2.3) позволяет сделать заключение, что коэффициент корреляции - величина безразмерная (в отличие от коэффициента ковариации). Сравнение формул (2.1) и (2.2) показывает, что коэффициент Пирсона равен ковариации двух переменных, делённой на произведение их стандартных отклонений.

(2.4)

Коэффициент корреляции, как и коэффициент ковариации, характеризует степень линейной зависимости случайных величин Х и Y, проявляющейся в том, что при возрастании одной случайной величины другая проявляет тенденцию также возрастать (или, наоборот, убывать). В первом случае (rxy > 0) случайные величины связаны «положительной корреляцией», во втором случае (rxy < 0) наблюдается «отрицательная корреляция».

Множественный коэффициент детерминации (R2), представ­ляющий собой множественный коэффициент корреляции (см. рис. 2.1) в квад­рате, характеризует, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в мно­гофакторную регрессионную модель. Чем больше R2, тем больше результат (отклик) зависит от действующих факторов. Чем меньше R2, тем больше действие случайных и неучтённых факторов. Таким образом, R2 характеризует, насколько хорошо модель описывает («аппроксимирует») экспериментальные точки.

Важно понять механизм "работы" приведённых формул: чем больше совместное отклонение x и y от их средних значений, тем больше |r| (см. числитель). Деление на σХ и σy делает r безразмерным.