Корреляционный и регрессионный анализ
Во многих науках (физика, экономика и т. д.) используются модели, в которых некоторые переменные (не случайные) связаны функциональной зависимостью. Примером таких зависимостей является закон Бойля-Мариотта или формула Ф. Котлера.
При статистической зависимости переменные (случайные величины) не связаны функционально. Однако закон распределения одной из них зависит от того, какое значение приняла другая случайная величина. Поэтому речь идет об условном распределении Y при заданном х.
В частности, можно рассматривать M(Y/x) как некоторую функцию х (регрессия).
При исследовании статистической зависимости между признаками пытаются ответить на следующие вопросы:
существует ли статистическая связь между признаками;
какова степень этой связи;
какова форма связи.
Первые два вопроса решаются на основании корреляционного анализа. В качестве меры тесноты связи обычно используется коэффициент корреляции - . При связь становится функциональной.
Выборочный коэффициент корреляции r рассчитывается по формуле
.
На практике используются следующие формулы для «ручных» вычислений
;
;
.
После того, как вычислен выборочный коэффициент корреляции r следует проверить гипотезу об отсутствии корреляционной связи для генеральной совокупности Н0: .
Для этого вычисляется критерий
и сравнивается с табличным значением критерия Стьюдента с степенями свободы уровня значимости .
Если , то с надежностью можно отвергнуть гипотезу Н0 и считать, что корреляция имеется.
Для измерения тесноты связи используется не только коэффициент корреляции, но и корреляционное отношение.
Рассмотрим аналитическую группировку. Имеет место следующее соотношение
,
где − полная дисперсия признака-результата;
− внутригрупповая дисперсия;
− межгрупповая дисперсия.
Внутригрупповая дисперсия характеризует ту часть дисперсии признака-результата, которая не зависит от признака-фактора. Ее оценка определяется по формуле
,
где - оценка дисперсии признака – результата в пределах отдельной
группы по признаку-фактору;
ni – численность i-й группы.
Межгрупповая дисперсия отражает ту часть общей дисперсии признака-результата, которая объясняется влиянием признака-фактора. Ее оценка определяется по формуле
,
где − групповое среднее i-й группы.
Коэффициент детерминации определяет долю объясненной дисперсии в общей дисперсии признака-результата
.
Корреляционное отношение определяется как
.
Оно является мерой тесноты связи при любой форме зависимости, а не только линейной, как коэффициент корреляции.
- Общие требования к выполнению контрольной работы
- Введение
- 1. Организация и виды статистического наблюдения
- 2. Группировка статистических данных
- Вариационный ряд, полигон и гистограмма
- Статистические показатели центра распределения
- Средняя арифметическая
- Медиана Ме(X)
- Статистические показатели вариации
- Абсолютные и относительные статистические показатели. Вычисление средних значений относительных показателей.
- Анализ временных рядов
- Формулы для расчета показателей представлены в табл.
- Показатели динамики
- Предположим, что имеет место линейная зависимость т. Е.
- Первое уравнение системы (3) можно преобразовать к виду
- Ошибки оценки характеристик генеральной совокупности по выборке
- Корреляционный и регрессионный анализ
- Парная линейная регрессия
- Применение индексов в экономическом анализе