3.2.2. Формулы расчёта основных характеристик связи
Коэффициент ковариации (ковариация) определяется как среднее произведений отклонений от выборочных средних значений и для каждой пары изn точек данных:
cov (x y) = (2.1)
Формула (2.1) показывает, что ковариация значительна, когда большое отклонение от сочетается с большим отклонениемот .
Значения коэффициента корреляции колеблются от -1 до +1. Знак плюс указывает на "положительную корреляциционную связь", а знак минус - на отрицательную. Коэффициент корреляции, равный ±1, указывает на функциональную зависимость между переменными.
Следует подчеркнуть, что обращение в нуль ковариации переменных X и Y является не достаточным, а только необходимым условием для суждения об их независимости. С другой стороны, ненулевое значение ковариации говорит о некоторой связи случайных величин, но не позволяет судить о степени тесноты и достоверности этой связи. Из формулы (2.1) можно сделать заключение, что при переходе к другой единице измерения (например, от метров к сантиметрам) значение ковариации также изменяется.
Коэффициент корреляции Пирсона (обозначается r или ρ) называется также «коэффициентом линейной корреляции», так как измеряет степень линейной связи между переменными. Иначе говоря, он определяет степень пропорциональности друг другу значений двух переменных коэффициент корреляции Пирсона можно рассчитать по формулам:
(2.2)
или (2.3)
где σx (Sx), σy (Sy) - среднеквадратические отклонения генеральных совокупностей (или выборок) переменных X и Y.
Анализ формул (2.2) - (2.3) позволяет сделать заключение, что коэффициент корреляции - величина безразмерная (в отличие от коэффициента ковариации). Сравнение формул (2.1) и (2.2) показывает, что коэффициент Пирсона равен ковариации двух переменных, делённой на произведение их стандартных отклонений.
(2.4)
Коэффициент корреляции, как и коэффициент ковариации, характеризует степень линейной зависимости случайных величин Х и Y, проявляющейся в том, что при возрастании одной случайной величины другая проявляет тенденцию также возрастать (или, наоборот, убывать). В первом случае (rxy > 0) случайные величины связаны «положительной корреляцией», во втором случае (rxy < 0) наблюдается «отрицательная корреляция».
Множественный коэффициент детерминации (R2), представляющий собой множественный коэффициент корреляции (см. рис. 2.1) в квадрате, характеризует, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель. Чем больше R2, тем больше результат (отклик) зависит от действующих факторов. Чем меньше R2, тем больше действие случайных и неучтённых факторов. Таким образом, R2 характеризует, насколько хорошо модель описывает («аппроксимирует») экспериментальные точки.
Важно понять механизм "работы" приведённых формул: чем больше совместное отклонение x и y от их средних значений, тем больше |r| (см. числитель). Деление на σХ и σy делает r безразмерным.
- Методология исследования, моделирования и совершенствования производственных процессов
- Оглавление
- Глава 1 Общие сведения о методологии научного познания……………….6
- Глава 2 Моделирование как метод научного познания………………………11
- Глава 3 Исследование взаимосвязи случайных величин…………….22
- Глава 4 Способы экспериментальных исследований…………………88
- Глава 5 Некоторые современные достижения интеллектуальных информационных систем и программных средств в области анализа связи величин
- Введение
- Глава 1. Общие сведения о методологии научного познания
- 3. Статистический.
- 7. Экспериментальный.
- Глава 2 Моделирование как метод научного познания
- 2.1 Этапы построения, свойства, цели и классификация моделей
- 2.2 Концепции и инструменты оптимизации математических моделей
- 2.3 Принципы анализа математических моделей
- Глава 3. Исследование взаимосвязи случайных величин
- 3.1 Основные представления о корреляционном, дисперсионном и регрессионном анализах
- 3.2 Корреляционный анализ
- 3.2.1 Обзор характеристик «тесноты» связи
- 3.2.2. Формулы расчёта основных характеристик связи
- 3.2.3. Области определения и способы оценки достоверности коэффициентов связи случайных величин
- 3.2.4 Методы корреляции порядковых (ординальных) и номинальных (категориальных) переменных
- 3.2.5 Функции и инструменты ms excel, предназначенные для расчёта коэффициентов ковариации, корреляции и детерминации
- 3.3 Дисперсионный анализ
- 3.3.1. Виды классического дисперсионного анализа
- 3.3.2. Инструменты программы ms excel, предназначенные для дисперсионного анализа
- 3.3.2.1. «Однофакторный дисперсионный анализ»
- 3.3.2.2. «Двухфакторный дисперсионный анализ без повторений»
- 3.3.2.3. «Двухфакторный дисперсионный анализ с повторениями»
- 3.3.3. Представление о ступенчатом дисперсионном анализе
- 3.4 К установлению математической модели связи случайных величин
- 3.4.1. Виды регрессионных моделей
- 3.4.2. Способы, принципы и признаки оптимизации регрессии
- 3.4.3 Опции программы ms excel, предназначенные для регрессионного анализа
- 3.4.3.1 Использование инструмента анализа «Регрессия»
- 3.4.3.2 Функции excel, связанные с инструментом «Регрессия»
- 3.4.3.3 Возможности использования графических опций программы ms excel для решения задач регрессионного анализа
- Глава 4 Способы экспериментальных исследований
- 4.1 Пассивный эксперимент
- 4.1.1 Методы анализа результатов пассивного эксперимента
- 4.1.2. Информативность результатов пассивного производственного эксперимента
- 4.2 Планирование эксперимента и методы оптимизации параметров процесса
- 4.2.1 Методология планирования эксперимента
- 4.2.2 Полный факторный эксперимент
- 4.2.3 Дробный факторный эксперимент
- 4.2.4. Центральные композиционные планы
- 4.3 Оптимизация работы объекта управления для одного и нескольких параметров оптимизации для одно- и многоэкстремальной поверхности отклика
- 4. 4 Алгоритмы решения задач установления функциональных зависимостей и оптимизации
- Глава 6
- Глава 7
- Глава 8
- Глава 9 Современные достижения в области промышленной статистики и новые программные средства их реализации.