3.4.3.1 Использование инструмента анализа «Регрессия»
В пакете «Анализ данных» инструмент «Регрессия» (рис. 4.3) предлагает линейный регрессионный анализ, который заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более (до 16) независимых переменных. То есть во «Входной интервал X» (рис. 4.3) можно вводить до 16 диапазонов. (Диапазоны обязательно должны быть представлены в столбцах.) Во «Входной интервал Y» вводят один диапазон, состоящий из одного столбца.
Рис. 4.2. Характеристики достоверности статистической связи
Рис. 4.3. Диалоговое окно инструмента анализа «Регрессия»
При желании получения уравнения регрессии без свободного члена (чтобы линия регрессии прошла через начало координат) следует в опцию «Константа - ноль» поставить «галочку». «Галочки» в опции «Остатки», «График остатков», «График подбора» или «Стандартизированные остатки» устанавливаются при необходимости исследования несоответствий между экспериментальными и теоретическими значениями Y, определяемыми уравнением регрессии. «Остаток» представляет собой разницу между фактическим и теоретическим значениями Y. «Стандартизированный остаток» представляет собой отношение «остатка» к «стандартной ошибке единичного наблюдения регрессионной статистики» (см. ниже). «График остатков» располагается в координатах x - величина остатка. По нему наглядно видны значения «остатка» для разных аргументов, что позволяет обнаружить «выбросы» - самые большие отклонения от теоретической модели, которые могут свидетельствовать о каком-то сбое, ошибке в получении результата. Процедура устранения таких «выбросов» называется «цензурированием».
На «графике подбора» в координатах x - Y показываются фактические и «предсказанные» данной регрессионной моделью значения Y.
Опция «График нормальной вероятности» позволяет в соответствии с появляющейся таблицей «ВЫВОД ВЕРОЯТНОСТИ» построить диаграмму в координатах «Персентиль выборки» - Y. То есть полученные значения Y в данном случае представлены в виде ранжированного вариационного ряда.
Результаты регрессионного анализа представляются как минимум (если не включены дополнительно отмеченные выше опции) в виде трёх таблиц.
1. Таблица «Регрессионная статистика» включает в себя рассчитанные значения следующих показателей:
- множественного коэффициента корреляции («Множественный R»);
- квадрата множественного коэффициента корреляции (коэффициента детерминации, «R-квадрат»);
- числа наблюдений n (число факторов обозначается k, см. ниже);
- нормированного коэффициента детерминации, объективно определяющего достоверность связи, так как, в отличие от обычного коэффициента детерминации, он не зависит от числа опытов (n) и числа факторов (k):
(4.1)
- стандартной ошибки единичного наблюдения:
(4.2)
2. Таблица «Дисперсионный анализ» включает в себя обусловленные регрессией («Регрессия»), необусловленные регрессией («Остаток») и суммарные:
- число степеней свободы df;
- сумму квадратов разностей (дисперсии SS);
- оценки дисперсий, приходящихся на одну степень свободы (MS).
Кроме того, выводятся расчётное значение F-критерия Фишера ()и «значимость F». Таким образом, в отличие от полного дисперсионного анализа (см. главу 4), табличное «критическое» значение F-критерия Фишера в данном случае не представлено. Поэтому вывод о существенности влияния рассматриваемых факторов в данном случае можно делать из сравнения величины «значимости F» с принятым уровнем доверительной вероятности α. При «значимость F» < α делается вывод о существенности влияния рассматриваемых факторов и правомерности проводимого регрессионного анализа.
3. Таблица результатов собственно регрессионного анализа (информация об уравнении регрессии) включает в себя:
- значение свободного члена уравнения (Y-пересечение);
- коэффициенты регрессии для каждого фактора;
- «Стандартную ошибку» коэффициентов регрессии ;
- «t-статистику» - расчётные значения коэффициентов Стьюдента для соответствующих коэффициентов регрессии ;
- «P-Значение» - вероятность значимости для соответствующих коэффициентов регрессии;
- нижние и верхние интервальные оценки (отклонения) для коэффициентов регрессии с 95-процентной и любой другой (заданной) доверительной вероятностью.
Поскольку «критические» (табличные) значения коэффициентов Стьюдента в этой таблице не приводятся, о достоверности рассчитанных коэффициентов регрессии можно судить по величине «P-Значения» в сравнении с принятым уровнем доверительной вероятности α. При «P-Значение» < α делается вывод о достоверности коэффициентов регрессии. В противном случае делается вывод, что регрессионная модель нуждается в коррекции (см. § 4.2).
Кроме того, при включённых дополнительных опциях выводятся следующие добавочные таблицы:
1. «Вывод остатка», где представлены:
– «Наблюдение» - порядковый номер значения отклика (у) в таблице исходных данных;
– «Предсказанное » - значение отклика (), рассчитанное по уравнению регрессии;
– «Остатки» - (см. выше);
– «Стандартные остатки» (см. выше).
2. «Вывод вероятности», где представлены:
– Персентиль - рассчитывается для каждого значения у;
– у - значения отклика, расположенные в порядке возрастания.
- Методология исследования, моделирования и совершенствования производственных процессов
- Оглавление
- Глава 1 Общие сведения о методологии научного познания……………….6
- Глава 2 Моделирование как метод научного познания………………………11
- Глава 3 Исследование взаимосвязи случайных величин…………….22
- Глава 4 Способы экспериментальных исследований…………………88
- Глава 5 Некоторые современные достижения интеллектуальных информационных систем и программных средств в области анализа связи величин
- Введение
- Глава 1. Общие сведения о методологии научного познания
- 3. Статистический.
- 7. Экспериментальный.
- Глава 2 Моделирование как метод научного познания
- 2.1 Этапы построения, свойства, цели и классификация моделей
- 2.2 Концепции и инструменты оптимизации математических моделей
- 2.3 Принципы анализа математических моделей
- Глава 3. Исследование взаимосвязи случайных величин
- 3.1 Основные представления о корреляционном, дисперсионном и регрессионном анализах
- 3.2 Корреляционный анализ
- 3.2.1 Обзор характеристик «тесноты» связи
- 3.2.2. Формулы расчёта основных характеристик связи
- 3.2.3. Области определения и способы оценки достоверности коэффициентов связи случайных величин
- 3.2.4 Методы корреляции порядковых (ординальных) и номинальных (категориальных) переменных
- 3.2.5 Функции и инструменты ms excel, предназначенные для расчёта коэффициентов ковариации, корреляции и детерминации
- 3.3 Дисперсионный анализ
- 3.3.1. Виды классического дисперсионного анализа
- 3.3.2. Инструменты программы ms excel, предназначенные для дисперсионного анализа
- 3.3.2.1. «Однофакторный дисперсионный анализ»
- 3.3.2.2. «Двухфакторный дисперсионный анализ без повторений»
- 3.3.2.3. «Двухфакторный дисперсионный анализ с повторениями»
- 3.3.3. Представление о ступенчатом дисперсионном анализе
- 3.4 К установлению математической модели связи случайных величин
- 3.4.1. Виды регрессионных моделей
- 3.4.2. Способы, принципы и признаки оптимизации регрессии
- 3.4.3 Опции программы ms excel, предназначенные для регрессионного анализа
- 3.4.3.1 Использование инструмента анализа «Регрессия»
- 3.4.3.2 Функции excel, связанные с инструментом «Регрессия»
- 3.4.3.3 Возможности использования графических опций программы ms excel для решения задач регрессионного анализа
- Глава 4 Способы экспериментальных исследований
- 4.1 Пассивный эксперимент
- 4.1.1 Методы анализа результатов пассивного эксперимента
- 4.1.2. Информативность результатов пассивного производственного эксперимента
- 4.2 Планирование эксперимента и методы оптимизации параметров процесса
- 4.2.1 Методология планирования эксперимента
- 4.2.2 Полный факторный эксперимент
- 4.2.3 Дробный факторный эксперимент
- 4.2.4. Центральные композиционные планы
- 4.3 Оптимизация работы объекта управления для одного и нескольких параметров оптимизации для одно- и многоэкстремальной поверхности отклика
- 4. 4 Алгоритмы решения задач установления функциональных зависимостей и оптимизации
- Глава 6
- Глава 7
- Глава 8
- Глава 9 Современные достижения в области промышленной статистики и новые программные средства их реализации.