3.3.1. Виды классического дисперсионного анализа
Проведение дисперсионного анализа возможно, если результаты измерений являются независимыми случайными величинами, подчиняющимися нормальному закону распределения с одинаковыми дисперсиями. В зависимости от количества рассматриваемых факторов различают однофакторный, двухфакторный и многофакторный дисперсионный анализ. Фактор может быть количественным (скорость резания, размер заготовки и т.д.) или качественным (модель станка, марка инструментального материала и т.д.).
Однофакторный дисперсионный анализ служит для сравнения средних значений нескольких выборок путём анализа дисперсий. Если имеются всего две выборки, то для сравнения средних можно использовать средства проверки статистических гипотез. Но более чем для двух выборок не существует обобщения методов, основанных, например, на t-тесте. В этом случае целесообразно воспользоваться однофакторным дисперсионным анализом.
Например, на автоматической линии несколько станков одного класса точности (дающие одинаковую дисперсию размеров обрабатываемых деталей) работают параллельно. То есть в данном случае фактором, влияющим на размер деталей, являются станки, на которых эти детали изготавливаются. Предварительные результаты показали, что имеется некоторое различие средних размеров деталей, обработанных на разных станках. Для правильного планирования последующей обработки детали исследователя интересует, насколько это различие существенно. Будет ли влиять на размер переход от одного станка к другому? Это различие может являться просто результатом естественного рассеивания размеров, т.е. их дисперсии. Дисперсия среднего значения выборки объемаn определяется из дисперсии единичного значения по формуле
(3.1)
А может быть, это различие средних размеров объективно существует, т.е. будет сохраняться при сравнении выборок даже бесконечного объёма. Правильное решение этой и подобных задач дисперсионного анализа требует трудоёмких вычислений, но современные программные средства позволяют их избежать. Такие возможности представлены, в частности, и в рамках программы MS EXCEL (см. § 3.3).
При однофакторном дисперсионном анализе по соотношению между составляющей дисперсии yi, вызванной действием данного фактора, и случайной составляющей делается вывод о существенном действии фактора (достаточно высокое соотношение) и необходимости учёта его влияния. Или, наоборот, при малом соотношении (меньшем некоего критического значения) между составляющей дисперсии, вызванной действием данного фактора, и случайной составляющей делается вывод о несущественности влияния фактора. Критическое («табличное») значение соотношения дисперсий определяется на основе распределения Фишера (см. § 3.3).
Двухфакторный дисперсионный анализ без повторений применяется, если данные можно систематизировать не по одному, как в предыдущем случае, а по двум параметрам. Причём для каждого сочетания пары параметров предполагается только одно наблюдение.
В двухфакторном анализе выясняется значимость влияния на исследуемый признак каждого из двух факторов (А и В). В этом случае дифференцируется вклад каждого фактора в суммарную дисперсию yi. По результатам сравнения соотношения этого вклада и случайной составляющей дисперсии отклика с соответствующим значением критерия Фишера делается вывод о существенности влияния каждого фактора.
Например, изготавливаются детали на разных станках (фактор 1) из двух различных видов сырья (фактор 2) и контролируется процент брака, получаемый при каждом сочетании этих факторов. Как и в предыдущем случае, необходимо установить, оказывает ли каждый из рассматриваемых факторов существенное влияние на процент брака или наблюдаемое различие имеет случайный характер.
Итоги могут быть представлены в виде «матрицы наблюдений», где результаты обработки на каждом станке расположены последовательно в разных столбцах, а результаты обработки деталей из каждого вида сырья расположены последовательно в разных строках (см. § 3.3).
Двухфакторный дисперсионный анализ с повторениями позволяет, как и предыдущий анализ, выяснять значимость влияния на исследуемый признак каждого из двух факторов (А и В). Но в отличие от предыдущего анализа за счёт повторений опытов при каждом сочетании значений факторов он даёт возможность определять дисперсию опыта и компонент дисперсии отклика yi, обусловленный взаимодействием факторов.
Дисперсионный анализ с повторениями требует большего объёма вычислений, особенно в том случае, когда для каждого фактора на разных уровнях проведено различное количество опытов. Как правило, стремятся делать равное количество опытов. Тогда расчёты по сравнению с неравным количеством существенно упрощаются. При использовании инструмента «Двухфакторный дисперсионный анализ с повторениями», также требующего равного количества опытов, расчёты вообще исключаются (см. § 3.3).
В таблице 3.1 приведены основные тождества каждого из рассмотренных выше вариантов дисперсионного анализа. Во всех тождествах таблицы присутствует составляющая, обусловленная случайными и неучтёнными факторами SSостат (она определяется вариацией внутри ячейки дисперсионной матрицы). Кроме составляющих дисперсии, обусловленных действием каждого из варьируемых факторов (SS1 и SS2), при двухфакторном дисперсионном анализе с повторениями появляется обусловленная наличием нескольких наблюдений в ячейке составляющая суммы SSвзаим.
Таблица 3.1. Основные тождества, рассматриваемые при анализе составляющих общей вариации отклика SS при различных методах дисперсионного анализа
Метод дисперсионного анализа | Основное тождество |
Однофакторный | SS = SS1 + SSостат |
Двухфакторный без повторений | SS = SS1 + SS2 + SSостат |
Двухфакторный с повторениями | SS = SS1 + SS2 + SSвзаим + SSостат |
Обычно (без использования программных возможностей) в ходе дисперсионного анализа расчёты проводят в следующем порядке.
1. По специальным формулам [5, 6] подсчитывают полную («общую», «суммарную») дисперсию SS и её компоненты.
2. Обусловленный каждым из факторов компонент общей дисперсии сравнивают с дисперсией, обусловленной влиянием прочих неучтённых и случайных факторов (SSостат). С этой целью для каждого из компонентов дисперсии определяют критерий Фишера как отношение этого компонента к остаточной дисперсии SSостат.
3. Сравнивают рассчитанные значения критерия Фишера с соответствующими критическими (табличными) значениями критерия Фишера (Fкрит), полученными для заданного уровня значимости. (Они различаются для каждого компонента, так как различаются числа степеней свободы.) При F < Fкрит нулевая гипотеза о равенстве дисперсий не опровергается. Делается вывод, что влияния соответствующего фактора или взаимодействия факторов на исследуемый отклик (точность, шероховатость детали, производительность, процент брака и т.д.) не установлено. В этом случае данный фактор не должен присутствовать в регрессионной модели. При F > Fкрит делается вывод, что нулевая гипотеза о равенстве дисперсий не подтверждается, т.е. влияние фактора (или взаимодействия факторов) на исследуемый признак значимо (существенно) и должно найти отражение в регрессионной модели.
Многофакторный дисперсионный анализ в чистом виде отсутствует в пакете анализа MS EXCEL, но результаты этого анализа приводятся в общих результатах инструмента анализа «регрессия» (см. главу 4). В качестве примера приведена таблица результатов такого ANOVA-анализа (табл. 3.2), полученная при одном из расчётов коэффициентов множественной регрессии. Она включает рассчитанные значения числа степеней свободы df, т.е. независимых элементов информации, суммы квадратов, SS (дисперсии) и среднего квадрата, приходящегося на одну степень свободы (MS =SS/df). Причём результаты приведены раздельно для каждого источника вариации, обусловленного как регрессией (р), так и колебаниями относительно регрессии, иначе остатками (о). Кроме того, определяется расчётное значение F-критерия значимости регрессии как отношение приходящейся на одну степень свободы дисперсии, обусловленной регрессией, и дисперсии, обусловленной действием случайных и неучтённых факторов (= МSр/S2).
Таблица 3.2. Результаты множественного дисперсионного анализа
Источник вариации | df (числ. степ. свободы) | SS (сумма квадратов) | Средний квадрат MS (=SS/df) | F-критерий значимости регрессии ( = МSр/S2) | Значимость F |
Обусловленный регрессией (р) | 8 | 158,1 | 19,75 | 10,78 | 5,3E-11 |
Относит. регрессии, остаток (о) | 106 | 194,3 | 1,83 |
|
|
Итого | 114 | 352,3 |
|
|
|
В отличие от одно- и двухфакторных дисперсионных анализов (§ 3.3) среди результатов множественного дисперсионного анализа (табл. 3.2) не приводятся критические табличные значения F-критерия. Но приводится величина значимости F, которую следует сравнить с принятым уровнем доверительной вероятности «альфа» (обычно берётся α = 0,05). Если рассчитанная величина значимости F оказывается меньше α, как представлено в табл. 3.2, нулевую гипотезу о равенстве дисперсий MS (р) и MS (о) отвергают. Следовательно, вариация, обусловленная регрессией, преобладает, и в этом случае регрессионный анализ имеет смысл.
- Методология исследования, моделирования и совершенствования производственных процессов
- Оглавление
- Глава 1 Общие сведения о методологии научного познания……………….6
- Глава 2 Моделирование как метод научного познания………………………11
- Глава 3 Исследование взаимосвязи случайных величин…………….22
- Глава 4 Способы экспериментальных исследований…………………88
- Глава 5 Некоторые современные достижения интеллектуальных информационных систем и программных средств в области анализа связи величин
- Введение
- Глава 1. Общие сведения о методологии научного познания
- 3. Статистический.
- 7. Экспериментальный.
- Глава 2 Моделирование как метод научного познания
- 2.1 Этапы построения, свойства, цели и классификация моделей
- 2.2 Концепции и инструменты оптимизации математических моделей
- 2.3 Принципы анализа математических моделей
- Глава 3. Исследование взаимосвязи случайных величин
- 3.1 Основные представления о корреляционном, дисперсионном и регрессионном анализах
- 3.2 Корреляционный анализ
- 3.2.1 Обзор характеристик «тесноты» связи
- 3.2.2. Формулы расчёта основных характеристик связи
- 3.2.3. Области определения и способы оценки достоверности коэффициентов связи случайных величин
- 3.2.4 Методы корреляции порядковых (ординальных) и номинальных (категориальных) переменных
- 3.2.5 Функции и инструменты ms excel, предназначенные для расчёта коэффициентов ковариации, корреляции и детерминации
- 3.3 Дисперсионный анализ
- 3.3.1. Виды классического дисперсионного анализа
- 3.3.2. Инструменты программы ms excel, предназначенные для дисперсионного анализа
- 3.3.2.1. «Однофакторный дисперсионный анализ»
- 3.3.2.2. «Двухфакторный дисперсионный анализ без повторений»
- 3.3.2.3. «Двухфакторный дисперсионный анализ с повторениями»
- 3.3.3. Представление о ступенчатом дисперсионном анализе
- 3.4 К установлению математической модели связи случайных величин
- 3.4.1. Виды регрессионных моделей
- 3.4.2. Способы, принципы и признаки оптимизации регрессии
- 3.4.3 Опции программы ms excel, предназначенные для регрессионного анализа
- 3.4.3.1 Использование инструмента анализа «Регрессия»
- 3.4.3.2 Функции excel, связанные с инструментом «Регрессия»
- 3.4.3.3 Возможности использования графических опций программы ms excel для решения задач регрессионного анализа
- Глава 4 Способы экспериментальных исследований
- 4.1 Пассивный эксперимент
- 4.1.1 Методы анализа результатов пассивного эксперимента
- 4.1.2. Информативность результатов пассивного производственного эксперимента
- 4.2 Планирование эксперимента и методы оптимизации параметров процесса
- 4.2.1 Методология планирования эксперимента
- 4.2.2 Полный факторный эксперимент
- 4.2.3 Дробный факторный эксперимент
- 4.2.4. Центральные композиционные планы
- 4.3 Оптимизация работы объекта управления для одного и нескольких параметров оптимизации для одно- и многоэкстремальной поверхности отклика
- 4. 4 Алгоритмы решения задач установления функциональных зависимостей и оптимизации
- Глава 6
- Глава 7
- Глава 8
- Глава 9 Современные достижения в области промышленной статистики и новые программные средства их реализации.