Регрессивный анализ данных
Если имеются ряды чисел xi и yi (i=0,n), то регрессивный анализ имеет смысл проводить при условии факта зависимости y от x. Тогда его задача состоит в восстановлении (регрессии) математической зависимости y(x) по данным парам чисел (xiyi). Наиболее эффективна регрессия тогда, когда ранее известен характер зависимости y(x).
Линейная регрессия– наиболее простой и часто используемый вид регрессии. В основном он реализуется с помощью МНК. В MathCAD для этого применяются встроенные функции line, stope, intercept. В Excel - возможности мастера диаграмм. В MathCAD кроме того имеется альтернативный алгоритм, основанный не на МНК, а на медиан – медианном подходе, предусматривающем автоматический учет значимости каждой точки через ее весовой коэффициент.
В том случае, если требуется получить единственный аппроксимирующий полином k-й степени, чтобы приблизить все данные, применяют полиномиальную регрессию по (к+1) точкам. В MathCAD это осуществляется функциями regress и interp.
Повысить степень аппроксимации позволяет локальная регрессия участками полиномов, когда приближение массива данных в окрестностях выборочных точек приводят «склеиванием» участков нескольких аппроксимирующих полиномов. В MathCAD для этого применяют функцию loess.
Двумерная полиноминальная регрессия позволяет приблизить множество точек zij(xiyi) поверхностью, которая определяется многомерной полиномиальной зависимостью. MathCAD позволяет ее проводить без предварительного упорядочивания данных.
Выбор структуры аппроксимирующей зависимости и предполагаемой формы ее математического представления определяет необходимость обращения к тому или иному виду регрессии.
Другие виды статистического анализа данных.
Вторичная математическая обработка данных предусматривает применение для решения ряда задач и других видов статистического анализа данных помимо регрессионного.
Дисперсионный анализ данных используется в основном для проверки статистических гипотез и оценки степени влияния отдельных факторов на характеристики зависимых от них объектов.
Корреляционный анализ данных служит для установления характера связи между элементами выборок.