logo
Методы дискриминантного анализа

5. Взаимосвязь между дискриминантными переменными и дискриминантными функциями

Для оценки вклада отдельной переменной в значение дискриминантной функции целесообразно пользоваться стандартизованными коэффициентами дискриминантной функции. Стандартизованные коэффициенты можно рассчитать двумя путями:

стандартизовать значения исходных переменных таким образом, чтобы их средние значения были равны нулю, а дисперсии - единице;

вычислить стандартизованные коэффициенты исходя из значений коэффициентов в нестандартной форме:

(28)

где р - общее число исходных переменных, т - число групп, - элементы матрицы ковариаций:

(29)

где i - номер наблюдения, j - номер переменной, k - номер класса, - количество объектов в k-м классе.

Стандартизованные коэффициенты применяют в тех случаях, когда нужно определить, какая из используемых переменных вносит наибольший вклад в величину дискриминантной функции. В примере с двумя классами, рассмотренном выше, дискриминантная функция имела вид:

f= -185,03Х1 + 1,84Х2 + 4,92Хз .

Следовательно, наибольший вклад в величину дискриминантной функции вносит переменная X1.

Определим значения стандартизованных коэффициентов и запишем новое значение дискриминантной функции:

(30)

где =

Стандартизованные коэффициенты дискриминантной функции тоже показывают определяющее влияние первой переменной на величину дискриминантной функции.

Помимо определения вклада каждой исходной переменной в дискриминантную функцию, можно проанализировать и степень корреляционной зависимости между ними.

Для оценки тесноты связи между отдельными переменными и дискриминантными функциями служат коэффициенты корреляции, которые называются структурными коэффициентами. По величине структурных коэффициентов судят о связи между переменными и дискриминантными функциями. Структурные коэффициенты позволяют также в случае необходимости присвоить имя каждой функции. Они могут быть рассчитаны в целом по всей совокупности объектов (R) и для каждого класса отдельно (R).

Покажем на примере 1 расчет структурных коэффициентов в целом для трех классов. Исходные данные для расчета коэффициентов представлены в табл. 3. Вычисленные структурные коэффициенты (Rf) имеют следующие значения:

Rx1f= 0,650 RX2f = -0,576 RХЗf = -0,506 Rx4f = -0,951

Rx1jl = -0,036 Rx2j1 = 0,486 RхЗjl = -0,211 Rx4j1 = 0,217

Rx1f2 = -0,728 Rx2f2 = 0,878 RХЗf2 = 0,511 Rx4f2 = -0,998

Rx1fJ = -0,713 Rх1JЗ = 0,258 RхЗfJ = -0,122 Rx4fJ = -0,998.

Таблица 3 - Исходные данные

Номер

Х1

Х2

ХЗ

Х4

наблюдения

1

0,50

94,0

8,50

6707

-31973,089

2

0,67

75,4

8,79

5037

-18122,238

3

0,68

85,2

9,10

3695

-6930,930

4

0,55

98,8

8,47

6815

-32812,109

5

1,52

81,5

4,95

3211

-13434,229

6

1,20

93,8

6,95

2890

-10812,723

7

1,46

86,5

4,70

2935

-11139,514

8

1,70

80,0

4,50

3510

-14272,295

9

1,65

85,0

4,80

2900

-9573,076

10

1,49

78,5

4,10

2850

-9348,104

Если рассматривать абсолютные значения структурных коэффициентов, видно, например, что наибольшая зависимость функций наблюдается от переменной , а функций и - от переменной .

Различные знаки у структурных коэффициентов можно интерпретировать следующим образом. Исходные переменные, имеющие различное направление связи с дискриминантной функцией, т.е. положительные или отрицательные структурные коэффициенты, будут ориентировать объекты в различных направлениях, удаляя или приближая их к центрам соответствующих классов. Из данного примера видно, что переменная X1 и функция имеют коэффициент -0,036. Это значит, что при увеличении значений функция уменьшается. Допустим, все разности (-) > о ( l= 2, ... , k) для i-го наблюдения, значит его следует отнести к первому классу. Если у классифицируемых объектов значения переменной будут возрастать, то значения функции для этих объектов будут уменьшаться, что приведет к отдалению их от центра первого класса. В конце концов достигнет у p-го объекта «критического» значения, которому будет соответствовать неравенство (-) < 0, т.е. i-й объект уже не попадет в первый класс. Аналогичные рассуждения проводятся и для положительных структурных коэффициентов.