logo
Корреляционный и регрессионный анализ

2. Решение задачи 1

Определим линейное уравнение парной регрессии.

Для этого составим и решим следующую систему уравнений:

;

.

;

.

Решая данную систему уравнений получаем:

а=81,232;

b=0,76.

Итого получаем:

Рассчитаем линейные коэффициенты парной корреляции и среднюю ошибку аппроксимации

Расчет будем вести табличным способом, и представим в таблице 2.

Таблица 2 - Расчет линейных коэффициентов парной корреляции и средняя ошибка аппроксимации

N

X

Y

X•Y

X2

Y2

Y-

1

23

110

2530

529

12100

98,71

11,29

127,42

10,26

2

45

125

5625

2025

15625

115,43

9,57

91,55

7,65

3

34

111

3774

1156

12321

107,07

3,93

15,43

3,54

4

51

121

6171

2601

14641

119,99

1,01

1,02

0,83

5

28

109

3052

784

11881

102,51

6,49

42,09

5,95

6

62

127

7874

3844

16129

128,35

-1,35

1,83

1,06

7

71

143

10153

5041

20449

135,19

7,81

60,96

5,46

8

63

121

7623

3969

14641

129,11

-8,11

65,80

6,70

9

70

154

10780

4900

23716

134,43

19,57

382,91

12,71

10

45

108

4860

2025

11664

115,43

-7,43

55,23

6,88

11

51

136

6936

2601

18496

119,99

16,01

256,26

11,77

13

27

109

2943

729

11881

101,75

7,25

52,53

6,65

13

62

125

7750

3844

15625

128,35

-3,35

11,24

2,68

14

57

110

6270

3249

12100

124,55

-14,55

211,76

13,23

15

63

120

7560

3969

14400

129,11

-9,11

83,03

7,59

16

69

134

9246

4761

17956

133,67

0,33

0,11

0,24

17

74

131

9694

5476

17161

137,47

-6,47

41,89

4,94

18

35

105

3675

1225

11025

107,83

-2,83

8,02

2,70

19

21

74

1554

441

5476

97,19

-23,19

537,87

31,34

20

60

120

7200

3600

14400

126,83

-6,83

46,68

5,69

?

1011

2393

125270

56769

291687

2393

0

2093,62

147,90

Ср.

50,55

119,65

6263,5

2838,45

14584,35

119,65

0

104,68

7,39

На рисунке 1 представим поле корреляции.

Рисунок 1 - Поле корреляции

Оценим статистическую зависимость параметров регрессии и корреляции (с помощью F-критерия Фишера и Т-статистики Стьюдента).

Определение коэффициента корреляции

Для определения коэффициента корреляции, определим дисперсию:

;

.

Определим коэффициент корреляции:

.

Данный коэффициент корреляции характеризует высокую тесноту связи

Определим коэффициент детерминации:

Это значит, что 61% вариации "у" объясняется вариацией фактор "х".

Определение статистической значимости уравнения регрессии с помощью F-критерия Фишера

Определим F- критерий Фишера:

.

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы 1 и (20-2)=18 составляет Fтаб = 4,45.

Имеем F> Fтаб, следовательно уравнение регрессии признается статистическим значимым.

Оценка статистической значимости параметров регрессии с помощью t-статистики Стьюдента

Табличное значение t-критерия для числа степеней свободы df=n-2=20-2=18 и уровня значимости ?=0,05 составит tтабл=1,743.

Определим стандартные ошибки:

;

;

.

Тогда

;

;

.

Фактические значения t-статистики превосходят табличное значение:

, поэтому параметры а, b, и rxy не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительные интервалы для параметров регрессии а и b. Для этого определим предельную ошибку для каждого показателя:

;

.

Получаем доверительные интервалы:

и ;

и .

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р=1-?=1-0,05=0,95 параметры а и b, находятся в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.