Особливості систем одночасних рівнянь

курсовая работа

Розділ 2. Практична частина

2.1 Побудувати лінійну багатофакторну економіко-математичну модель залежності фактору Y від факторів Xi

Ідентифікуємо дані:

Y - (залежний фактор);

Х -(незалежний фактор).

, (1.1)

де а0, а1 - коефіцієнти лінійної моделі, е - випадкова складова

Для того, щоб обчислити параметри лінійної регресії, в MS Excel передбачена вбудована функція ЛИНЕЙН (Таблиця 1.1), яка обчислює основні параметри регресії (коефіцієнти регресії, стандартні похибки коефіцієнтів, коефіцієнт детермінації, стандартну похибку, критерій Фішера, сума квадратів різниць між фактичним та середнім значенням фактора Y та суму квадратів залишків). Всі інші параметри можуть бути обчислені згідно означень.

Застосувавши функцію ЛИНЕЙН, одержимо:

Таблиця 1.1

-0,40901

0,11914413

0,0584917

18,68591

0,206876

0,35336699

0,0882437

11,40585

0,897981

0,49395774

#Н/Д

#Н/Д

17,60429

6

#Н/Д

#Н/Д

12,88603

1,46396551

#Н/Д

#Н/Д

В результаті обчислень отримано:

Таблиця 1.2

a0=

18,6859

Sa0=

11,406

R2=

0,89798

a1=

0,05849

Sa1=

0,0882

E=

0,49396

a2=

-0,11914

Sa2=

0,3534

F=

17,6043

a3=

-0,40901

Sa3=

0,2069

n-k=

6

k-1=

3

a0; a1; a2; a3 -коефіцієнти регресії;

Sa0; Sa1; Sa2; Sa3 - стандартні похибки коефіцієнтів;

R2- коефіцієнт детермінації;

Е - стандартна похибка;

F - критерій Фішера;

n-k - число ступенів вільності;

Стандартна похибка моделі Е=0,49395774. У відсотках до Yc похибка становить приблизно 0,4%<15%. Отже модель якісна.

(1.1)

Критерій Фішера застосовується для перевірки рівності дисперсій двох вибірок. Його відносять до критеріїв розсіювання.При перевірці гіпотези положення (гіпотези про рівність середніх значень у двох вибірках) з використанням критерію Стьюдента має сенс заздалегідь перевірити гіпотезу про рівність дисперсій. Якщо вона правильна, то для порівняння середніх можна скористатися більш потужним критерієм.У регресійному аналізі критерій Фішера дозволяє оцінювати значимість лінійних регресійних моделей. Зокрема, він використовується в крокової регресії для перевірки доцільності включення або виключення незалежних змінних (ознак) у регресійну модель.У дисперсійному аналізі критерій Фішера дозволяє оцінювати значимість факторів і їх взаємодії.Критерій Фішера заснований на додаткових припущеннях про незалежність і нормальності вибірок даних. Перед його застосуванням рекомендується виконати перевірку нормальності.

2.2 Проведення аналізу на наявність мультиколінеарності за допомогою методу Фаррара-Глобера

На основі статистичних даних факторів Y та Х (Таблиця 2.1) провести аналіз на наявність мультиколінеарності згідно алгоритму Фаррара-Глобера.

№ п/п

Y

Х1

Х2

Х3

1

16,75

81,6

10,2

13,6

2

17,25

85

9,69

12,75

3

17,5

83,3

9,52

11,05

4

18,75

88,4

8,5

10,2

5

18

86,7

8,67

10,54

6

19,25

90,1

8,84

9,86

7

19,5

88,4

9,35

9,35

8

20

93,5

8,5

8,5

9

19,5

96,9

8,5

7,65

10

20,5

98,6

6,8

7,99

Проводимо дослідження на мультиколінеарність згідно алгоритму Фаррара-Глобера:

1. Стандартизація (нормалізація) змінних.

Нормалізуємо пояснюючі змінні. Для цього, знайдемо спочатку за допомогою статистичної функції СРЗНАЧ їх середні значення та за допомогою статистичної функції СТАНДОТКЛОН стандартні відхилення значення.

Далі скористаємося вбудованою функцією НОРМАЛИЗАЦИЯ. Для цього виділяємо 10 рядків та 3 стовпці. Виконуємо наступні команди: Вставка/Функция/Статистические/НОРМАЛИЗАЦИЯ:

В поле Х вводимо одночасно всі значення пояснюючих змінних Х1, Х2, Х3 із таблиці 2.1.

В поле Среднее вводимо середні значення пояснюючих змінних Х1, Х2, Х3 із таблиці 2.2.

В поле Стандартное_откл вводимо значення стандартних відхилень пояснюючих змінних Х1, Х2, Х3 із таблиці 2.2.

X1

X2

X3

середнє значення

89,25

8,857

10,149

стандартні відхилення

5,624

0,933

1,943

2. Знаходження кореляційної матриці r.

Знайдемо кореляційну матрицю r, для чого скористаємося вбудованою функцією КОРРЕЛ. Отримаємо наступну матрицю парних коефіцієнтів (Таблиця 2.3) кореляції:

Таблиця 2.3

1

-0,8662312

-0,91226574

-0,8662312

1

0,787135837

-0,912265738

0,787135837

1

Знайдемо множинний коефіцієнт кореляції, для чого скористаємося формулою:

, (2.1)

де: t - табличне значення критерію Стьюдента на рівні значимості та степенями вільності .

Отже, . Таким чином, оскільки, всі , то це говорить про досить тісний звязок між факторами.

3. Визначення критерію Пірсона.

Для відповіді на питання: чи є цей звязок наслідком мультиколінеарності чи ні скористаємося спочатку критерієм ч2. Для цього обчислимо визначник матриці r:

.

Обчислимо критерій Пірсона за формулою:

(2.2)

Будемо мати:

22,741.

Знайдемо . Для цього використаємо вбудовану функцію ХИ2ОБР. Отримаємо,

7,81473.

Так як , то в масиві пояснюючих змінних існує мультиколінеарність.

4. Визначення матриці .

Визначимо матрицю С, обернену до матриці парних коефіцієнтів кореляції (скористаємося вбудованою функцією МОБР) і отримаємо:

9,0849

3,5381

5,5029

C=

3,5381

4,0066

0,0740

5,5029

0,0740

5,9619

5. Обчислення F-критеріїв.

Обчислимо значення F-критеріїв для кожної пояснюючої змінної за формулою:

,

де сіі - діагональні елементи матрисі С.

Будемо мати:

F1=

16,1699

F2=

6,0133

F3=

9,9237

Обчислимо табличне значення критерію Фішера та порівняємо його зі знайденими F-критеріями:

Fтаб= 0,0517 .

Так як F1>Fтаб, F2>Fтаб, F3>Fтаб, то це значить, що кожна з пояснюючих змінних мультиколінеарна з іншими.

Знайдемо частинні коефіцієнти детермінації для кожної змінної. Для чого скористаємося формулою:

R2(x1)=

0,8899

R2(x2)=

0,7504

R2(x3)=

0,8323

6. Визначення частинних коефіцієнтів кореляції.

Визначимо частинні коефіцієнти кореляції, які показують на тісноту звязку між змінними хі та хj при умові, що всі інші змінні не впливають на цей звязок. Для цього скористаємося формулою:

r12=

-0,5864

r13=

0,7477

r23=

0,0151

так як r12<rкр, то між змінними х1 (фондовіддача) і х2 (продуктивність праці) не існує тісного звязку, якщо не враховувати вплив питомих інвестицій;

- так як r13>rкр, то між змінними х1 (фондовіддача) та х3 (питомі інвестиції) існує тісний звязок, якщо не враховувати вплив продуктивності праці;

- так як r23<rкр, то між змінними х2 (продуктивність праці) і х3 (питомі інвестиції) не існує тісного звязку, якщо не враховувати вплив фондовіддачі.

7. Обчислення t-критеріїв.

Знайдемо, чи звязані мультиколінеарно фактори х1 і х2, х1 і х3 та х2 і х3 відповідно. Для цього обчислимо t-критерії за формулою:

t12=

-1,7735

t13=

2,7583

t23=

0,0371

Обчислимо tтаб=2,447 і порівняємо цей критерій зі знайденими раніше значеннями t-критеріїв.

Так як t12<tтаб, то між змінними х1 і х2 не існує мультиколінеарого звязку; так як t13>tтаб, то між змінними x1 і х3 є мультиколінеарний звязок; так як t23<tтаб, то між змінними х2 і х3 також не існує мультиколінеарного звязку.

Для включення факторів у модель потрібно, щоб вони були слабо звязані між собою, та звязані з результуючим фактором. Оскільки між факторами х1 і х3 виявлено мультиколінеарний звязок, то краще у шукану модель фактори х1 та х3 разом не включати. Таким чином, розглянемо дві моделі:

Y=a0+a1X1+a2X2

Y

Х1

Х2

Y

Х2

Х3

1

16,75

81,6

10,2

1

16,75

10,2

13,6

2

17,25

85

9,69

2

17,25

9,69

12,75

3

17,5

83,3

9,52

3

17,5

9,52

11,05

4

18,75

88,4

8,5

4

18,75

8,5

10,2

5

18

86,7

8,67

5

18

8,67

10,54

6

19,25

90,1

8,84

6

19,25

8,84

9,86

7

19,5

88,4

9,35

7

19,5

9,35

9,35

8

20

93,5

8,5

8

20

8,5

8,5

9

19,5

96,9

8,5

9

19,5

8,5

7,65

10

20,5

98,6

6,8

10

20,5

6,8

7,99

Обчислимо їх характеристики та виберемо “кращу” з них. Застосуємо до обох моделей функцію ЛИНЕЙН. Отримаємо:

1)для першої моделі:

-0,1086

0,1889

2,7985

0,4204

0,0697

9,6305

0,8315

0,5877

#Н/Д

17,2739

7,0000

#Н/Д

11,9323

2,4177

#Н/Д

2)для другої моделі:

-0,5115

-0,2565

26,1635

0,1318

0,2745

1,6137

0,8905

0,4738

#Н/Д

28,4667

7,0000

#Н/Д

12,7788

1,5712

#Н/Д

З отриманих характеристик моделі видно, що друга модель має дещо кращі параметри ніж перша модель. Дані наведені у таблиці:

Вид моделі

E

R2

F

Fтаб

Y=a0+a1X1+a2X2

0,5877

0,8315

17,2739

0,0517

0,4738

0,8905

28,4667

0,0517

Перевіримо статистичну значущість коефіцієнтів обох моделей:

ta0=

0,2906

ta1=

2,7102

ta2=

-0,2583

ta0=

16,2133

ta1=

-0,9344

ta2=

-3,8826

tтаб= 2,447.

Всі моделі відображають статистичні дані однаково, але друга модель більш якісна за показниками R2, E, F.

Делись добром ;)