Особливості систем одночасних рівнянь
Розділ 2. Практична частина
2.1 Побудувати лінійну багатофакторну економіко-математичну модель залежності фактору Y від факторів Xi
Ідентифікуємо дані:
Y - (залежний фактор);
Х -(незалежний фактор).
, (1.1)
де а0, а1 - коефіцієнти лінійної моделі, е - випадкова складова
Для того, щоб обчислити параметри лінійної регресії, в MS Excel передбачена вбудована функція ЛИНЕЙН (Таблиця 1.1), яка обчислює основні параметри регресії (коефіцієнти регресії, стандартні похибки коефіцієнтів, коефіцієнт детермінації, стандартну похибку, критерій Фішера, сума квадратів різниць між фактичним та середнім значенням фактора Y та суму квадратів залишків). Всі інші параметри можуть бути обчислені згідно означень.
Застосувавши функцію ЛИНЕЙН, одержимо:
Таблиця 1.1
-0,40901 |
0,11914413 |
0,0584917 |
18,68591 |
|
0,206876 |
0,35336699 |
0,0882437 |
11,40585 |
|
0,897981 |
0,49395774 |
#Н/Д |
#Н/Д |
|
17,60429 |
6 |
#Н/Д |
#Н/Д |
|
12,88603 |
1,46396551 |
#Н/Д |
#Н/Д |
В результаті обчислень отримано:
Таблиця 1.2
a0= |
18,6859 |
Sa0= |
11,406 |
R2= |
0,89798 |
|||
a1= |
0,05849 |
Sa1= |
0,0882 |
E= |
0,49396 |
|||
a2= |
-0,11914 |
Sa2= |
0,3534 |
F= |
17,6043 |
|||
a3= |
-0,40901 |
Sa3= |
0,2069 |
n-k= |
6 |
|||
k-1= |
3 |
a0; a1; a2; a3 -коефіцієнти регресії;
Sa0; Sa1; Sa2; Sa3 - стандартні похибки коефіцієнтів;
R2- коефіцієнт детермінації;
Е - стандартна похибка;
F - критерій Фішера;
n-k - число ступенів вільності;
Стандартна похибка моделі Е=0,49395774. У відсотках до Yc похибка становить приблизно 0,4%<15%. Отже модель якісна.
(1.1)
Критерій Фішера застосовується для перевірки рівності дисперсій двох вибірок. Його відносять до критеріїв розсіювання.При перевірці гіпотези положення (гіпотези про рівність середніх значень у двох вибірках) з використанням критерію Стьюдента має сенс заздалегідь перевірити гіпотезу про рівність дисперсій. Якщо вона правильна, то для порівняння середніх можна скористатися більш потужним критерієм.У регресійному аналізі критерій Фішера дозволяє оцінювати значимість лінійних регресійних моделей. Зокрема, він використовується в крокової регресії для перевірки доцільності включення або виключення незалежних змінних (ознак) у регресійну модель.У дисперсійному аналізі критерій Фішера дозволяє оцінювати значимість факторів і їх взаємодії.Критерій Фішера заснований на додаткових припущеннях про незалежність і нормальності вибірок даних. Перед його застосуванням рекомендується виконати перевірку нормальності.
2.2 Проведення аналізу на наявність мультиколінеарності за допомогою методу Фаррара-Глобера
На основі статистичних даних факторів Y та Х (Таблиця 2.1) провести аналіз на наявність мультиколінеарності згідно алгоритму Фаррара-Глобера.
№ п/п |
Y |
Х1 |
Х2 |
Х3 |
|
1 |
16,75 |
81,6 |
10,2 |
13,6 |
|
2 |
17,25 |
85 |
9,69 |
12,75 |
|
3 |
17,5 |
83,3 |
9,52 |
11,05 |
|
4 |
18,75 |
88,4 |
8,5 |
10,2 |
|
5 |
18 |
86,7 |
8,67 |
10,54 |
|
6 |
19,25 |
90,1 |
8,84 |
9,86 |
|
7 |
19,5 |
88,4 |
9,35 |
9,35 |
|
8 |
20 |
93,5 |
8,5 |
8,5 |
|
9 |
19,5 |
96,9 |
8,5 |
7,65 |
|
10 |
20,5 |
98,6 |
6,8 |
7,99 |
Проводимо дослідження на мультиколінеарність згідно алгоритму Фаррара-Глобера:
1. Стандартизація (нормалізація) змінних.
Нормалізуємо пояснюючі змінні. Для цього, знайдемо спочатку за допомогою статистичної функції СРЗНАЧ їх середні значення та за допомогою статистичної функції СТАНДОТКЛОН стандартні відхилення значення.
Далі скористаємося вбудованою функцією НОРМАЛИЗАЦИЯ. Для цього виділяємо 10 рядків та 3 стовпці. Виконуємо наступні команди: Вставка/Функция/Статистические/НОРМАЛИЗАЦИЯ:
В поле Х вводимо одночасно всі значення пояснюючих змінних Х1, Х2, Х3 із таблиці 2.1.
В поле Среднее вводимо середні значення пояснюючих змінних Х1, Х2, Х3 із таблиці 2.2.
В поле Стандартное_откл вводимо значення стандартних відхилень пояснюючих змінних Х1, Х2, Х3 із таблиці 2.2.
№ |
X1 |
X2 |
X3 |
|
середнє значення |
89,25 |
8,857 |
10,149 |
|
стандартні відхилення |
5,624 |
0,933 |
1,943 |
2. Знаходження кореляційної матриці r.
Знайдемо кореляційну матрицю r, для чого скористаємося вбудованою функцією КОРРЕЛ. Отримаємо наступну матрицю парних коефіцієнтів (Таблиця 2.3) кореляції:
Таблиця 2.3
1 |
-0,8662312 |
-0,91226574 |
|
-0,8662312 |
1 |
0,787135837 |
|
-0,912265738 |
0,787135837 |
1 |
Знайдемо множинний коефіцієнт кореляції, для чого скористаємося формулою:
, (2.1)
де: t - табличне значення критерію Стьюдента на рівні значимості та степенями вільності .
Отже, . Таким чином, оскільки, всі , то це говорить про досить тісний звязок між факторами.
3. Визначення критерію Пірсона.
Для відповіді на питання: чи є цей звязок наслідком мультиколінеарності чи ні скористаємося спочатку критерієм ч2. Для цього обчислимо визначник матриці r:
.
Обчислимо критерій Пірсона за формулою:
(2.2)
Будемо мати:
22,741.
Знайдемо . Для цього використаємо вбудовану функцію ХИ2ОБР. Отримаємо,
7,81473.
Так як , то в масиві пояснюючих змінних існує мультиколінеарність.
4. Визначення матриці .
Визначимо матрицю С, обернену до матриці парних коефіцієнтів кореляції (скористаємося вбудованою функцією МОБР) і отримаємо:
9,0849 |
3,5381 |
5,5029 |
||
C= |
3,5381 |
4,0066 |
0,0740 |
|
5,5029 |
0,0740 |
5,9619 |
5. Обчислення F-критеріїв.
Обчислимо значення F-критеріїв для кожної пояснюючої змінної за формулою:
,
де сіі - діагональні елементи матрисі С.
Будемо мати:
F1= |
16,1699 |
|
F2= |
6,0133 |
|
F3= |
9,9237 |
Обчислимо табличне значення критерію Фішера та порівняємо його зі знайденими F-критеріями:
Fтаб= 0,0517 .
Так як F1>Fтаб, F2>Fтаб, F3>Fтаб, то це значить, що кожна з пояснюючих змінних мультиколінеарна з іншими.
Знайдемо частинні коефіцієнти детермінації для кожної змінної. Для чого скористаємося формулою:
R2(x1)= |
0,8899 |
|
R2(x2)= |
0,7504 |
|
R2(x3)= |
0,8323 |
6. Визначення частинних коефіцієнтів кореляції.
Визначимо частинні коефіцієнти кореляції, які показують на тісноту звязку між змінними хі та хj при умові, що всі інші змінні не впливають на цей звязок. Для цього скористаємося формулою:
r12= |
-0,5864 |
|
r13= |
0,7477 |
|
r23= |
0,0151 |
так як r12<rкр, то між змінними х1 (фондовіддача) і х2 (продуктивність праці) не існує тісного звязку, якщо не враховувати вплив питомих інвестицій;
- так як r13>rкр, то між змінними х1 (фондовіддача) та х3 (питомі інвестиції) існує тісний звязок, якщо не враховувати вплив продуктивності праці;
- так як r23<rкр, то між змінними х2 (продуктивність праці) і х3 (питомі інвестиції) не існує тісного звязку, якщо не враховувати вплив фондовіддачі.
7. Обчислення t-критеріїв.
Знайдемо, чи звязані мультиколінеарно фактори х1 і х2, х1 і х3 та х2 і х3 відповідно. Для цього обчислимо t-критерії за формулою:
t12= |
-1,7735 |
|
t13= |
2,7583 |
|
t23= |
0,0371 |
Обчислимо tтаб=2,447 і порівняємо цей критерій зі знайденими раніше значеннями t-критеріїв.
Так як t12<tтаб, то між змінними х1 і х2 не існує мультиколінеарого звязку; так як t13>tтаб, то між змінними x1 і х3 є мультиколінеарний звязок; так як t23<tтаб, то між змінними х2 і х3 також не існує мультиколінеарного звязку.
Для включення факторів у модель потрібно, щоб вони були слабо звязані між собою, та звязані з результуючим фактором. Оскільки між факторами х1 і х3 виявлено мультиколінеарний звязок, то краще у шукану модель фактори х1 та х3 разом не включати. Таким чином, розглянемо дві моделі:
Y=a0+a1X1+a2X2
№ |
Y |
Х1 |
Х2 |
№ |
Y |
Х2 |
Х3 |
|
1 |
16,75 |
81,6 |
10,2 |
1 |
16,75 |
10,2 |
13,6 |
|
2 |
17,25 |
85 |
9,69 |
2 |
17,25 |
9,69 |
12,75 |
|
3 |
17,5 |
83,3 |
9,52 |
3 |
17,5 |
9,52 |
11,05 |
|
4 |
18,75 |
88,4 |
8,5 |
4 |
18,75 |
8,5 |
10,2 |
|
5 |
18 |
86,7 |
8,67 |
5 |
18 |
8,67 |
10,54 |
|
6 |
19,25 |
90,1 |
8,84 |
6 |
19,25 |
8,84 |
9,86 |
|
7 |
19,5 |
88,4 |
9,35 |
7 |
19,5 |
9,35 |
9,35 |
|
8 |
20 |
93,5 |
8,5 |
8 |
20 |
8,5 |
8,5 |
|
9 |
19,5 |
96,9 |
8,5 |
9 |
19,5 |
8,5 |
7,65 |
|
10 |
20,5 |
98,6 |
6,8 |
10 |
20,5 |
6,8 |
7,99 |
Обчислимо їх характеристики та виберемо “кращу” з них. Застосуємо до обох моделей функцію ЛИНЕЙН. Отримаємо:
1)для першої моделі:
-0,1086 |
0,1889 |
2,7985 |
|
0,4204 |
0,0697 |
9,6305 |
|
0,8315 |
0,5877 |
#Н/Д |
|
17,2739 |
7,0000 |
#Н/Д |
|
11,9323 |
2,4177 |
#Н/Д |
2)для другої моделі:
-0,5115 |
-0,2565 |
26,1635 |
|
0,1318 |
0,2745 |
1,6137 |
|
0,8905 |
0,4738 |
#Н/Д |
|
28,4667 |
7,0000 |
#Н/Д |
|
12,7788 |
1,5712 |
#Н/Д |
З отриманих характеристик моделі видно, що друга модель має дещо кращі параметри ніж перша модель. Дані наведені у таблиці:
Вид моделі |
E |
R2 |
F |
Fтаб |
|
Y=a0+a1X1+a2X2 |
0,5877 |
0,8315 |
17,2739 |
0,0517 |
|
0,4738 |
0,8905 |
28,4667 |
0,0517 |
Перевіримо статистичну значущість коефіцієнтів обох моделей:
ta0= |
0,2906 |
|
ta1= |
2,7102 |
|
ta2= |
-0,2583 |
|
ta0= |
16,2133 |
|
ta1= |
-0,9344 |
|
ta2= |
-3,8826 |
tтаб= 2,447.
Всі моделі відображають статистичні дані однаково, але друга модель більш якісна за показниками R2, E, F.