logo
Лінійна регресія

Задача 1. Парна лінійна регресія

На фірмі ТОВ «Зірка Кривбасу», яка має достатньо велику кількість торгових точок, розглядається можливість збільшення торгівельної площі, за рахунок чого фірма розраховує збільшити товарооборот.

Для вирішення цього питання, менеджерам фірми необхідно виконати економетричне дослідження, метою якого є визначення кількісного звязку між торгівельною площею і товарооборотом.

Дані вибіркових статистичних спостережень за означеними показниками наведені у таблиці 1.1.

"right">Таблиця 1.1

Вихідні дані

№ торгівельного підприємства

Торгова площа (м2)

Товарооборот (тис. грн.),

х

y

1

268,40

580,50

2

351,00

700,00

3

369,50

832,00

4

423,50

859,10

5

452,00

1 078,00

6

531,60

1 095,30

7

583,20

1 141,30

8

630,50

1 374,00

9

676,20

1 390,60

10

755,00

1 441,30

Необхідно:

1. Виконати специфікацію економетричної моделі, яка описує залежність обсягів продажу (товарообороту) під торгової площі (побудувати діаграму розсіювання, обґрунтувати можливість використання лінійної функції для економетричної моделі і ввести умовні позначення). Записати загальну лінійну (теоретичну) модель, вибіркову і рівняння регресії.

2. Визначити оцінки параметрів моделі методом найменших квадратів і дати їм економічну інтерпретацію.

3. Визначити товарооборот для прогнозного значення торгової площі хпр.=770 м2.

4. Перевірити загальну адекватність моделі та значимість параметрів моделі і вибіркового коефіцієнта парної кореляції побудованої економічної моделі статистичним даними для рівня значимості .

5. Побудувати інтервали довіри та визначити середній коефіцієнт еластичності, дати їм економічну інтерпретацію.

6. Зробити відповідні висновки.

Рішення

Спочатку за фактичними даними таблиці встановимо належність змінних до груп незалежних та залежних: очевидно, що за незалежні змінні х приймається торгова площа, а за залежну (результативну) y - товарооборот.

Виконаємо специфікацію економетричної моделі, яка описує залежність товарообороту Y від торгової площі Х, для чого побудуємо діаграму розсіювання, показавши точками на рисунку дані таблиці.

Рис. 1.1 Діаграма розсіювання

Як видно з рисунку 1.1, розміщення точок відповідає лінійній залежності для парної (звязок із залежною змінною y здійснюється з одним видом незалежних х) регресії.

Запишемо загальну (теоретичну) модель:

(1.1)

де , - параметри функції;

- стохастична складова.

Але для того, щоб визначити теоретичні значення параметрів ?і, необхідно знати всі значення змінних генеральної сукупності, а це практично неможливо, тому запишемо емпіричну (вибіркову) модель:

(1.2)

де b0, b1 - оцінки параметрів , ;

е - оцінка стохастичної складової.

Тобто рівняння регресії матиме вигляд:

(1.3)

Для визначення оцінок параметрів моделі методом найменших квадратів побудуємо розрахункову таблицю 1.1

"right">Таблиця 1.1

Розрахункові дані для визначення оцінок моделі лінійної регресії

хі

yi

хі2

хіyi

yі2

yі

еі2=(yi-yі)2

(yіср.)2

1

268,40

580,50

72 038,56

155 806,20

336 980,25

609,729

854,3489

193 143,3322

2

351,00

700,00

123 201,00

245 700,00

490 000,00

763,750

4 064,0403

81 487,5111

3

369,50

832,00

136 530,25

307 424,00

692 224,00

798,246

1 139,3352

62 982,9493

4

423,50

859,10

179 352,25

363 828,85

738 052,81

898,937

1 587,0168

22 581,8604

5

452,00

1 078,00

204 304,00

487 256,00

1 162 084,00

952,080

15 855,8279

9 434,2227

6

531,60

1 095,30

282 598,56

582 261,48

1 199 682,09

1 100,507

27,1096

2 631,3498

7

583,20

1 141,30

340 122,24

665 606,16

1 302 565,69

1 196,723

3 071,7011

21 760,0644

8

630,50

1 374,00

397 530,25

866 307,00

1 887 876,00

1 284,921

7 935,0407

55 559,7483

9

676,20

1 390,60

457 246,44

940 323,72

1 933 768,36

1 370,136

418,7782

102 993,4524

10

755,00

1 441,30

570 025,00

1 088 181,50

2 077 345,69

1 517,071

5 741,2166

218 893,7432

Всього

5 040,90

10492,10

2 762 948,55

5 702 694,91

11 820 578,89

10 492,10

40 694,4153

771 468,2337

Середнє

504,09

1 049,21

276 294,86

570 269,49

1 182 057,89

1 049,21

4 069,4415

77 146,8234

Побудуємо рівняння лінійної регресії , розрахувавши коефіцієнти b0, b1 методом найменших квадратів (1МНК). Значення оцінок при цьому визначаються за наступною залежністю:

,(1.4)

або

(1.5)(1.6)

Отже, рівняння лінійної регресії має вигляд: .

Коефіцієнт b1 при незалежній змінній х показує, на скільки зміниться в середньому величина y при зміні фактора х на 1 одиницю виміру; в даному випадку товарооборот зросте на 1,8647 тис. грн. (1 864,7 грн.), якщо торгова площа магазину збільшиться на 1 м2.

Вільний член b0 рівняння регресії визначає прогнозоване значення y при величині торгової площі х, що дорівнює нулю (тобто, наприклад, торгівля зі складу тощо.). В даному разі ця величина дорівнює 109,256 тис. грн. Цей факт можна пояснити тим, що фірма ТОВ «Зірка Кривбасу» може вести торгівлю, навіть не маючи власних торгових точок, тобто займатися постачанням товару торговим точкам, які їй не належать (оптова торгівля).

Розрахуємо вибірковий коефіцієнт парної кореляції ryх, який розраховується за формулою:

(1.7)

де - вибіркові дисперсії для кожної змінної, які розраховуються за формулами:

(1.8)

(1.9)

- вибіркова коваріація, яка розраховується за формулою:

(1.10)

або 97,46%

Коефіцієнт кореляції показує, наскільки значним є вплив змінної хі на yi, чим ближчий коефіцієнт кореляції до 1, тим тісніше звязок між незалежною та залежною змінними. В нашому випадку обсяг товарообороту (залежна змінна у) на 97,46% залежить від площі торгової точки (незалежної змінної х), при цьому ця залежність є прямою, тобто при зростанні площі торгової точки збільшується і обсяг товарообороту.

Також обчислимо коефіцієнт детермінації R2 за формулою:

(1.11)

Отримане значення коефіцієнту детермінації вказує на те, що величина площі торгових точок фірми „Зірка Кривбасу” на 94,99% визначає варіацію (мінливість) його обсягу товарообороту.

Для перевірки статистичної адекватності моделі розрахуємо критерій Фішера через відоме значення коефіцієнта детермінації R2 для рівня значимості за формулою:

(1.12)

де m - кількість незалежних змінних економетричної моделі.

Порівняємо отримане значення F-критерію Фішера з табличним з V1=m=1 та V2=n-k=n-m-1=10-2=8 ступенями свободи (де k - кількість параметрів економетричної моделі) та рівнем значимості , яке дорівнює 5,318

Тобто на підставі того, що Fрасч.>Fкрит. (151,6608>5,318), робимо висновок про адекватність моделі, тобто гіпотеза про випадкову природу оцінюваних характеристик відхиляється і можливо визнати її статистичну значимість та надійність.

Тепер оцінимо статистичну значимість коефіцієнтів b1 та b0 знайденого рівняння регресії за критерієм Стьюдента для рівня значимості :

(1.13)(1.14)

де та - оцінки середніх квадратичних відхилень параметрів b0 та b1.

Для чого спочатку побудуємо дисперсійно-коваріаційну матрицю:

(1.15)

де

- оцінка дисперсії випадкової складової моделі

де k=m+1 - кількість параметрів моделі (m - кількість незалежних змінних (факторів) моделі).

Знайдемо розрахункові значення показника за рівнянням регресії і занесемо до таблиці (табл. 1.1).

Розрахуємо оцінку дисперсії випадкової складової моделі

,

тобто , а .

Звідки маємо:

.

Знайдемо tкрит. для рівня значимості та df=10-k=10-2=8 за таблицею: tкрит.=t?/2=.

Так як (1,3728<2,306), то цей параметр моделі двофакторної лінійної регресії є незначущим, тобто цей параметр лінійної регресії не впливає суттєво на змінювання регресанда у (обсяг товарообороту фірми).

Так як (12,3151>2,306), то незалежна змінна х (площа торгових точок) моделі парної лінійної регресії є значимою, тобто вона сформувалася під впливом систематично діючого фактору і суттєво впливає на змінювання регресанда у (обсяг товарообороту фірми)

Виконаємо t-тестування вибіркового коефіцієнта парної кореляції ryx.

Розрахункове значення t-статистики визначимо за формулою:

(1.16)

Отримане (12,315>2,306), тобто знайдений вибірковий коефіцієнт кореляції моделі парної лінійної достовірний (значущий), а звязок між залежною змінною у (обсяг товарообороту) та незалежним фактором х (площа торговельних точок) суттєвий.

Для парної лінійної моделі обидва способи перевірки значимості з використанням F- і t-кpитepіїв рівнозначні, тому що ці критерії повязані співвідношенням:

(1.17)

Таким чином, розрахунки виконано вірно.

Визначимо товарооборот для прогнозного значення торгової площі хпр.=770 м2.

Отже, обсяг товарообороту для прогнозного значення торгової площі, яке дорівнює 770 м2, становить 1 545,041 тис. грн.

Побудуємо інтервали довіри для індивідуального значення обсягу товарообороту та визначимо середній коефіцієнт еластичності.

Визначимо мінімальні та максимальні значення товарообороту за допомогою інтервалу довіри для індивідуальних значень незалежної змінної хі, для вихідних статистичних даних та прогнозного значення товарообороту:

,(1.18)

де - табличне значення t-критерію Стюдента для рівня значимості /2=0,025;

S - середня залишкова сума квадратів з урахування ступенів свободи:

,(1.19)

де m - кількість факторів (незалежних змінних) регресії;

D - виправлена дисперсія (незміщена оцінка генеральної дисперсії) для змінної х (використовується при n<30):

,(1.20)

Отже, при отримуємо:

"right">Таблиця 1.2

Розрахункові дані для визначення інтервалу довіри лінійної регресії

хі

yi

yі

еі2=(yi-yі)2

іср.)2

yі-min

yі+max

1

268,40

580,50

609,729

854,3489

55 549,7761

93,808

515,921

703,537

2

351,00

700,00

763,750

4 064,0403

23 436,5481

72,639

691,111

836,389

3

369,50

832,00

798,246

1 139,3352

18 114,4681

68,502

729,744

866,748

4

423,50

859,10

898,937

1 587,0168

6 494,7481

58,460

840,477

957,398

5

452,00

1 078,00

952,080

15 855,8279

2 713,3681

54,797

897,283

1 006,877

6

531,60

1 095,30

1 100,507

27,1096

756,8001

52,802

1 047,705

1 153,308

7

583,20

1 141,30

1 196,723

3 071,7011

6 258,3921

58,238

1 138,485

1 254,961

8

630,50

1 374,00

1 284,921

7 935,0407

15 979,4881

66,770

1 218,151

1 351,691

9

676,20

1 390,60

1 370,136

418,7782

29 621,8521

77,169

1 292,967

1 447,305

10

755,00

1 441,30

1 517,071

5 741,2166

62 955,8281

98,044

1 419,027

1 615,114

Всього

5 040,90

10 492,10

10 492,10

40 694,4153

221 881,2690

-

-

-

Середнє

504,09

1 049,21

1 049,21

4 069,4415

22 188,1269

-

-

-

Прогноз

770,00

-

1 545,041

-

-

102,289

1 442,751

1 647,330

Побудуємо графік, на який нанесемо точки вибірки (xi,yi) та пряму регресії і точку (xn+1; yn+1), а також лінії інтервалу довіри .

На основі отриманої моделі визначимо середній коефіцієнт еластичності за наступною формулою:

(1.21)

Отримане значення середнього коефіцієнту еластичності показує, що обсяг товарообороту (у) зміниться на 0,898% при зміні величини торгової площі (х) на 1%.

Рис. 1.2 Лінія лінійної регресії та інтервал довіри для індивідуальних значень обсягу товарообороту

В даному випадку, так як , то зміни відбуватимуться в одному напрямку, тобто при збільшенні величини торгової площі на 1% обсяг товарообороту зросте на 0,896%; при зменшенні торгової площі на 1% товарооборот знизиться на 0,896%.

Розглянувши можливість збільшення торгівельної площі, за рахунок якої фірма «Зірка Кривбасу» розраховує збільшити товарооборот, було проведено специфікацію економетричної моделі, внаслідок чого було отримано рівняння лінійної регресії з вибірковим коефіцієнтом парної кореляції

Вибірковий коефіцієнт парної кореляції вказує, що обсяг товарообороту (залежна змінна у) на 97,46% залежить від площі торгової точки (незалежної змінної х).

Виконавши t-тестування вибіркового коефіцієнта парної кореляції ryx, було визначено, що знайдений вибірковий коефіцієнт кореляції моделі парної лінійної регресії достовірний (значущий), а звязок між залежною змінною у (обсяг товарообороту) та незалежним фактором х (площа торговельних точок) є суттєвим.

Отримане значення коефіцієнту детермінації вказує на те, що величина площі торгових точок ТОВ „Зірка Кривбасу” на 94,99% визначає варіацію його обсягу товарообороту.

Обсяг товарообороту для прогнозного значення торгової площі, яке дорівнює 770 м2, становить 1 545,041 тис. грн.

Отримане значення середнього коефіцієнту еластичності показує, що обсяг товарообороту (у) зміниться на 0,896% при зміні величини торгової площі (х) на 1%.

В результаті порівняння стандартних помилок оцінок параметрів моделі з величиною цих оцінок можемо зробити висновок, що стандартна помилка оцінки параметру b0 (79,5882) становить 72,8% абсолютного значення цієї оцінки (109,2556), що свідчить про істотну зміщеність даної оцінки параметру моделі. Стандартна помилка оцінки параметру b1 (0,1514) становить 8,11% (трохи більше за 5%) абсолютного значення цієї оцінки (1,8647), а це означає, що даний параметр має незначне зміщення, яке зумовлюється невеликою сукупністю спостережень (n=10).