logo
Аналіз ціноутворення по автосалонам Луганської області

Розділ 2. Побудова моделі

продаж ціна автомобіль статистичний

Для того, щоб побудувати багатофакторну модель, необхідно визначити чи існує взагалі залежність між У та кожним Х-ом. Для цього побудуємо загальну кореляційну матрицю і визначимо напрямки звязку за допомогою пакета Аналізу MS Excel та діаграм розсіювання.

Таблиця 2.1. Регресійна статистика

Множинний R

0,891355412

R-квадрат

0,79451447

Нормований R-квадрат

0,729132711

Стандартна помилка

4,715672745

Спостереження

30

Вся сукупність має множинний R = 0,89, що відповідає сильній тісній залежності, множинний R знаходиться в інтервалі від 0 до 1. R-квадрат - коефіцієнт детермінації, говорить про те, що 79% зміни ціни на авто пояснюється змінами Х-ів. Кореляція між ціною та обємом двигуна = 0,62 сильна кореляція (див. додатки табл. 2.2). [3] Дійсно, чим більший обєм двигуна, тим ціна на авто буде підійматися угору. Максимальна потужність та ціна також мають високу кореляцію, бачимо, що між обємом двигуна і максимальною потужністю є залежність, але вона (0,31) недостатня й менше 0,7, тому їх залежність не підтверджена, мультиколінеарності немає і цю змінну можна використовувати у аналізі й надалі. Максимальна швидкість та обєм двигуна також мають звязок = 0,64 - немає мультиколінеарності, але звязок середній, бо збільшення швидкості залежить від обєму двигуна. Обєм багажника, паливний бак та маса спорядженого авто не мають сильного впливу на досліджувану змінну-ціну, немає навіть мінімального звязку між ними самими, тому їх можна з легкістю вилучити із моделі. Ціна та витрати палива мають зворотну залежність, але високу (-0,77) кореляцію. При зростанні витрат на паливо в 1 л на 100 км, буде зростати ціна на машину, тобто мінімальні витрати на паливо = максимальній ціні за машину. Звичайно економічність транспортного засобу стає на першому місці, бо покупцю хочеться витрачати на великих відстанях якомога менше пального.

Стандартна похибка - це стандартне відхилення оцінок, вона складає - 4,71. Результат не перевищує 5%, чим менше стандартна похибка, тим більше достовірною є оцінка. Представлена вище оцінка є статистично достовірною.

З таблиці видно, що між ціною та обємом двигуна кореляція = 0,62 - прямий і тісним звязком; між ціною та максимальною потужністю = 0,68 - також сильна кореляційна залежність; між ціною та максимальною швидкістю = 0,83 та ціною і витратами пального = -0,77 - обернена сильна залежність. [3] Продемонструємо наглядне зображення тісноти звязку за допомогою діаграм розсіювання.

Рис. 2.1. Діаграма розсіювання

Маємо параболічну залежність, звязок обернений, коефіцієнт апроксимації показує, що підібрана модель описує вплив на ціну - 40,05%. Приймаємо альтернативну гіпотезу, обєм двигуна добре впливає на кінцеву ціну за авто. Приймаємо альтернативну гіпотезу.

Рис. 2.2. Діаграма розсіювання

Для опису краще підходить параболічна обернена залежність, де вибраний Х описує вплив на У - 71,99%, що говорить про дуже тісний звязок і великий вклад змінної (максимальна потужність) у формування кінцевої ціни на авто. Приймаємо альтернативну гіпотезу. [3]

Рис. 2.3. Кореляційне поле

В цьому випадку пряма лінійна залежність, на 69,45% підібрана модель описує вплив на результуючу ознаку - ціну. Отримане рівняння регресії досить точно описує кореляційне поле. При збільшенні ціни на авто технологи збільшують швидкість автомобіля. Відкидаємо нульову гіпотезу.

Рис. 2.4. Кореляційне поле

Обернений та щільний звязок, підібрана модель відповідає на 58,99%. При зростанні у автомобіля під час руху витрат пального, кінцева ціна на легковий автомобіль знижується, тобто чим більші витрати пального, тим нижча буде ціна. Це логічно, бо для водіїв витрати пального займають дуже важливе місце, хочеться, щоб автомобіль втрачав якомога менше бензину при пересуванні, при будь-якій швидкості. [3]

Рис. 2.5. Діаграма розсіювання

Цей звязок краще описує параболічне рівняння, яке показує зворотній та нещільний звязок, бо точки розкидані на полі хаотично. Також коефіцієнт апроксимації = 0,0345, який говорить, що обєм багажника змінить ціну лише на 3,45%. Існує багато викидів, які заважають розгледіти звязок між факторами. Підібрана змінна не описує вплив на результуючу ознаку. Приймаємо нульову гіпотезу. [3]

Рис. 2.6. Кореляційне поле

Зворотна лінійна залежність, не тісна, це підтверджують точки на полі, які мають хаотичний вигляд і не групуються близько до лінії тренда, коефіцієнт апроксимації - Х описує У лише на 5,2%. Пальний бак не внесе змін до ціни. Приймаємо знову нульову гіпотезу.

Рис. 2.7. Кореляційне поле

Графік розподілився на окремі кластери. Існують викиди з сукупності. Присутня лінійна залежність, але не знана, Х описує вплив на У лише на 6,8 відсотків. Приймаємо нульову гіпотезу.

Отже, змінні, що не мають впливу на модель потрібно вилучити, важливого внеску вони не приносять, інтерпретувати по іншому їх неможливо. Модель будується, для того, щоб зрозуміти чи залежить ціна від наведених факторів, виявилося, що не від усіх. Звичайно розмір багажного відділення для покупця має велике значення, але при розробці транспортних засобів інтереси споживачів враховуються не повною мірою, хоча для подорожі всією родиною мати достатньо місця для одягу та харчів важливо. Що стосується маси спорядження, то цей фактор не потрібен покупцеві, а для виробників спорядити авто деталями витратний фактор, та на ціну він ні як не впливає. Чому обєм пального баку не впливає на ціну не зрозуміло, можливо тому, що не завжди великий обєм баку супроводжується малими витратами пального та більшим часом знаходження у дорозі.

Розглянемо таблицю регресійного та дисперсійного аналізу, щоб упевнитись, що вилучені змінні дійсно статистично не значущі.

Таблиця 2.3. Дисперсійний аналіз

Дисперсійний аналіз

df

SS

MS

F

Значущість F

Регресія

7

1891,60548

270,2293556

1,2151928

2,85131

Остаток

22

489,226527

22,2375694

Всього

29

2380,83201

F = 1,215 < F табл. 2,53, критичне значення було отримано із таблиці, де k1 = 6, а k2 = 23; Значущість F (p - значення) = 2,85, яке повинно бути менше 0,05. SS - сума квадратів, MS - середній квадрат або дисперсія. Бачимо коефіцієнти рівняння (див. табл. 2.4.), стандартну похибку, яка в усіх випадках невелика. Далі t-статистика, значення потрібно порівняти з табличними t-критичне = 2,045 при рівні значущості 0,05 і ступенях свободи 29, у X4 = -0,014, у X5 = -0,071 й у X6 = 0,0003, значення менше критичного, тому знову не значущість змінних. p1 - 0,233; p2 - 0,73; p3 - 0,896, які ? 0,05- модель не значуща і коефіцієнти звісно не підходять. Остання перевірка за допомогою довірчих інтервалів, при цих змінних 0 потрапляє у межі, тому приймаємо нульову гіпотезу і спокійно викидаємо вище згадані зміні. [4,5]

Продовжимо аналіз проблеми на базі новоутвореної сукупності.

Таблиця 2.5. Новоутворена сукупність

Авто

Ціна (тис грн.. (y)

Обєм двигуна (л)

Максимальна потужність (кінських сил)

Максимальна швидкість (км/год.)

Витрати пального (л/100км)

ЗАЗ Forza F4LM554

88,8

1,02

90

120

6

FAW B50

109,9

1,6

120

150

5,2

FIAT linea

100,9

1,4

110

165

5

Opel Astra

95,9

1,3

100

110

6,3

Ranault Logan

111,8

1,6

115

164

4,9

Renault Sandero

110,8

1,6

112

164

5,3

nissan micra

109,9

1,2

150

166

5,1

Toyota Yaris

90,85

1,00

90

110

7

Hyundai i20

88

1,15

85

100

6,9

Ford Fiesta Comfort

100

1,25

91

168

5,4

SEAT Ibiza

105,9

1,40

180

163

5,4

Honda Jazz

87,9

1,15

90

115

6,8

Volkswagen Polo

112,9

1,20

120

165

5,5

Opel Corsa

112

1,20

130

168

5

Nissan Micra

110

1,24

180

167

5,4

Citroen C3

111,8

1,36

115

163

5,3

Mitsubishi Colt

89

1,00

90

100

7

Skoda Fabia

102

1,20

100

120

5,1

Peugeot 207

112

1,4

130

170

4,9

Mazda 2 IPM

110,6

1,50

126

168

5

ВАЗ Калина

88,9

1,30

80

110

7

Geely CK-2

90

1,20

85

100

6

Chevrolet Aveo

100,36

1,50

112

176

4

Daewoo Lanos

105,9

1,50

118

172

4,2

MG 350

107

1,49

106

180

4

MG3 Cross

107,98

1,48

140

182

4,1

Kia ceed JD

108

1,6

145

190

4,8

Hyundai electra

110,56

1,78

135

158

4,3

Skoda Rapid

110

1,19

122

195

4,5

LEXUS LX

112

1,8

103

220

4,2

Будуємо кореляційну матрицю (див. табл. 2.6). З виключенням декількох змінних кореляція не змінилась. Звязок тісний. Проводимо регресійний аналіз.

Табл. 2.7. Регресія

Висновок підсумків

регресійна статистика

множинний R

0,881604615

R-квадрат

0,777226697

Нормований R-квадрат

0,741582968

стандартна помилка

4,606021331

спостереження

30

Множинний R = 0,88 - звязок тісний, R-квадрат більше табличного значення (0,306) - відповідна модель значна. Нормований R вказує на кореляцію з урахуванням похибки, тобто кореляція у 0,78 підтверджує тісноту звязку. Стандартна похибка = 4,6 - відхил від генеральної сукупності незначний. Значимість F = 0,00000007, що менше 0,05, також підтверджується значимість моделі. Стандартна похибка коефіцієнта а = 19,91, який < самого коефіцієнта (69,87), це означає що коефіцієнт статистично значний. Стандартні похибки коефіцієнтів b також менше їх значень, тож усі коефіцієнти значимі. P-значення менше 0,05підтверджується значимість обраної моделі. Нуль в довірчі інтервали також не входить (див. табл. 2.8). [4] Змінимо рівень надійності на 80%:

Таблиця 2. 9. Довірчі інтервали

Нижні 80,0%

Верхні 80,0%

45,7162406

105,9034399

1,920507639

13,41074972

0,010662098

0,14604215

0,072527065

0,243287399

1,662728093

3,818739366

Модель пройшла перевірку на значимість усіма статистичними способами. Обрані технічні характеристик значущі і добре описують вплив на формування ціни за новий (салонний) автомобіль. Далі необхідно визначити, яка саме факторна ознака найбільше впливає на факторний У. Розрахуємо часний коефіцієнт еластичності (Е) для кожного фактора за формулою 3.2.

(3.2)

Таблиця 2.10. Коефіцієнти еластичності

Коефіцієнти

E1 =

0,52638505

E2 =

0,123997362

E3 =

0,292753618

E7 =

-0,36522617

Дивлячись на розраховані коефіцієнти еластичності, робимо висновок, що найвагоміший внесок у визначення ціни має обєм двигуна = 0.52%. З упевненістю говоримо, що при зміні обєму двигуна на 1%, ціна збільшиться на 0,52%. Ця змінна має більший вплив на ціну з поміж інших змінних. Для користувачів автомобілів обєм двигуна першочерговий фактор. [6]