Розділ 2. Побудова моделі
продаж ціна автомобіль статистичний
Для того, щоб побудувати багатофакторну модель, необхідно визначити чи існує взагалі залежність між У та кожним Х-ом. Для цього побудуємо загальну кореляційну матрицю і визначимо напрямки звязку за допомогою пакета Аналізу MS Excel та діаграм розсіювання.
Таблиця 2.1. Регресійна статистика
Множинний R |
0,891355412 |
|
R-квадрат |
0,79451447 |
|
Нормований R-квадрат |
0,729132711 |
|
Стандартна помилка |
4,715672745 |
|
Спостереження |
30 |
Вся сукупність має множинний R = 0,89, що відповідає сильній тісній залежності, множинний R знаходиться в інтервалі від 0 до 1. R-квадрат - коефіцієнт детермінації, говорить про те, що 79% зміни ціни на авто пояснюється змінами Х-ів. Кореляція між ціною та обємом двигуна = 0,62 сильна кореляція (див. додатки табл. 2.2). [3] Дійсно, чим більший обєм двигуна, тим ціна на авто буде підійматися угору. Максимальна потужність та ціна також мають високу кореляцію, бачимо, що між обємом двигуна і максимальною потужністю є залежність, але вона (0,31) недостатня й менше 0,7, тому їх залежність не підтверджена, мультиколінеарності немає і цю змінну можна використовувати у аналізі й надалі. Максимальна швидкість та обєм двигуна також мають звязок = 0,64 - немає мультиколінеарності, але звязок середній, бо збільшення швидкості залежить від обєму двигуна. Обєм багажника, паливний бак та маса спорядженого авто не мають сильного впливу на досліджувану змінну-ціну, немає навіть мінімального звязку між ними самими, тому їх можна з легкістю вилучити із моделі. Ціна та витрати палива мають зворотну залежність, але високу (-0,77) кореляцію. При зростанні витрат на паливо в 1 л на 100 км, буде зростати ціна на машину, тобто мінімальні витрати на паливо = максимальній ціні за машину. Звичайно економічність транспортного засобу стає на першому місці, бо покупцю хочеться витрачати на великих відстанях якомога менше пального.
Стандартна похибка - це стандартне відхилення оцінок, вона складає - 4,71. Результат не перевищує 5%, чим менше стандартна похибка, тим більше достовірною є оцінка. Представлена вище оцінка є статистично достовірною.
З таблиці видно, що між ціною та обємом двигуна кореляція = 0,62 - прямий і тісним звязком; між ціною та максимальною потужністю = 0,68 - також сильна кореляційна залежність; між ціною та максимальною швидкістю = 0,83 та ціною і витратами пального = -0,77 - обернена сильна залежність. [3] Продемонструємо наглядне зображення тісноти звязку за допомогою діаграм розсіювання.
Рис. 2.1. Діаграма розсіювання
Маємо параболічну залежність, звязок обернений, коефіцієнт апроксимації показує, що підібрана модель описує вплив на ціну - 40,05%. Приймаємо альтернативну гіпотезу, обєм двигуна добре впливає на кінцеву ціну за авто. Приймаємо альтернативну гіпотезу.
Рис. 2.2. Діаграма розсіювання
Для опису краще підходить параболічна обернена залежність, де вибраний Х описує вплив на У - 71,99%, що говорить про дуже тісний звязок і великий вклад змінної (максимальна потужність) у формування кінцевої ціни на авто. Приймаємо альтернативну гіпотезу. [3]
Рис. 2.3. Кореляційне поле
В цьому випадку пряма лінійна залежність, на 69,45% підібрана модель описує вплив на результуючу ознаку - ціну. Отримане рівняння регресії досить точно описує кореляційне поле. При збільшенні ціни на авто технологи збільшують швидкість автомобіля. Відкидаємо нульову гіпотезу.
Рис. 2.4. Кореляційне поле
Обернений та щільний звязок, підібрана модель відповідає на 58,99%. При зростанні у автомобіля під час руху витрат пального, кінцева ціна на легковий автомобіль знижується, тобто чим більші витрати пального, тим нижча буде ціна. Це логічно, бо для водіїв витрати пального займають дуже важливе місце, хочеться, щоб автомобіль втрачав якомога менше бензину при пересуванні, при будь-якій швидкості. [3]
Рис. 2.5. Діаграма розсіювання
Цей звязок краще описує параболічне рівняння, яке показує зворотній та нещільний звязок, бо точки розкидані на полі хаотично. Також коефіцієнт апроксимації = 0,0345, який говорить, що обєм багажника змінить ціну лише на 3,45%. Існує багато викидів, які заважають розгледіти звязок між факторами. Підібрана змінна не описує вплив на результуючу ознаку. Приймаємо нульову гіпотезу. [3]
Рис. 2.6. Кореляційне поле
Зворотна лінійна залежність, не тісна, це підтверджують точки на полі, які мають хаотичний вигляд і не групуються близько до лінії тренда, коефіцієнт апроксимації - Х описує У лише на 5,2%. Пальний бак не внесе змін до ціни. Приймаємо знову нульову гіпотезу.
Рис. 2.7. Кореляційне поле
Графік розподілився на окремі кластери. Існують викиди з сукупності. Присутня лінійна залежність, але не знана, Х описує вплив на У лише на 6,8 відсотків. Приймаємо нульову гіпотезу.
Отже, змінні, що не мають впливу на модель потрібно вилучити, важливого внеску вони не приносять, інтерпретувати по іншому їх неможливо. Модель будується, для того, щоб зрозуміти чи залежить ціна від наведених факторів, виявилося, що не від усіх. Звичайно розмір багажного відділення для покупця має велике значення, але при розробці транспортних засобів інтереси споживачів враховуються не повною мірою, хоча для подорожі всією родиною мати достатньо місця для одягу та харчів важливо. Що стосується маси спорядження, то цей фактор не потрібен покупцеві, а для виробників спорядити авто деталями витратний фактор, та на ціну він ні як не впливає. Чому обєм пального баку не впливає на ціну не зрозуміло, можливо тому, що не завжди великий обєм баку супроводжується малими витратами пального та більшим часом знаходження у дорозі.
Розглянемо таблицю регресійного та дисперсійного аналізу, щоб упевнитись, що вилучені змінні дійсно статистично не значущі.
Таблиця 2.3. Дисперсійний аналіз
Дисперсійний аналіз |
df |
SS |
MS |
F |
Значущість F |
|
Регресія |
7 |
1891,60548 |
270,2293556 |
1,2151928 |
2,85131 |
|
Остаток |
22 |
489,226527 |
22,2375694 |
|||
Всього |
29 |
2380,83201 |
F = 1,215 < F табл. 2,53, критичне значення було отримано із таблиці, де k1 = 6, а k2 = 23; Значущість F (p - значення) = 2,85, яке повинно бути менше 0,05. SS - сума квадратів, MS - середній квадрат або дисперсія. Бачимо коефіцієнти рівняння (див. табл. 2.4.), стандартну похибку, яка в усіх випадках невелика. Далі t-статистика, значення потрібно порівняти з табличними t-критичне = 2,045 при рівні значущості 0,05 і ступенях свободи 29, у X4 = -0,014, у X5 = -0,071 й у X6 = 0,0003, значення менше критичного, тому знову не значущість змінних. p1 - 0,233; p2 - 0,73; p3 - 0,896, які ? 0,05- модель не значуща і коефіцієнти звісно не підходять. Остання перевірка за допомогою довірчих інтервалів, при цих змінних 0 потрапляє у межі, тому приймаємо нульову гіпотезу і спокійно викидаємо вище згадані зміні. [4,5]
Продовжимо аналіз проблеми на базі новоутвореної сукупності.
Таблиця 2.5. Новоутворена сукупність
Авто |
Ціна (тис грн.. (y) |
Обєм двигуна (л) |
Максимальна потужність (кінських сил) |
Максимальна швидкість (км/год.) |
Витрати пального (л/100км) |
|
ЗАЗ Forza F4LM554 |
88,8 |
1,02 |
90 |
120 |
6 |
|
FAW B50 |
109,9 |
1,6 |
120 |
150 |
5,2 |
|
FIAT linea |
100,9 |
1,4 |
110 |
165 |
5 |
|
Opel Astra |
95,9 |
1,3 |
100 |
110 |
6,3 |
|
Ranault Logan |
111,8 |
1,6 |
115 |
164 |
4,9 |
|
Renault Sandero |
110,8 |
1,6 |
112 |
164 |
5,3 |
|
nissan micra |
109,9 |
1,2 |
150 |
166 |
5,1 |
|
Toyota Yaris |
90,85 |
1,00 |
90 |
110 |
7 |
|
Hyundai i20 |
88 |
1,15 |
85 |
100 |
6,9 |
|
Ford Fiesta Comfort |
100 |
1,25 |
91 |
168 |
5,4 |
|
SEAT Ibiza |
105,9 |
1,40 |
180 |
163 |
5,4 |
|
Honda Jazz |
87,9 |
1,15 |
90 |
115 |
6,8 |
|
Volkswagen Polo |
112,9 |
1,20 |
120 |
165 |
5,5 |
|
Opel Corsa |
112 |
1,20 |
130 |
168 |
5 |
|
Nissan Micra |
110 |
1,24 |
180 |
167 |
5,4 |
|
Citroen C3 |
111,8 |
1,36 |
115 |
163 |
5,3 |
|
Mitsubishi Colt |
89 |
1,00 |
90 |
100 |
7 |
|
Skoda Fabia |
102 |
1,20 |
100 |
120 |
5,1 |
|
Peugeot 207 |
112 |
1,4 |
130 |
170 |
4,9 |
|
Mazda 2 IPM |
110,6 |
1,50 |
126 |
168 |
5 |
|
ВАЗ Калина |
88,9 |
1,30 |
80 |
110 |
7 |
|
Geely CK-2 |
90 |
1,20 |
85 |
100 |
6 |
|
Chevrolet Aveo |
100,36 |
1,50 |
112 |
176 |
4 |
|
Daewoo Lanos |
105,9 |
1,50 |
118 |
172 |
4,2 |
|
MG 350 |
107 |
1,49 |
106 |
180 |
4 |
|
MG3 Cross |
107,98 |
1,48 |
140 |
182 |
4,1 |
|
Kia ceed JD |
108 |
1,6 |
145 |
190 |
4,8 |
|
Hyundai electra |
110,56 |
1,78 |
135 |
158 |
4,3 |
|
Skoda Rapid |
110 |
1,19 |
122 |
195 |
4,5 |
|
LEXUS LX |
112 |
1,8 |
103 |
220 |
4,2 |
Будуємо кореляційну матрицю (див. табл. 2.6). З виключенням декількох змінних кореляція не змінилась. Звязок тісний. Проводимо регресійний аналіз.
Табл. 2.7. Регресія
Висновок підсумків |
||
регресійна статистика |
||
множинний R |
0,881604615 |
|
R-квадрат |
0,777226697 |
|
Нормований R-квадрат |
0,741582968 |
|
стандартна помилка |
4,606021331 |
|
спостереження |
30 |
Множинний R = 0,88 - звязок тісний, R-квадрат більше табличного значення (0,306) - відповідна модель значна. Нормований R вказує на кореляцію з урахуванням похибки, тобто кореляція у 0,78 підтверджує тісноту звязку. Стандартна похибка = 4,6 - відхил від генеральної сукупності незначний. Значимість F = 0,00000007, що менше 0,05, також підтверджується значимість моделі. Стандартна похибка коефіцієнта а = 19,91, який < самого коефіцієнта (69,87), це означає що коефіцієнт статистично значний. Стандартні похибки коефіцієнтів b також менше їх значень, тож усі коефіцієнти значимі. P-значення менше 0,05підтверджується значимість обраної моделі. Нуль в довірчі інтервали також не входить (див. табл. 2.8). [4] Змінимо рівень надійності на 80%:
Таблиця 2. 9. Довірчі інтервали
Нижні 80,0% |
Верхні 80,0% |
|
45,7162406 |
105,9034399 |
|
1,920507639 |
13,41074972 |
|
0,010662098 |
0,14604215 |
|
0,072527065 |
0,243287399 |
|
1,662728093 |
3,818739366 |
Модель пройшла перевірку на значимість усіма статистичними способами. Обрані технічні характеристик значущі і добре описують вплив на формування ціни за новий (салонний) автомобіль. Далі необхідно визначити, яка саме факторна ознака найбільше впливає на факторний У. Розрахуємо часний коефіцієнт еластичності (Е) для кожного фактора за формулою 3.2.
(3.2)
Таблиця 2.10. Коефіцієнти еластичності
Коефіцієнти |
||
E1 = |
0,52638505 |
|
E2 = |
0,123997362 |
|
E3 = |
0,292753618 |
|
E7 = |
-0,36522617 |
Дивлячись на розраховані коефіцієнти еластичності, робимо висновок, що найвагоміший внесок у визначення ціни має обєм двигуна = 0.52%. З упевненістю говоримо, що при зміні обєму двигуна на 1%, ціна збільшиться на 0,52%. Ця змінна має більший вплив на ціну з поміж інших змінних. Для користувачів автомобілів обєм двигуна першочерговий фактор. [6]
- Аналіз політики Ціноутворення.
- Автосалон
- 2.3. Порівняння бюджету арк з Бюджетом Луганської області
- Структура бюджету автономної республіки крим в порівнянні з бюджетом луганської області
- 2.4. Результати контролю стану ціноутворення у Львівській області.
- 5.4.1. Розвиток природно-заповідного фонду Луганської області
- 1.2. Соціальний та економічний розвиток Луганської області
- 5.2.5. Стан зелених насаджень Луганської області
- 12.1. Транспортна система Луганської області
- Перелік регіональних програм Луганської області, що мають екологічну складову, діючих (затверджених) у 2009 році