Практическое задание 2.1
В результате наблюдений за спросом на некий товар и ростом его цены сделана выборка.
Необходимо:
1. Построить корреляционное поле
2. Вычислить коэффициент корреляции и проверить его значимость
3. Построить регрессионную модель.
4. Проверить значимость модели
5. Проверить статистическую значимость коэффициентов модели.
Исходные данные для задания 2.1
№ |
Исходные данные |
|||||||||||
1 |
Х |
4,4 |
12,9 |
5,5 |
15,5 |
13,9 |
15,3 |
14,2 |
11,2 |
5,5 |
10,8 |
|
У |
2,6 |
10,9 |
6,2 |
16 |
16,1 |
14,7 |
11,1 |
12,7 |
6,2 |
8,4 |
Выполнение задания
1. Создадим на рабочем листе таблицу и заполним данными первые два столбца.
1 |
4,4 |
2,6 |
19,36 |
6,76 |
4,0906 |
|
2 |
12,9 |
10,9 |
166,41 |
118,81 |
12,4334 |
|
3 |
5,5 |
6,2 |
30,25 |
38,44 |
5,1703 |
|
4 |
15,5 |
16 |
240,25 |
256 |
14,9853 |
|
5 |
13,9 |
16,1 |
193,21 |
259,21 |
13,4149 |
|
6 |
15,3 |
14,7 |
234,09 |
216,09 |
14,7890 |
|
7 |
14,2 |
11,1 |
201,64 |
123,21 |
13,7093 |
|
8 |
11,2 |
12,7 |
125,44 |
161,29 |
10,7648 |
|
9 |
5,5 |
6,2 |
30,25 |
38,44 |
5,1703 |
|
10 |
10,8 |
8,4 |
116,64 |
70,56 |
10,3722 |
|
сумма |
109,2 |
104,9 |
1357,54 |
1288,81 |
104,9 |
2. Вычислим коэффициент корреляции с использованием статистической функции КОРРЕЛ.
0,9187.
3. Проверим значимость коэффициента, выдвинув две гипотезы:
Н0: и связи нет, альтернативная Н1: и связь имеется.
Вычислим выражение
Т=
Для n=10, получим Т=
Вычислим значение статистической функции СТЬЮДРАСПОБР.
При уровне значимости 0,1 () и степенях свободы 8.
Получим tстьюд=3,3555, т.к. модуль Т? tстьюд, принимается гипотеза о значимости и наличии связи.
3. Так как элементы выборки взяты случайно, проведем сортировку пар значений, ключевое поле столбец Х и построим диаграмму поля наблюдений.
4. Для переменных X, Y вычислить средние, дисперсии и стандартное отклонение используя соответствующие статистические функции
5. Вычислим параметры модели, используя функцию ЛИНЕЙН.
Уравнение регрессии: У
параметры регрессии |
0,981499431 |
-0,2279738 |
У = 0,9815 - 0,22797
6. Вычислим и поместим в четвертый столбец величину значений регрессии .
Для этого используйте процедуру задания формулы, в которой используются абсолютные ссылки на адреса параметров регрессии, вычисленные в п.5. и относительный адрес переменной Xi второй столбец.
7. На график корреляционного поля нанесем график регрессии и точку средних значений переменных (использованием контекстного меню диаграммы исходные данные / ряд / добавить)
8. Выполним оценку адекватности модели для этого оценим две суммы квадратов
Qe = и Qr =,
где - значения регрессии,
yСр = 10,49 - среднее значение наблюдений у.
Для вычисления используем математическую функцию СУММКВ.
1 |
4,4 |
2,6 |
4,0906 |
2,2220 |
40,9520 |
|
2 |
12,9 |
10,9 |
12,4334 |
2,3512 |
3,7767 |
|
3 |
5,5 |
6,2 |
5,1703 |
1,0603 |
28,2995 |
|
4 |
15,5 |
16 |
14,9853 |
1,0297 |
20,2074 |
|
5 |
13,9 |
16,1 |
13,4149 |
7,2099 |
8,5549 |
|
6 |
15,3 |
14,7 |
14,7890 |
0,0079 |
18,4811 |
|
7 |
14,2 |
11,1 |
13,7093 |
6,8085 |
10,3640 |
|
8 |
11,2 |
12,7 |
10,7648 |
3,7449 |
0,0755 |
|
9 |
5,5 |
6,2 |
5,1703 |
1,0603 |
28,2995 |
|
10 |
10,8 |
8,4 |
10,3722 |
3,8897 |
0,0139 |
|
сумма |
- |
104,9 |
104,9 |
29,3845 |
159,0245 |
9. Вычислим коэффициент детерминации -
= 1-,
где k - число параметров регрессии, исключая свободный член, т.е. 1,
R2 =(коэффициент детерминации для n?20)
R2 =
Коэффициент детерминации показывает, что модель работает на 82,45%, а 17,55% приходится на неучтенные факторы.
10. Оценим параметры регрессии.
Вычислим остаточную дисперсию
S2 =
S2 =
Для простой линейной регрессии мерой служат величины:
где аi - параметр регрессии,
Sа1 =
Если величина ,где значение Стьюдента при числе степеней свободы f =n-k-1 и л=0,05 (функция СТЬЮДРАСПОБР), параметр значим, иначе его не учитывают.
. следовательно, коэффициент регрессии значим.
Доверительный интервал параметра регрессии равен -
Тогда доверительный интервал для а0:
Тогда доверительный интервал для а1:
Аналогичные результаты можно получить, используя надстройку MS Excel Пакет анализа (команда Сервис Анализ данных Регрессия).
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,9187 |
||||||
R-квадрат |
0,8440 |
||||||
Нормированный R-квадрат |
0,8245 |
||||||
Стандартная ошибка |
1,9165 |
||||||
Наблюдения |
10,0000 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1,0000 |
159,0245 |
159,0245 |
43,2948 |
0,0002 |
||
Остаток |
8,0000 |
29,3845 |
3,6731 |
||||
Итого |
9,0000 |
188,4090 |
|||||
Коэффициенты регрессии |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-0,2280 |
1,7380 |
-0,1312 |
0,8989 |
-4,2358 |
3,7798 |
|
Переменная X |
0,9815 |
0,1492 |
6,5799 |
0,0002 |
0,6375 |
1,3255 |
|
2,306 |
Столбец «Коэффициенты регрессии» содержит численные значения коэффициентов регрессии. Названия строк показывают, с каким регрессором связаны рассчитанные параметры. Строка У-пересечение не связана ни с одним параметром. Это свободный коэффициент.
Качество полученной модели можно проанализировать с помощью данных в столбцах
· Стандартная ошибка;
· t-статистика;
· Р-значение.
В ячейку после t-статистика запишем формулу = СТЬЮДРАСПОБР(0,05;10-8-1) для расчета критической точки распределения Стьюдента. Получили 2,306.
В ячейке после P-Значение - уровень значимости - . Нижние 95%, Верхние 95% - доверительные интервалы для коэффициентов регрессии.
Было получено уравнение регрессии: У = 0,9815 - 0,2280
Анализ полученных результатов:
· Стандартная ошибка > стандартной ошибки коэффициентов
· Fнабл > Fкрит, регрессия значима. Значимость F < 0,05.
· |tстатистика| > tкр
· P-значение < 0,05
Используем F-статистику: FРАСПОБР (0,05;1;10) = 0,828.
Поскольку Fнабл. = 43,3> Fкрит. =0,828, то построенная модель статистически значима.
Значимость F (=0,0002) < 0,05.
P-значения коэффициента при х < 0,05
Модель статистически значима.
- В чем состоит анализ регрессионной модели?
- 3.4.1. Виды регрессионных моделей
- 45. Оценка регрессионной модели. Проверка адекватности модели регрессии.
- Лекция 2. Корреляционно-регрессионный анализ. Парная регрессия
- Лекция 20. Регрессионный анализ. Линейная регрессия.
- 11. Модель множественной регрессии
- Регрессионный анализ Линейная регрессия
- Прогнозирование на основе регрессионных моделей Понятие регрессии
- Оценка производственных функций с использованием методов корреляционно-регрессионного анализа
- 57. Регрессионный анализ. Линейная регрессия