Виды выборок. Регрессионная модель и функция регрессии

Практическое задание 2.1

В результате наблюдений за спросом на некий товар и ростом его цены сделана выборка.

Необходимо:

1. Построить корреляционное поле

2. Вычислить коэффициент корреляции и проверить его значимость

3. Построить регрессионную модель.

4. Проверить значимость модели

5. Проверить статистическую значимость коэффициентов модели.

Исходные данные для задания 2.1

№	Исходные данные
1	Х	4,4	12,9	5,5	15,5	13,9	15,3	14,2	11,2	5,5	10,8
	У	2,6	10,9	6,2	16	16,1	14,7	11,1	12,7	6,2	8,4

Выполнение задания

1. Создадим на рабочем листе таблицу и заполним данными первые два столбца.


1	4,4	2,6	19,36	6,76	4,0906
2	12,9	10,9	166,41	118,81	12,4334
3	5,5	6,2	30,25	38,44	5,1703
4	15,5	16	240,25	256	14,9853
5	13,9	16,1	193,21	259,21	13,4149
6	15,3	14,7	234,09	216,09	14,7890
7	14,2	11,1	201,64	123,21	13,7093
8	11,2	12,7	125,44	161,29	10,7648
9	5,5	6,2	30,25	38,44	5,1703
10	10,8	8,4	116,64	70,56	10,3722
сумма	109,2	104,9	1357,54	1288,81	104,9

2. Вычислим коэффициент корреляции с использованием статистической функции КОРРЕЛ.

0,9187.

3. Проверим значимость коэффициента, выдвинув две гипотезы:

Н₀: и связи нет, альтернативная Н₁: и связь имеется.

Вычислим выражение

Т=

Для n=10, получим Т=

Вычислим значение статистической функции СТЬЮДРАСПОБР.

При уровне значимости 0,1 () и степенях свободы 8.

Получим t_стьюд=3,3555, т.к. модуль Т? t_стьюд_,принимается гипотеза о значимости и наличии связи_.

3. Так как элементы выборки взяты случайно, проведем сортировку пар значений, ключевое поле столбец Х и построим диаграмму поля наблюдений.

4. Для переменных X, Y вычислить средние, дисперсии и стандартное отклонение используя соответствующие статистические функции

5. Вычислим параметры модели, используя функцию ЛИНЕЙН.

Уравнение регрессии: У

параметры регрессии	0,981499431	-0,2279738

У = 0,9815 - 0,22797

6. Вычислим и поместим в четвертый столбец величину значений регрессии .

Для этого используйте процедуру задания формулы, в которой используются абсолютные ссылки на адреса параметров регрессии, вычисленные в п.5. и относительный адрес переменной X_i второй столбец.

7. На график корреляционного поля нанесем график регрессии и точку средних значений переменных (использованием контекстного меню диаграммы исходные данные / ряд / добавить)

8. Выполним оценку адекватности модели для этого оценим две суммы квадратов

Q_e= и Q_r=,

где - значения регрессии,

y_С_р = 10,49 - среднее значение наблюдений у.

Для вычисления используем математическую функцию СУММКВ.


1	4,4	2,6	4,0906	2,2220	40,9520
2	12,9	10,9	12,4334	2,3512	3,7767
3	5,5	6,2	5,1703	1,0603	28,2995
4	15,5	16	14,9853	1,0297	20,2074
5	13,9	16,1	13,4149	7,2099	8,5549
6	15,3	14,7	14,7890	0,0079	18,4811
7	14,2	11,1	13,7093	6,8085	10,3640
8	11,2	12,7	10,7648	3,7449	0,0755
9	5,5	6,2	5,1703	1,0603	28,2995
10	10,8	8,4	10,3722	3,8897	0,0139
сумма	-	104,9	104,9	29,3845	159,0245

9. Вычислим коэффициент детерминации -

= 1-,

где k - число параметров регрессии, исключая свободный член, т.е. 1,

R²=(коэффициент детерминации для n?20)

R²=

Коэффициент детерминации показывает, что модель работает на 82,45%, а 17,55% приходится на неучтенные факторы.

10. Оценим параметры регрессии.

Вычислим остаточную дисперсию

S2 =

Для простой линейной регрессии мерой служат величины:

где а_i - параметр регрессии,

S_а1=

Если величина ,где значение Стьюдента при числе степеней свободы f =n-k-1 и л=0,05 (функция СТЬЮДРАСПОБР), параметр значим, иначе его не учитывают.

. следовательно, коэффициент регрессии значим.

Доверительный интервал параметра регрессии равен -

Тогда доверительный интервал для а0:

Тогда доверительный интервал для а1:

Аналогичные результаты можно получить, используя надстройку MS Excel Пакет анализа (команда Сервис Анализ данных Регрессия).

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R	0,9187
R-квадрат	0,8440
Нормированный R-квадрат	0,8245
Стандартная ошибка	1,9165
Наблюдения	10,0000
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	1,0000	159,0245	159,0245	43,2948	0,0002
Остаток	8,0000	29,3845	3,6731
Итого	9,0000	188,4090

	Коэффициенты регрессии	Стандартная ошибка	t-статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-0,2280	1,7380	-0,1312	0,8989	-4,2358	3,7798
Переменная X	0,9815	0,1492	6,5799	0,0002	0,6375	1,3255
			2,306

Столбец «Коэффициенты регрессии» содержит численные значения коэффициентов регрессии. Названия строк показывают, с каким регрессором связаны рассчитанные параметры. Строка У-пересечение не связана ни с одним параметром. Это свободный коэффициент.

Качество полученной модели можно проанализировать с помощью данных в столбцах

· Стандартная ошибка;

· t-статистика;

· Р-значение.

В ячейку после t-статистика запишем формулу = СТЬЮДРАСПОБР(0,05;10-8-1) для расчета критической точки распределения Стьюдента. Получили 2,306.

В ячейке после P-Значение - уровень значимости - . Нижние 95%, Верхние 95% - доверительные интервалы для коэффициентов регрессии.

Было получено уравнение регрессии: У = 0,9815 - 0,2280

Анализ полученных результатов:

· Стандартная ошибка > стандартной ошибки коэффициентов

· F_набл > F_крит, регрессия значима. Значимость F < 0,05.

· |t_{статистика}| > t_кр

· P-значение < 0,05

Используем F-статистику: FРАСПОБР (0,05;1;10) = 0,828.

Поскольку F_набл.= 43,3> F_крит.=0,828, то построенная модель статистически значима.

Значимость F (=0,0002) < 0,05.

P-значения коэффициента при х < 0,05

Модель статистически значима.

Содержание