logo
Виды выборок. Регрессионная модель и функция регрессии

Практическое задание 2.1

В результате наблюдений за спросом на некий товар и ростом его цены сделана выборка.

Необходимо:

1. Построить корреляционное поле

2. Вычислить коэффициент корреляции и проверить его значимость

3. Построить регрессионную модель.

4. Проверить значимость модели

5. Проверить статистическую значимость коэффициентов модели.

Исходные данные для задания 2.1

Исходные данные

1

Х

4,4

12,9

5,5

15,5

13,9

15,3

14,2

11,2

5,5

10,8

У

2,6

10,9

6,2

16

16,1

14,7

11,1

12,7

6,2

8,4

Выполнение задания

1. Создадим на рабочем листе таблицу и заполним данными первые два столбца.

1

4,4

2,6

19,36

6,76

4,0906

2

12,9

10,9

166,41

118,81

12,4334

3

5,5

6,2

30,25

38,44

5,1703

4

15,5

16

240,25

256

14,9853

5

13,9

16,1

193,21

259,21

13,4149

6

15,3

14,7

234,09

216,09

14,7890

7

14,2

11,1

201,64

123,21

13,7093

8

11,2

12,7

125,44

161,29

10,7648

9

5,5

6,2

30,25

38,44

5,1703

10

10,8

8,4

116,64

70,56

10,3722

сумма

109,2

104,9

1357,54

1288,81

104,9

2. Вычислим коэффициент корреляции с использованием статистической функции КОРРЕЛ.

0,9187.

3. Проверим значимость коэффициента, выдвинув две гипотезы:

Н0: и связи нет, альтернативная Н1: и связь имеется.

Вычислим выражение

Т=

Для n=10, получим Т=

Вычислим значение статистической функции СТЬЮДРАСПОБР.

При уровне значимости 0,1 () и степенях свободы 8.

Получим tстьюд=3,3555, т.к. модуль Т? tстьюд, принимается гипотеза о значимости и наличии связи.

3. Так как элементы выборки взяты случайно, проведем сортировку пар значений, ключевое поле столбец Х и построим диаграмму поля наблюдений.

4. Для переменных X, Y вычислить средние, дисперсии и стандартное отклонение используя соответствующие статистические функции

5. Вычислим параметры модели, используя функцию ЛИНЕЙН.

Уравнение регрессии: У

параметры регрессии

0,981499431

-0,2279738

У = 0,9815 - 0,22797

6. Вычислим и поместим в четвертый столбец величину значений регрессии .

Для этого используйте процедуру задания формулы, в которой используются абсолютные ссылки на адреса параметров регрессии, вычисленные в п.5. и относительный адрес переменной Xi второй столбец.

7. На график корреляционного поля нанесем график регрессии и точку средних значений переменных (использованием контекстного меню диаграммы исходные данные / ряд / добавить)

8. Выполним оценку адекватности модели для этого оценим две суммы квадратов

Qe = и Qr =,

где - значения регрессии,

yСр = 10,49 - среднее значение наблюдений у.

Для вычисления используем математическую функцию СУММКВ.

1

4,4

2,6

4,0906

2,2220

40,9520

2

12,9

10,9

12,4334

2,3512

3,7767

3

5,5

6,2

5,1703

1,0603

28,2995

4

15,5

16

14,9853

1,0297

20,2074

5

13,9

16,1

13,4149

7,2099

8,5549

6

15,3

14,7

14,7890

0,0079

18,4811

7

14,2

11,1

13,7093

6,8085

10,3640

8

11,2

12,7

10,7648

3,7449

0,0755

9

5,5

6,2

5,1703

1,0603

28,2995

10

10,8

8,4

10,3722

3,8897

0,0139

сумма

-

104,9

104,9

29,3845

159,0245

9. Вычислим коэффициент детерминации -

= 1-,

где k - число параметров регрессии, исключая свободный член, т.е. 1,

R2 =(коэффициент детерминации для n?20)

R2 =

Коэффициент детерминации показывает, что модель работает на 82,45%, а 17,55% приходится на неучтенные факторы.

10. Оценим параметры регрессии.

Вычислим остаточную дисперсию

S2 =

S2 =

Для простой линейной регрессии мерой служат величины:

где аi - параметр регрессии,

Sа1 =

Если величина ,где значение Стьюдента при числе степеней свободы f =n-k-1 и л=0,05 (функция СТЬЮДРАСПОБР), параметр значим, иначе его не учитывают.

. следовательно, коэффициент регрессии значим.

Доверительный интервал параметра регрессии равен -

Тогда доверительный интервал для а0:

Тогда доверительный интервал для а1:

Аналогичные результаты можно получить, используя надстройку MS Excel Пакет анализа (команда Сервис Анализ данных Регрессия).

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9187

R-квадрат

0,8440

Нормированный R-квадрат

0,8245

Стандартная ошибка

1,9165

Наблюдения

10,0000

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1,0000

159,0245

159,0245

43,2948

0,0002

Остаток

8,0000

29,3845

3,6731

Итого

9,0000

188,4090

Коэффициенты регрессии

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-0,2280

1,7380

-0,1312

0,8989

-4,2358

3,7798

Переменная X

0,9815

0,1492

6,5799

0,0002

0,6375

1,3255

2,306

Столбец «Коэффициенты регрессии» содержит численные значения коэффициентов регрессии. Названия строк показывают, с каким регрессором связаны рассчитанные параметры. Строка У-пересечение не связана ни с одним параметром. Это свободный коэффициент.

Качество полученной модели можно проанализировать с помощью данных в столбцах

· Стандартная ошибка;

· t-статистика;

· Р-значение.

В ячейку после t-статистика запишем формулу = СТЬЮДРАСПОБР(0,05;10-8-1) для расчета критической точки распределения Стьюдента. Получили 2,306.

В ячейке после P-Значение - уровень значимости - . Нижние 95%, Верхние 95% - доверительные интервалы для коэффициентов регрессии.

Было получено уравнение регрессии: У = 0,9815 - 0,2280

Анализ полученных результатов:

· Стандартная ошибка > стандартной ошибки коэффициентов

· Fнабл > Fкрит, регрессия значима. Значимость F < 0,05.

· |tстатистика| > tкр

· P-значение < 0,05

Используем F-статистику: FРАСПОБР (0,05;1;10) = 0,828.

Поскольку Fнабл. = 43,3> Fкрит. =0,828, то построенная модель статистически значима.

Значимость F (=0,0002) < 0,05.

P-значения коэффициента при х < 0,05

Модель статистически значима.