Автор работы: Пользователь скрыл имя, 31 Августа 2013 в 11:42, контрольная работа
Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 50 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации, коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.
Проверьте модели на отсутствие автокорреляции.
Проверка на гетероскедастичность моделей.
Сравните модели между собой выберете лучшую.
Задание.
Работа должны быть выполнена в соответствии со следующими этапами:
Рассмотрим зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 2000 г. для ряда стран. Статистические данные приведены в табл. 1.
№№ |
X1 |
X2 |
X3 |
X4 |
Y |
1 |
2,3 |
2,6 |
2,7 |
98 |
49 |
2 |
4,3 |
2,5 |
2,4 |
91 |
55 |
3 |
2,9 |
2,8 |
2,1 |
99 |
49 |
4 |
2,4 |
3,1 |
3,1 |
89 |
52 |
5 |
5,1 |
1,6 |
2,1 |
79 |
58 |
6 |
3,4 |
2 |
1,7 |
72 |
57 |
7 |
4,5 |
2,9 |
2,8 |
80 |
53 |
8 |
5,1 |
2,7 |
2,7 |
58 |
58 |
9 |
4,2 |
3 |
2,8 |
88 |
56 |
10 |
5,2 |
1,8 |
2 |
68 |
62 |
11 |
6,5 |
2,9 |
2,5 |
95 |
50 |
12 |
7,4 |
2,8 |
2,7 |
73 |
59 |
13 |
8,3 |
2,9 |
3,3 |
90 |
60 |
14 |
5,7 |
2,5 |
2,7 |
96 |
51 |
15 |
7,5 |
2,4 |
2,2 |
55 |
57 |
16 |
10,8 |
1,1 |
1,1 |
34 |
69 |
17 |
7,8 |
2,9 |
3,1 |
56 |
57 |
18 |
7,6 |
2,9 |
2,6 |
90 |
51 |
19 |
12,1 |
1,3 |
2 |
16 |
72 |
20 |
14,2 |
2 |
2,7 |
56 |
63 |
21 |
14,1 |
1,6 |
2,5 |
51 |
64 |
22 |
10,6 |
2,2 |
2,7 |
39 |
66 |
23 |
12,4 |
2 |
2,6 |
55 |
65 |
24 |
9 |
2,3 |
2,3 |
64 |
57 |
25 |
12,4 |
2,9 |
3,5 |
44 |
66 |
26 |
15,6 |
2,2 |
3,2 |
36 |
69 |
27 |
14,3 |
1,9 |
2,6 |
37 |
71 |
28 |
13,1 |
1 |
1,8 |
13 |
74 |
29 |
9,7 |
2,2 |
3,4 |
36 |
67 |
30 |
13,5 |
2,7 |
2,9 |
41 |
68 |
31 |
18,5 |
1,9 |
3 |
39 |
69 |
32 |
15,6 |
0,2 |
0,2 |
13 |
70 |
33 |
14 |
2 |
3,1 |
47 |
66 |
34 |
28 |
0,9 |
1,3 |
35 |
69 |
35 |
22,2 |
1,7 |
2,4 |
23 |
73 |
36 |
20,7 |
1,7 |
2,1 |
48 |
67 |
37 |
20 |
0,3 |
0,6 |
14 |
70 |
38 |
13,4 |
0,3 |
0,7 |
11 |
72 |
39 |
29,3 |
2,3 |
3 |
23 |
71 |
40 |
18,6 |
2,2 |
2,4 |
50 |
64 |
41 |
23,7 |
1,9 |
2,8 |
33 |
72 |
42 |
49 |
1,3 |
1,8 |
16 |
71 |
43 |
20 |
1,5 |
1,6 |
44 |
67 |
44 |
31,9 |
0,8 |
1,8 |
13 |
72 |
45 |
33,4 |
2,4 |
2,7 |
12 |
71 |
46 |
35,3 |
1,5 |
2,1 |
12 |
72 |
47 |
24,6 |
0,6 |
1 |
18 |
73 |
48 |
30,8 |
1,3 |
2 |
22 |
73 |
49 |
43,4 |
0,6 |
0,9 |
8 |
78 |
50 |
42,4 |
0,9 |
1,9 |
10 |
72 |
51 |
53,8 |
0,2 |
1 |
7 |
77 |
52 |
60,6 |
1,4 |
1,5 |
7 |
76 |
53 |
58,1 |
0,5 |
1,7 |
6 |
77 |
54 |
70,2 |
1,1 |
1,4 |
6 |
77 |
55 |
73,7 |
0,2 |
0,4 |
7 |
78 |
56 |
78,3 |
1,3 |
1 |
6 |
78 |
57 |
65,8 |
0,5 |
0,1 |
5 |
76 |
58 |
85,1 |
1,6 |
1,3 |
5 |
79 |
59 |
68,7 |
0,6 |
0,3 |
4 |
79 |
60 |
73,9 |
0,7 |
0,6 |
6 |
78 |
61 |
80,3 |
0,4 |
0,5 |
8 |
77 |
62 |
78 |
0,5 |
0,8 |
6 |
78 |
63 |
84,4 |
2 |
1,7 |
4 |
76 |
64 |
78,8 |
0,8 |
0,5 |
6 |
77 |
65 |
78,7 |
0,3 |
0,1 |
6 |
75 |
66 |
82 |
0,3 |
0,6 |
4 |
80 |
Принятые в таблице обозначения:
Y - средняя ожидаемая продолжительности жизни при рождении, лет;
X1 - ВВП в паритетах покупательной способности;
X2 - темпы прироста населения по сравнению с предыдущем годом, %;
X3 - темпы прироста рабочей силы по сравнению с предыдущем годом, %;
X4 - коэффициент младенческой смертности, %.
1. Вычислим описательные
X1 |
X2 |
X3 |
X4 |
Y |
|||||
Среднее |
29,65455 |
Среднее |
1,642424 |
Среднее |
1,934848 |
Среднее |
37,62121 |
Среднее |
67,5 |
Стандартная ошибка |
3,33716 |
Стандартная ошибка |
0,11014 |
Стандартная ошибка |
0,115943 |
Стандартная ошибка |
3,795272 |
Стандартная ошибка |
1,094008 |
Медиана |
17,05 |
Медиана |
1,7 |
Медиана |
2,1 |
Медиана |
34,5 |
Медиана |
69,5 |
Мода |
5,1 |
Мода |
2,9 |
Мода |
2,7 |
Мода |
6 |
Мода |
72 |
Стандартное отклонение |
27,11122 |
Стандартное отклонение |
0,894782 |
Стандартное отклонение |
0,941928 |
Стандартное отклонение |
30,83293 |
Стандартное отклонение |
8,887762 |
Дисперсия выборки |
735,0182 |
Дисперсия выборки |
0,800634 |
Дисперсия выборки |
0,887228 |
Дисперсия выборки |
950,6697 |
Дисперсия выборки |
78,99231 |
Эксцесс |
-0,6672 |
Эксцесс |
-1,24142 |
Эксцесс |
-0,96911 |
Эксцесс |
-0,9218 |
Эксцесс |
-0,75724 |
Асимметричность |
0,924782 |
Асимметричность |
-0,10033 |
Асимметричность |
-0,3911 |
Асимметричность |
0,620407 |
Асимметричность |
-0,59056 |
Интервал |
82,8 |
Интервал |
2,9 |
Интервал |
3,4 |
Интервал |
95 |
Интервал |
31 |
Минимум |
2,3 |
Минимум |
0,2 |
Минимум |
0,1 |
Минимум |
4 |
Минимум |
49 |
Максимум |
85,1 |
Максимум |
3,1 |
Максимум |
3,5 |
Максимум |
99 |
Максимум |
80 |
Сумма |
1957,2 |
Сумма |
108,4 |
Сумма |
127,7 |
Сумма |
2483 |
Сумма |
4455 |
Счет |
66 |
Счет |
66 |
Счет |
66 |
Счет |
66 |
Счет |
66 |
Уровень надежности (95,0%) |
6,664769 |
Уровень надежности (95,0%) |
0,219965 |
Уровень надежности (95,0%) |
0,231555 |
Уровень надежности (95,0%) |
7,579681 |
Уровень надежности (95,0%) |
2,184884 |
Построим диаграммы рассеяния объясняющих переменных X1, X2, X3, X4 с зависимой переменной Y.
Рис. 1.
Рис. 2.
Рис. 3.
Рис. 4.
Из диаграмм рассеяния можно сделать предварительный вывод о наличии корреляционной связи между переменными.
Коэффициент корреляции между двумя переменными X и Y вычисляется по формуле:
.
Подставив исходные данные в эту формулу,
для всех возможных различных сочетаний
переменных X1, X2, Y, получим матрицу парных коэффициентов
корреляции:
X1 |
X2 |
X3 |
X4 |
Y | |
X1 |
1 |
||||
X2 |
-0,65421 |
1 |
|||
X3 |
-0,69735 |
0,877684 |
1 |
||
X4 |
-0,76604 |
0,800806 |
0,645195 |
1 |
|
Y |
0,796245 |
-0,79297 |
-0,6251 |
-0,96374 |
1 |
Расчет матрицы парных коэффициентов корреляции был произведен в MS Excel: (Сервис ® Анализ данных ® Корреляция).
Из таблицы 2 можно предположить коллинеарность факторов X2 и X3, а также X4 и Y.
2. Т.к. обе переменные X2 и X3 являются объясняющими, то уберем из рассмотрения одну из них, для определенности X3. Построим по оставшимся факторам уравнение множественной регрессии (Сервис ® Анализ данных ® Регрессия):
.
Результаты расчета приведены в табл. 4.
ВЫВОД ИТОГОВ |
|||||
Регрессионная статистика |
|||||
Множественный R |
0,968303326 |
||||
R-квадрат |
0,937611331 |
||||
Нормированный R-квадрат |
0,934592524 |
||||
Стандартная ошибка |
2,273034856 |
||||
Наблюдения |
66 |
||||
Дисперсионный анализ |
|||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
3 |
4814,165378 |
1604,721793 |
310,5900651 |
2,74204E-37 |
Остаток |
62 |
320,3346222 |
5,166687454 |
||
Итого |
65 |
5134,5 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% | |
Y-пересечение |
75,8319549 |
1,113265305 |
68,11669647 |
5,37647E-60 |
73,60657172 |
X1 |
0,044590428 |
0,016269626 |
2,740716173 |
0,007998521 |
0,012067944 |
X2 |
-0,433377979 |
0,529065843 |
-0,81913808 |
0,415845272 |
-1,490964362 |
X4 |
-0,237697639 |
0,018065075 |
-13,15785532 |
1,32344E-19 |
-0,273809168 |
3. Построим графики остатков относительно каждой из объясняющих переменных.
Рис. 5.
Рис. 6.
Рис. 7.
Рассмотрение графиков остатков позволяет сделать два вывода:
1. Автокорреляция остатков отсутствует.
2. Можно предположить наличие гетероскедостичности (обратнопропорциональной) остатков относительно фактора X1.
4. Проведем тестирование уравнения множественной регрессии (1) на гетероскедостичность с помощью теста Гельфельда-Квандта.
Тест Гельфельда-Квандта
1) Выделяют фактор
Данные упорядочиваются в
2) Отбрасывают среднюю
треть упорядоченных
3) Количество наблюдений в этих
подвыборках должно быть
4) Берутся суммы квадратов
- для случая прямой пропорциональности,
- для случая обратной пропорциональности.
5) Используем F-тест для проверки гомоскедостичности. Если статистика GQ удовлетворяет неравенству
, где m - число переменных (в задаче m=2),
то гипотеза гомоскедостичности остатков отвергается в пользу гетероскедостичности на уровне значимости a.
Уровень значимости для определенности возьмем a = 5%.
Рассмотрим в качестве фактора пропорциональности переменную X1.
Упорядоченные данные в
Исходная таблица, упорядоченная по X1
№№ |
X1 |
X2 |
X3 |
X4 |
Y |
1 |
2,3 |
2,6 |
2,7 |
98 |
49 |
2 |
2,4 |
3,1 |
3,1 |
89 |
52 |
3 |
2,9 |
2,8 |
2,1 |
99 |
49 |
4 |
3,4 |
2 |
1,7 |
72 |
57 |
5 |
4,2 |
3 |
2,8 |
88 |
56 |
6 |
4,3 |
2,5 |
2,4 |
91 |
55 |
7 |
4,5 |
2,9 |
2,8 |
80 |
53 |
8 |
5,1 |
1,6 |
2,1 |
79 |
58 |
9 |
5,1 |
2,7 |
2,7 |
58 |
58 |
10 |
5,2 |
1,8 |
2 |
68 |
62 |
11 |
5,7 |
2,5 |
2,7 |
96 |
51 |
12 |
6,5 |
2,9 |
2,5 |
95 |
50 |
13 |
7,4 |
2,8 |
2,7 |
73 |
59 |
14 |
7,5 |
2,4 |
2,2 |
55 |
57 |
15 |
7,6 |
2,9 |
2,6 |
90 |
51 |
16 |
7,8 |
2,9 |
3,1 |
56 |
57 |
17 |
8,3 |
2,9 |
3,3 |
90 |
60 |
18 |
9 |
2,3 |
2,3 |
64 |
57 |
19 |
9,7 |
2,2 |
3,4 |
36 |
67 |
20 |
10,6 |
2,2 |
2,7 |
39 |
66 |
21 |
10,8 |
1,1 |
1,1 |
34 |
69 |
22 |
12,1 |
1,3 |
2 |
16 |
72 |
23 |
12,4 |
2 |
2,6 |
55 |
65 |
24 |
12,4 |
2,9 |
3,5 |
44 |
66 |
25 |
13,1 |
1 |
1,8 |
13 |
74 |
26 |
13,4 |
0,3 |
0,7 |
11 |
72 |
27 |
13,5 |
2,7 |
2,9 |
41 |
68 |
28 |
14 |
2 |
3,1 |
47 |
66 |
29 |
14,1 |
1,6 |
2,5 |
51 |
64 |
30 |
14,2 |
2 |
2,7 |
56 |
63 |
31 |
14,3 |
1,9 |
2,6 |
37 |
71 |
32 |
15,6 |
2,2 |
3,2 |
36 |
69 |
33 |
15,6 |
0,2 |
0,2 |
13 |
70 |
34 |
18,5 |
1,9 |
3 |
39 |
69 |
35 |
18,6 |
2,2 |
2,4 |
50 |
64 |
36 |
20 |
0,3 |
0,6 |
14 |
70 |
37 |
20 |
1,5 |
1,6 |
44 |
67 |
38 |
20,7 |
1,7 |
2,1 |
48 |
67 |
39 |
22,2 |
1,7 |
2,4 |
23 |
73 |
40 |
23,7 |
1,9 |
2,8 |
33 |
72 |
41 |
24,6 |
0,6 |
1 |
18 |
73 |
42 |
28 |
0,9 |
1,3 |
35 |
69 |
43 |
29,3 |
2,3 |
3 |
23 |
71 |
44 |
30,8 |
1,3 |
2 |
22 |
73 |
45 |
31,9 |
0,8 |
1,8 |
13 |
72 |
46 |
33,4 |
2,4 |
2,7 |
12 |
71 |
47 |
35,3 |
1,5 |
2,1 |
12 |
72 |
48 |
42,4 |
0,9 |
1,9 |
10 |
72 |
49 |
43,4 |
0,6 |
0,9 |
8 |
78 |
50 |
49 |
1,3 |
1,8 |
16 |
71 |
51 |
53,8 |
0,2 |
1 |
7 |
77 |
52 |
58,1 |
0,5 |
1,7 |
6 |
77 |
53 |
60,6 |
1,4 |
1,5 |
7 |
76 |
54 |
65,8 |
0,5 |
0,1 |
5 |
76 |
55 |
68,7 |
0,6 |
0,3 |
4 |
79 |
56 |
70,2 |
1,1 |
1,4 |
6 |
77 |
57 |
73,7 |
0,2 |
0,4 |
7 |
78 |
58 |
73,9 |
0,7 |
0,6 |
6 |
78 |
59 |
78 |
0,5 |
0,8 |
6 |
78 |
60 |
78,3 |
1,3 |
1 |
6 |
78 |
61 |
78,7 |
0,3 |
0,1 |
6 |
75 |
62 |
78,8 |
0,8 |
0,5 |
6 |
77 |
63 |
80,3 |
0,4 |
0,5 |
8 |
77 |
64 |
82 |
0,3 |
0,6 |
4 |
80 |
65 |
84,4 |
2 |
1,7 |
4 |
76 |
66 |
85,1 |
1,6 |
1,3 |
5 |
79 |
В результате расчета с помощью программы MS Excel (Сервис ® Анализ данных ® Регрессия) для первой и последней трети данных, получено:
, l = 21; m = 3; ;
.
Т.к. , то на уровне значимости 5% имеет место гетероскедостичность остатков относительно фактора пропорциональности X1.
Уровень значимости, при котором принимается гипотеза о наличии гетероскедостичности остатков относительно фактора пропорциональности X1, составляет:
, или 0,98%.
т.е. доверительная вероятность наличия гетероскедостичности достаточно высока и равняется
1 - a = 100 - 0,66 = 99,02%.
Гетероскедостичность остатков относительно фактора обратной пропорциональности X1 объясняется большим разбросом значений средней ожидаемой продолжительности жизни при рождении относительно ВВП.
5. Из таблицы 4 видно, что значимыми (на уровне значимости 5%) коэффициентами в уравнении регрессии (1) являются коэффициенты при переменных X1 и X4. По сути это означает, что факторы X1 и X4 значимо воздействуют на формирование средней продолжительности жизни в уравнении (1).
Построим теперь уравнение множественной регрессии со статистически значимыми факторами X1 и X4. Оно имеет вид:
.
Результаты расчета приведены в табл. 6.
ВЫВОД ИТОГОВ |
|||||
Регрессионная статистика |
|||||
Множественный R |
0,967954615 |
||||
R-квадрат |
0,936936137 |
||||
Нормированный R-квадрат |
0,93493411 |
||||
Стандартная ошибка |
2,267091708 |
||||
Наблюдения |
66 |
||||
Дисперсионный анализ |
|||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
4810,698597 |
2405,349298 |
467,993666 |
1,55987E-38 |
Остаток |
63 |
323,8014033 |
5,139704814 |
||
Итого |
65 |
5134,5 |
|||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% | |
Y-пересечение |
75,4214603 |
0,991497603 |
76,06822251 |
1,04257E-63 |
73,44010924 |
X1 |
0,04600161 |
0,016135859 |
2,85089316 |
0,005886759 |
0,013756649 |
X4 |
-0,246818659 |
0,014188168 |
-17,39609113 |
9,63533E-26 |
-0,275171468 |