Автор работы: Пользователь скрыл имя, 22 Сентября 2013 в 18:24, контрольная работа
Построить эконометрическую модель зависимости производительности труда (Y) от основных производственных факторов:
Х1 – фондовооруженность труда тыс.грн./чел;
Х2 – коэффициент текучести кадров, %;
Х3 – потери рабочего времени, %.
Проверить статистическую значимость модели и оценок ее параметров. Сделать выводы.
Проверить выполнение основных предпосылок классической регрессионной модели (проверка остатков модели на гетероскедастичности, автокорреляцию; исследование факторов на мультиколлинеарность).
Осуществить прогноз производительности труда на следующие четыре месяца, если заданы ожидаемые значения факторов, влияющих на нее. Исходные данные приведены в табл
Определим стандартные ошибки оценок параметров модели:
Se^2= |
1,324 |
Se= |
1,151 |
Sb0= |
4,770 |
Sb1= |
0,208 |
Sb2= |
0,556 |
Sb3= |
0,494 |
Для проверки статистической надежности (значимости) оценок параметров модели найдем величину t-статистики, используя формулу:
Полученные значения сравним с табличным значением t-Стьюдента через функцию СТЬЮДРАСПОБР. В диалоговое окно этой функции следует ввести вероятность на уровне значимости, т.е. ввести 0,05 (соответствующая доверительная вероятность при этом составит 0,95) или 0,01 (доверительная вероятность 0,99), и число степеней свободы, равное 11 (15 - 4 = 11), в итоге получим tтабл = 2,201.
Результаты:
t0= |
1,918 |
t1= |
5,264 |
t2= |
0,229 |
t3= |
1,199 |
tkp= |
2,201 |
Сравнив вычисленные t-статистики с табличным значением, делаем вывод о статистической незначимости b0 , b2 и b3.
Проверка близости расположения фактических данных к рассчитанной линии регрессии осуществляется на основе исследования коэффициента детерминации. Регрессионная модель показывает, что вариация Y может быть объяснена вариацией независимой переменной Х и значением возмущения e. Мы хотим знать, насколько вариация Y обусловлена изменением Х и насколько она является следствием случайных причин. Другими словами, нам нужно знать, насколько хорошо рассчитанное уравнение регрессии соответствует фактическим данным, т.е. насколько мала вариация данных вокруг линии регрессии.
Для оценки степени соответствия линии регрессии нужно рассчитать коэффициент детерминации.
Доля дисперсии зависимой переменной, объясненная регрессией, называется коэффициентом детерминации, обозначается R2 и определяется:
.
Величина коэффициента детерминации находится в пределах от 0 до 1 и служит одним из критериев проверки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов, следовательно, линейная модель хорошо аппроксимирует исходные данные, и ею можно пользоваться для прогноза значений результативного признака.
Коэффициент детерминации R2 сам по себе является случайной переменной и поэтому нуждается в проверке значимости, которая осуществляется с помощью F-критерия Фишера. F-распределение отличается от других тем, что обладает двумя наборами чисел степеней свободы: один (часто обозначаемый n1) – в числителе критерия проверки, а другой (обозначаемый n2) – в знаменателе. В критерии проверки для R2 числителю соответствует одна степень свободы и (n – 2) степеней свободы соответствует знаменателю. Расчет F-критерия для проверки значимости R2 выполняется следующим образом:
.
Результаты:
№ |
Y |
(Y-Ycp) |
(Y-Ycp)^2 |
|||
1 |
8,68 |
-18,33 |
336,0622 |
|||
2 |
12,18 |
-14,83 |
219,9882 |
|||
3 |
13,12 |
-13,89 |
192,9877 |
|||
4 |
15,25 |
-11,76 |
138,3446 |
|||
5 |
19,37 |
-7,64 |
58,40016 |
|||
6 |
21,34 |
-5,67 |
32,17158 |
|||
7 |
24,06 |
-2,95 |
8,714304 |
|||
8 |
26,60 |
-0,41 |
0,169744 |
|||
9 |
31,24 |
4,23 |
17,87598 |
|||
10 |
33,70 |
6,69 |
44,72934 |
|||
11 |
37,01 |
10,00 |
99,96 |
|||
12 |
36,19 |
9,18 |
84,23568 |
|||
13 |
40,04 |
13,03 |
169,7288 |
|||
14 |
42,19 |
15,18 |
230,3717 |
|||
15 |
44,21 |
17,20 |
295,7712 |
|||
Cреднее |
27,01 |
Сумма |
1929,511 |
|||
R^2= |
0,99 |
R^2korr= |
0,9903951 | |||
F= |
11,95533 |
|||||
Fkp= |
8,70287 |
Обратившись к F-таблице, видим, что табличное значение при 5%-м уровне значимости для n1 = 1 и n2 = 13 составляет 8,7. Так как расчетное значение F-критерия больше табличного, то при доверительной вероятности 0,95 отвергаем нулевую гипотезу о том, что истинное значение коэффициента детерминации равно нулю.
Таким образом, можно сделать вывод о том, что коэффициент детерминации (а значит, и модель в целом) являются статистически надежным показателем взаимосвязи рассматриваемых показателей.
В многофакторной модели добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный коэффициент детерминации рассчитывается так:
,
где n – число наблюдений, р – количество независимых переменных.
Скорректированный коэффициент детерминации равен:
.
Таким образом, все критерии качества построенной множественной эконометрической модели подтверждают ее точность и высокое качество.
Прежде, чем использовать построенную эконометрическую модель, важно определить, выполнялись ли предпосылки МНК, поскольку от этого зависит, обладают ли оценки параметров модели нужными свойствами. Особенно важно провести проверку на:
Гетероскедастичность приводит к тому, что оценки параметров модели больше не представляют собой лучшие оценки, или не являются оценками с минимальной дисперсией, т.е. они не обладают свойством эффективности.
Воздействие гетероскедастичности на оценку интервала прогнозирования и проверку гипотезы заключается в том, что хотя коэффициенты не смещены, дисперсии, и, следовательно, стандартные ошибки этих коэффициентов будут смещены. Чаще всего смещение является отрицательным (т.е. в сторону уменьшения), значит, стандартные ошибки будут меньше, чем они должны быть, а t-критерий – больше, чем в реальности. Вследствие этого мы можем отвергнуть нулевую гипотезу, в то время как она должна быть принята, т.е. ошибочно будем считать коэффициент регрессии значимым, тогда как это не так.
Для проверки
на гетероскедастичность
В соответствии с тестом Голдфельда-Квандта выполняем следующие действия:
Если в модели имеется более одной объясняющей переменной, то наблюдения следует упорядочивать по той из них, которая, как предполагается, связана с si.
Метод Голдфельда-Квандта
можно применять и при
Результаты приведены в таблице:
№ |
Y |
Х1 |
Х2 |
Х3 |
Ymod |
e |
e*e |
1 |
8,68 |
2,63 |
11,49 |
7,19 |
9,2323739 |
-0,55 |
0,3051169 |
2 |
12,18 |
5,31 |
13,32 |
8,80 |
11,440889 |
0,74 |
0,5462856 |
3 |
13,12 |
7,02 |
15,82 |
9,64 |
13,130643 |
-0,01 |
0,0001133 |
4 |
15,25 |
9,90 |
16,39 |
9,89 |
16,20207 |
-0,95 |
0,9064371 |
5 |
19,37 |
12,18 |
17,18 |
11,95 |
17,574697 |
1,80 |
3,2231123 |
6 |
21,34 |
15,36 |
19,46 |
11,97 |
21,327904 |
0,01 |
0,0001463 |
7 |
24,06 |
18,44 |
21,51 |
13,29 |
S1= |
4,9812114 | |
8 |
26,60 |
24,13 |
23,10 |
15,67 |
|||
9 |
31,24 |
25,83 |
24,70 |
15,59 |
|||
10 |
33,70 |
28,57 |
25,49 |
16,42 |
|||
11 |
37,01 |
29,70 |
25,61 |
16,01 |
35,388655 |
1,62 |
2,6287596 |
12 |
36,19 |
31,30 |
28,11 |
18,73 |
35,845538 |
0,34 |
0,1186539 |
13 |
40,04 |
34,03 |
28,22 |
17,09 |
39,813065 |
0,23 |
0,0514997 |
14 |
42,19 |
36,53 |
28,45 |
17,38 |
42,402301 |
-0,21 |
0,0450715 |
15 |
44,21 |
38,35 |
29,59 |
17,82 |
44,275712 |
-0,07 |
0,004318 |
S2= |
2,8483028 | ||||||
F= |
0,5718092 | ||||||
c= |
4 |
Fkp= |
19 |
Отношение F = S2 /S1=0,57 сравниваем с табличным Fкр=19, из чего делаем вывод: о гомоскедастичности остатков.
Автокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не являются независимыми друг от друга, потому что текущие значения Y находятся под влиянием прошлых значений. Зависимость между остатками описывается с помощью авторегрессионной схемы. Например, допустим, что остаток et находится под влиянием остатка из предыдущего периода времени et-1 и какого-либо текущего значения случайной переменной ut. Остаток et будет описываться следующей авторегрессионной функцией первого порядка:
Для проверки на автокорреляцию применяется критерий Дарбина-Уотсона, в соответствии с которым рассчитывается d-статистика (или DW):
.
Эмпирическое правило гласит, что если критерий Дарбина-Уотсона равен двум, то не существует автокорреляции, если он равен нулю, то имеет место совершенная положительная автокорреляция а если он равен четырем, то имеет место совершенная отрицательная автокорреляция. Авторы разработали таблицу, содержащую критические значения: нижнее dL и верхнее du (или dН и dВ ). Вычисленное значение d-статистики сравнивается с табличными, выбранными при заданном уровне значимости, в зависимости от количества наблюдений и числа независимых переменных в модели. Для d < 2 руководствуемся следующим правилом:
Если расчетное значение d больше двух, то описанной проверке подвергается величина (4 – d) и делаются те же выводы с той разницей, что автокорреляция будет отрицательной.
Автокорреляция может появиться из-за того, что не все важные факторы введены в модель, из-за неверно выбранной формы связи (уравнения регрессии). Введение переменных с лагом тоже может привести к автокорреляции остатков. Применение МНК для оценивания параметров модели при наличии автокорреляции имеет те же негативные последствия, как и в случае с гетероскедастичностью.
Результаты расчета критерия Дарбина-Уотсона приведены в таблице.
№ |
e |
et-et-1 |
(et-et-1)^2 |
1 |
-0,552 |
||
2 |
0,739 |
1,291 |
1,668 |
3 |
-0,011 |
-0,750 |
0,562 |
4 |
-0,952 |
-0,941 |
0,886 |
5 |
1,795 |
2,747 |
7,548 |
6 |
0,012 |
-1,783 |
3,180 |
7 |
-0,113 |
-0,125 |
0,016 |
8 |
-2,584 |
-2,471 |
6,106 |
9 |
-0,053 |
2,531 |
6,408 |
10 |
-0,196 |
-0,143 |
0,021 |
11 |
1,621 |
1,817 |
3,303 |
12 |
0,344 |
-1,277 |
1,630 |
13 |
0,227 |
-0,118 |
0,014 |
14 |
-0,212 |
-0,439 |
0,193 |
15 |
-0,066 |
0,147 |
0,021 |
Сумма |
31,556 | ||
d= |
2,167 | ||
4-d= |
1,833 |
Информация о работе Построение множественной эконометрической модели