Построение множественной эконометрической модели

Автор работы: Пользователь скрыл имя, 22 Сентября 2013 в 18:24, контрольная работа

Краткое описание

Построить эконометрическую модель зависимости производительности труда (Y) от основных производственных факторов:
Х1 – фондовооруженность труда тыс.грн./чел;
Х2 – коэффициент текучести кадров, %;
Х3 – потери рабочего времени, %.
Проверить статистическую значимость модели и оценок ее параметров. Сделать выводы.
Проверить выполнение основных предпосылок классической регрессионной модели (проверка остатков модели на гетероскедастичности, автокорреляцию; исследование факторов на мультиколлинеарность).
Осуществить прогноз производительности труда на следующие четыре месяца, если заданы ожидаемые значения факторов, влияющих на нее. Исходные данные приведены в табл

Вложенные файлы: 1 файл

КР эконометрия.doc

— 387.00 Кб (Скачать файл)

                                                         

Определим стандартные ошибки оценок параметров модели:

                                                                                                                     где   – диагональные элементы матрицы (Х’X)-1.

 

Se^2=

1,324

Se=

1,151

Sb0=

4,770

Sb1=

0,208

Sb2=

0,556

Sb3=

0,494


 

Для проверки  статистической  надежности (значимости) оценок параметров модели найдем величину t-статистики, используя формулу:

                                                 

Полученные  значения сравним с табличным  значением  t-Стьюдента через функцию СТЬЮДРАСПОБР. В диалоговое окно этой функции следует ввести вероятность на уровне значимости, т.е. ввести 0,05 (соответствующая доверительная вероятность при этом составит 0,95) или 0,01 (доверительная вероятность 0,99), и число степеней свободы, равное  11    (15 - 4 = 11), в итоге получим  tтабл = 2,201.

Результаты:                                                            

 

 

t0=

1,918

t1=

5,264

t2=

0,229

t3=

1,199

tkp=

2,201




 

 

 

 

 

 

Сравнив вычисленные t-статистики с табличным значением, делаем вывод о статистической незначимости b0 , b2  и b3.

Проверка близости расположения фактических данных к  рассчитанной линии регрессии осуществляется на основе исследования коэффициента детерминации. Регрессионная модель показывает, что вариация Y может быть объяснена вариацией независимой переменной Х и значением возмущения e. Мы хотим знать, насколько вариация Y обусловлена изменением Х и насколько она является следствием случайных причин. Другими словами, нам нужно знать, насколько хорошо рассчитанное уравнение регрессии соответствует фактическим данным, т.е. насколько мала вариация данных вокруг линии регрессии.

Для оценки степени  соответствия линии регрессии нужно  рассчитать коэффициент детерминации.

Доля дисперсии зависимой  переменной, объясненная регрессией, называется коэффициентом детерминации, обозначается R2 и  определяется:

                .                                         

Величина коэффициента детерминации находится в пределах от 0 до 1 и служит одним из критериев проверки качества линейной модели.  Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов,  следовательно, линейная модель хорошо аппроксимирует исходные данные,  и ею можно пользоваться для прогноза значений результативного признака.

Коэффициент детерминации R2 сам по себе является случайной переменной и поэтому нуждается в проверке значимости, которая осуществляется с помощью F-критерия Фишера. F-распределение отличается от других тем, что обладает двумя наборами чисел степеней свободы: один (часто обозначаемый n1) – в числителе критерия проверки, а другой (обозначаемый n2) – в знаменателе.  В критерии проверки для R2 числителю соответствует одна степень свободы и (n – 2) степеней свободы соответствует знаменателю. Расчет F-критерия для проверки значимости R2 выполняется следующим образом:

.

Результаты:

 

Y

(Y-Ycp)

(Y-Ycp)^2

     

1

8,68

-18,33

336,0622

     

2

12,18

-14,83

219,9882

     

3

13,12

-13,89

192,9877

     

4

15,25

-11,76

138,3446

     

5

19,37

-7,64

58,40016

     

6

21,34

-5,67

32,17158

     

7

24,06

-2,95

8,714304

     

8

26,60

-0,41

0,169744

     

9

31,24

4,23

17,87598

     

10

33,70

6,69

44,72934

     

11

37,01

10,00

99,96

     

12

36,19

9,18

84,23568

     

13

40,04

13,03

169,7288

     

14

42,19

15,18

230,3717

     

15

44,21

17,20

295,7712

     

Cреднее

27,01

Сумма

1929,511

     
     

R^2=

0,99

R^2korr=

0,9903951

     

F=

11,95533

   
     

Fkp=

8,70287

   

 

Обратившись к F-таблице, видим, что табличное значение при 5%-м уровне значимости для n1 = 1 и n2 = 13 составляет 8,7. Так как расчетное значение F-критерия больше табличного, то при доверительной вероятности 0,95 отвергаем нулевую гипотезу о том, что истинное значение коэффициента детерминации равно нулю.

Таким образом, можно сделать вывод  о том, что коэффициент детерминации (а значит, и модель в целом) являются статистически надежным показателем взаимосвязи рассматриваемых показателей.

В многофакторной модели добавление дополнительных объясняющих  переменных увеличивает коэффициент  детерминации. Следовательно, коэффициент  детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный коэффициент детерминации рассчитывается так:

,

 

где n – число наблюдений, р – количество независимых переменных.

Скорректированный коэффициент  детерминации равен:

.

 

Таким образом, все критерии качества построенной  множественной эконометрической модели подтверждают ее точность и высокое  качество.

 

  1. Проверить выполнение основных предпосылок классической регрессионной модели (проверка остатков модели на  гетероскедастичности, автокорреляцию;  исследование факторов на мультиколлинеарность).

 

Прежде, чем  использовать построенную эконометрическую модель, важно определить, выполнялись  ли предпосылки МНК, поскольку от этого зависит, обладают ли оценки параметров модели нужными свойствами. Особенно важно провести проверку на:

  • гомоскедастичность – является ли дисперсия остатков постоянной;
  • отсутствие автокорреляции остатков – остатки независимы;
  • отсутствие мультиколлинеарности – некоррелированность  объясняющих переменных.

 

Гетероскедастичность приводит к тому, что оценки параметров модели больше не представляют собой лучшие оценки, или не являются оценками с минимальной дисперсией, т.е. они не обладают свойством эффективности.

Воздействие гетероскедастичности на оценку интервала прогнозирования и проверку гипотезы заключается в том, что хотя коэффициенты не смещены, дисперсии, и, следовательно, стандартные ошибки этих коэффициентов будут смещены. Чаще всего смещение является отрицательным  (т.е. в сторону уменьшения), значит, стандартные ошибки будут меньше, чем они должны быть, а t-критерий – больше, чем в реальности. Вследствие этого мы можем отвергнуть нулевую гипотезу, в то время как она должна быть принята, т.е. ошибочно будем считать коэффициент регрессии значимым, тогда как это не так.

 Для проверки  на гетероскедастичность используется тест Голдфельда-Квандта. При проведении проверки по этому критерию предполагается, что стандартное отклонение (si) распределения вероятностей  ei  пропорционально значению Х в этом наблюдении. Предполагается также, что возмущение распределено нормально и не подвержено автокорреляции.

В соответствии с тестом Голдфельда-Квандта выполняем  следующие действия:

  1. все n наблюдений упорядочим по возрастанию Х;
  2. отбросим  с средних наблюдений; величину  с  предлагается определять так: , причем удобно принимать такое значение  с, которое позволяет   иметь два подмассива одинаковой длины m (после отбрасывания средних наблюдений);
  3. оцениваем отдельные регрессии для первых m и для последних m  наблюдений и находим суммы квадратов остатков в двух указанных регрессиях, которые обозначим  S1 и S2, соответственно;
  4. рассчитаем отношение F  = S2 /S1, которое имеет F- распределение с n1 = n2 = m – (р + 1) степенями свободы, где р – число объясняющих переменных в регрессионном уравнении. Сравнив расчетное F с табличным, делаем вывод: о наличии гетероскедастичности, если F расчетное больше  F табличного; о гомоскедастичности остатков  – в противном случае.

Если в модели имеется более одной объясняющей переменной, то наблюдения следует упорядочивать по той из них, которая, как предполагается, связана с  si.

Метод Голдфельда-Квандта  можно применять и при предположении, что si  обратно пропорционально значению Х. При этом используется та же процедура, но тестовой статистикой теперь является отношение F  = S1 /S2.

Результаты  приведены в таблице:

 

Y

Х1

Х2

Х3

Ymod

e

e*e

1

8,68

2,63

11,49

7,19

9,2323739

-0,55

0,3051169

2

12,18

5,31

13,32

8,80

11,440889

0,74

0,5462856

3

13,12

7,02

15,82

9,64

13,130643

-0,01

0,0001133

4

15,25

9,90

16,39

9,89

16,20207

-0,95

0,9064371

5

19,37

12,18

17,18

11,95

17,574697

1,80

3,2231123

6

21,34

15,36

19,46

11,97

21,327904

0,01

0,0001463

7

24,06

18,44

21,51

13,29

 

S1=

4,9812114

8

26,60

24,13

23,10

15,67

     

9

31,24

25,83

24,70

15,59

     

10

33,70

28,57

25,49

16,42

     

11

37,01

29,70

25,61

16,01

35,388655

1,62

2,6287596

12

36,19

31,30

28,11

18,73

35,845538

0,34

0,1186539

13

40,04

34,03

28,22

17,09

39,813065

0,23

0,0514997

14

42,19

36,53

28,45

17,38

42,402301

-0,21

0,0450715

15

44,21

38,35

29,59

17,82

44,275712

-0,07

0,004318

           

S2=

2,8483028

           

F=

0,5718092

c=

4

       

Fkp=

19


 

Отношение F  = S2 /S1=0,57  сравниваем с табличным Fкр=19, из чего делаем вывод: о гомоскедастичности остатков. 

 

Автокорреляция, также известная как сериальная корреляция, имеет место, когда остатки не являются независимыми друг от друга, потому что текущие значения Y находятся под влиянием прошлых значений. Зависимость между остатками описывается с помощью авторегрессионной схемы. Например, допустим, что остаток et находится под влиянием остатка из предыдущего периода времени et-1 и какого-либо текущего значения случайной переменной ut. Остаток et будет описываться следующей авторегрессионной функцией первого порядка:

                                          .

 

Для проверки на автокорреляцию применяется критерий Дарбина-Уотсона, в соответствии с которым рассчитывается d-статистика (или DW):

.

 

Эмпирическое  правило гласит, что если критерий Дарбина-Уотсона равен двум, то не существует автокорреляции, если он равен нулю, то имеет место совершенная положительная автокорреляция а если он равен четырем, то имеет место совершенная отрицательная автокорреляция. Авторы разработали таблицу, содержащую критические значения: нижнее  dL и верхнее du   (или dН  и dВ ).   Вычисленное значение d-статистики сравнивается с табличными, выбранными при заданном уровне значимости,  в зависимости от количества наблюдений и числа независимых переменных в модели. Для d < 2 руководствуемся следующим правилом:

  • если   d < dL, то имеется положительная автокорреляция;
  • если   d > du, то автокорреляции нет;
  • если   dL < d <  du, то ничего определенного сказать нельзя.

Если расчетное  значение d  больше двух, то описанной проверке подвергается величина  (4 – d) и делаются те же выводы с той разницей, что автокорреляция будет отрицательной.

Автокорреляция  может появиться из-за того, что  не все важные факторы введены  в модель, из-за неверно выбранной формы связи (уравнения регрессии). Введение переменных с лагом тоже может привести к автокорреляции остатков. Применение  МНК для оценивания параметров модели при наличии автокорреляции имеет те же негативные последствия, как и в случае с гетероскедастичностью.

Результаты  расчета критерия Дарбина-Уотсона  приведены в таблице.

 

e

et-et-1

(et-et-1)^2

1

-0,552

   

2

0,739

1,291

1,668

3

-0,011

-0,750

0,562

4

-0,952

-0,941

0,886

5

1,795

2,747

7,548

6

0,012

-1,783

3,180

7

-0,113

-0,125

0,016

8

-2,584

-2,471

6,106

9

-0,053

2,531

6,408

10

-0,196

-0,143

0,021

11

1,621

1,817

3,303

12

0,344

-1,277

1,630

13

0,227

-0,118

0,014

14

-0,212

-0,439

0,193

15

-0,066

0,147

0,021

   

Сумма

31,556

   

d=

2,167

   

4-d=

1,833

Информация о работе Построение множественной эконометрической модели