Контрольная работа по "Эконометрике"

Автор работы: Пользователь скрыл имя, 31 Августа 2013 в 11:42, контрольная работа

Краткое описание

Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 50 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации, коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.
Проверьте модели на отсутствие автокорреляции.
Проверка на гетероскедастичность моделей.
Сравните модели между собой выберете лучшую.

Вложенные файлы: 1 файл

контрольная по эконометрике.doc

— 766.50 Кб (Скачать файл)

 

Задание.

Работа должны быть выполнена в  соответствии со следующими этапами:

  1. Рассчитайте корреляцию между,  экономическими показателями (не менее 5) из статистических данных по выборке не менее 50 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
  2. Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации, коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.
  3. Проверьте модели  на отсутствие автокорреляции.
  4. Проверка на гетероскедастичность моделей.
  5. Сравните модели между собой выберете лучшую.

 

Рассмотрим зависимость средней ожидаемой продолжительности жизни от нескольких факторов по данным за 2000 г. для ряда стран. Статистические данные приведены в табл. 1.

 

                                                                                                  Таблица 1

№№

X1

X2

X3

X4

Y

1

2,3

2,6

2,7

98

49

2

4,3

2,5

2,4

91

55

3

2,9

2,8

2,1

99

49

4

2,4

3,1

3,1

89

52

5

5,1

1,6

2,1

79

58

6

3,4

2

1,7

72

57

7

4,5

2,9

2,8

80

53

8

5,1

2,7

2,7

58

58

9

4,2

3

2,8

88

56

10

5,2

1,8

2

68

62

11

6,5

2,9

2,5

95

50

12

7,4

2,8

2,7

73

59

13

8,3

2,9

3,3

90

60

14

5,7

2,5

2,7

96

51

15

7,5

2,4

2,2

55

57

16

10,8

1,1

1,1

34

69

17

7,8

2,9

3,1

56

57

18

7,6

2,9

2,6

90

51

19

12,1

1,3

2

16

72

20

14,2

2

2,7

56

63

21

14,1

1,6

2,5

51

64

22

10,6

2,2

2,7

39

66

23

12,4

2

2,6

55

65

24

9

2,3

2,3

64

57

25

12,4

2,9

3,5

44

66

26

15,6

2,2

3,2

36

69

27

14,3

1,9

2,6

37

71

28

13,1

1

1,8

13

74

29

9,7

2,2

3,4

36

67

30

13,5

2,7

2,9

41

68

31

18,5

1,9

3

39

69

32

15,6

0,2

0,2

13

70

33

14

2

3,1

47

66

34

28

0,9

1,3

35

69

35

22,2

1,7

2,4

23

73

36

20,7

1,7

2,1

48

67

37

20

0,3

0,6

14

70

38

13,4

0,3

0,7

11

72

39

29,3

2,3

3

23

71

40

18,6

2,2

2,4

50

64

41

23,7

1,9

2,8

33

72

42

49

1,3

1,8

16

71

43

20

1,5

1,6

44

67

44

31,9

0,8

1,8

13

72

45

33,4

2,4

2,7

12

71

46

35,3

1,5

2,1

12

72

47

24,6

0,6

1

18

73

48

30,8

1,3

2

22

73

49

43,4

0,6

0,9

8

78

50

42,4

0,9

1,9

10

72

51

53,8

0,2

1

7

77

52

60,6

1,4

1,5

7

76

53

58,1

0,5

1,7

6

77

54

70,2

1,1

1,4

6

77

55

73,7

0,2

0,4

7

78

56

78,3

1,3

1

6

78

57

65,8

0,5

0,1

5

76

58

85,1

1,6

1,3

5

79

59

68,7

0,6

0,3

4

79

60

73,9

0,7

0,6

6

78

61

80,3

0,4

0,5

8

77

62

78

0,5

0,8

6

78

63

84,4

2

1,7

4

76

64

78,8

0,8

0,5

6

77

65

78,7

0,3

0,1

6

75

66

82

0,3

0,6

4

80


 

Принятые в таблице обозначения:

Y - средняя ожидаемая продолжительности жизни при рождении, лет;

X1 - ВВП в паритетах покупательной способности;

X2 - темпы прироста населения по сравнению с предыдущем годом, %;

X3 - темпы прироста рабочей силы по сравнению с предыдущем годом, %;

X4 - коэффициент младенческой смертности, %.

 

1. Вычислим описательные характеристики  признаков. При вычислении воспользуемся  библиотечной процедурой Excel «Описательная статистика» (Сервис ® Анализ данных ® Описательная статистика). Результаты расчета для всех признаков приведены в табл. 2

 

                                                                                                                                      Таблица 2

X1

 

X2

 

X3

 

X4

 

Y

 
                   

Среднее

29,65455

Среднее

1,642424

Среднее

1,934848

Среднее

37,62121

Среднее

67,5

Стандартная ошибка

3,33716

Стандартная ошибка

0,11014

Стандартная ошибка

0,115943

Стандартная ошибка

3,795272

Стандартная ошибка

1,094008

Медиана

17,05

Медиана

1,7

Медиана

2,1

Медиана

34,5

Медиана

69,5

Мода

5,1

Мода

2,9

Мода

2,7

Мода

6

Мода

72

Стандартное отклонение

27,11122

Стандартное отклонение

0,894782

Стандартное отклонение

0,941928

Стандартное отклонение

30,83293

Стандартное отклонение

8,887762

Дисперсия выборки

735,0182

Дисперсия выборки

0,800634

Дисперсия выборки

0,887228

Дисперсия выборки

950,6697

Дисперсия выборки

78,99231

Эксцесс

-0,6672

Эксцесс

-1,24142

Эксцесс

-0,96911

Эксцесс

-0,9218

Эксцесс

-0,75724

Асимметричность

0,924782

Асимметричность

-0,10033

Асимметричность

-0,3911

Асимметричность

0,620407

Асимметричность

-0,59056

Интервал

82,8

Интервал

2,9

Интервал

3,4

Интервал

95

Интервал

31

Минимум

2,3

Минимум

0,2

Минимум

0,1

Минимум

4

Минимум

49

Максимум

85,1

Максимум

3,1

Максимум

3,5

Максимум

99

Максимум

80

Сумма

1957,2

Сумма

108,4

Сумма

127,7

Сумма

2483

Сумма

4455

Счет

66

Счет

66

Счет

66

Счет

66

Счет

66

Уровень надежности (95,0%)

6,664769

Уровень надежности (95,0%)

0,219965

Уровень надежности (95,0%)

0,231555

Уровень надежности (95,0%)

7,579681

Уровень надежности (95,0%)

2,184884


 

Построим диаграммы рассеяния объясняющих переменных X1, X2, X3, X4  с зависимой переменной Y.

 

Рис. 1.

 

Рис. 2.

 

Рис. 3.

 

Рис. 4.

 

Из диаграмм рассеяния можно сделать предварительный вывод о наличии корреляционной связи между переменными.

Коэффициент корреляции между двумя  переменными X и Y вычисляется по формуле:


Подставив исходные данные в эту формулу, для всех возможных различных сочетаний переменных X1, X2, Y, получим матрицу парных коэффициентов корреляции:

 

                                                                                                   Таблица 3

 

X1

X2

X3

X4

Y

X1

1

       

X2

-0,65421

1

     

X3

-0,69735

0,877684

1

   

X4

-0,76604

0,800806

0,645195

1

 

Y

0,796245

-0,79297

-0,6251

-0,96374

1


 

Расчет матрицы парных коэффициентов  корреляции был произведен в  MS Excel: (Сервис ® Анализ данных ® Корреляция).

Из таблицы 2 можно предположить коллинеарность факторов X2 и X3, а также X4 и Y.

2. Т.к. обе переменные X2 и X3 являются объясняющими, то уберем из рассмотрения одну из них, для определенности X3. Построим по оставшимся факторам уравнение множественной регрессии (Сервис ® Анализ данных ® Регрессия):

.                                                                     (1)

Результаты расчета приведены  в табл. 4.

                                                                                                                  Таблица 4

ВЫВОД ИТОГОВ

         
           

Регрессионная статистика

       

Множественный R

0,968303326

       

R-квадрат

0,937611331

       

Нормированный R-квадрат

0,934592524

       

Стандартная ошибка

2,273034856

       

Наблюдения

66

       
           

Дисперсионный анализ

         
 

df

SS

MS

F

Значимость F

Регрессия

3

4814,165378

1604,721793

310,5900651

2,74204E-37

Остаток

62

320,3346222

5,166687454

   

Итого

65

5134,5

     
           
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Y-пересечение

75,8319549

1,113265305

68,11669647

5,37647E-60

73,60657172

X1

0,044590428

0,016269626

2,740716173

0,007998521

0,012067944

X2

-0,433377979

0,529065843

-0,81913808

0,415845272

-1,490964362

X4

-0,237697639

0,018065075

-13,15785532

1,32344E-19

-0,273809168


 

3. Построим графики остатков относительно каждой из объясняющих переменных.

 

Рис. 5.

 

 

Рис. 6.

 

 

Рис. 7.

 

Рассмотрение графиков остатков позволяет сделать два  вывода:

1. Автокорреляция остатков отсутствует.

2. Можно предположить наличие гетероскедостичности (обратнопропорциональной) остатков относительно фактора X1.

4. Проведем тестирование уравнения множественной регрессии (1) на гетероскедостичность с помощью теста Гельфельда-Квандта.

Тест Гельфельда-Квандта заключается  в следующем.

1) Выделяют фактор пропорциональности Z = Xk.

Данные упорядочиваются в порядке  возрастания величины Z.

2) Отбрасывают среднюю  треть упорядоченных наблюдений. Для первой и последней третей строятся две отдельные регрессии, используя ту же спецификацию модели регрессии.

3) Количество наблюдений в этих  подвыборках должно быть одинаково.  Обозначим его l.

4) Берутся суммы квадратов остатков  для регрессий по первой трети RSS1 и последней трети RSS3. Рассчитывают их отношение:

 - для случая прямой пропорциональности,

 - для случая обратной пропорциональности.

5) Используем F-тест для проверки гомоскедостичности. Если статистика GQ удовлетворяет неравенству

, где m - число переменных (в задаче m=2),

то гипотеза гомоскедостичности остатков отвергается в пользу гетероскедостичности на уровне значимости a.

Уровень значимости для определенности возьмем a = 5%.

Рассмотрим в качестве фактора  пропорциональности переменную X1.

 Упорядоченные данные в порядке  возрастания величины Z = X1 имеют следующий вид:

 

                                                                                                              Таблица 5

Исходная таблица, упорядоченная  по X1

№№

X1

X2

X3

X4

Y

1

2,3

2,6

2,7

98

49

2

2,4

3,1

3,1

89

52

3

2,9

2,8

2,1

99

49

4

3,4

2

1,7

72

57

5

4,2

3

2,8

88

56

6

4,3

2,5

2,4

91

55

7

4,5

2,9

2,8

80

53

8

5,1

1,6

2,1

79

58

9

5,1

2,7

2,7

58

58

10

5,2

1,8

2

68

62

11

5,7

2,5

2,7

96

51

12

6,5

2,9

2,5

95

50

13

7,4

2,8

2,7

73

59

14

7,5

2,4

2,2

55

57

15

7,6

2,9

2,6

90

51

16

7,8

2,9

3,1

56

57

17

8,3

2,9

3,3

90

60

18

9

2,3

2,3

64

57

19

9,7

2,2

3,4

36

67

20

10,6

2,2

2,7

39

66

21

10,8

1,1

1,1

34

69

22

12,1

1,3

2

16

72

23

12,4

2

2,6

55

65

24

12,4

2,9

3,5

44

66

25

13,1

1

1,8

13

74

26

13,4

0,3

0,7

11

72

27

13,5

2,7

2,9

41

68

28

14

2

3,1

47

66

29

14,1

1,6

2,5

51

64

30

14,2

2

2,7

56

63

31

14,3

1,9

2,6

37

71

32

15,6

2,2

3,2

36

69

33

15,6

0,2

0,2

13

70

34

18,5

1,9

3

39

69

35

18,6

2,2

2,4

50

64

36

20

0,3

0,6

14

70

37

20

1,5

1,6

44

67

38

20,7

1,7

2,1

48

67

39

22,2

1,7

2,4

23

73

40

23,7

1,9

2,8

33

72

41

24,6

0,6

1

18

73

42

28

0,9

1,3

35

69

43

29,3

2,3

3

23

71

44

30,8

1,3

2

22

73

45

31,9

0,8

1,8

13

72

46

33,4

2,4

2,7

12

71

47

35,3

1,5

2,1

12

72

48

42,4

0,9

1,9

10

72

49

43,4

0,6

0,9

8

78

50

49

1,3

1,8

16

71

51

53,8

0,2

1

7

77

52

58,1

0,5

1,7

6

77

53

60,6

1,4

1,5

7

76

54

65,8

0,5

0,1

5

76

55

68,7

0,6

0,3

4

79

56

70,2

1,1

1,4

6

77

57

73,7

0,2

0,4

7

78

58

73,9

0,7

0,6

6

78

59

78

0,5

0,8

6

78

60

78,3

1,3

1

6

78

61

78,7

0,3

0,1

6

75

62

78,8

0,8

0,5

6

77

63

80,3

0,4

0,5

8

77

64

82

0,3

0,6

4

80

65

84,4

2

1,7

4

76

66

85,1

1,6

1,3

5

79


 

В результате расчета с помощью  программы MS Excel (Сервис ® Анализ данных ® Регрессия) для первой и последней трети данных, получено:

, l = 21; m = 3; ;

.

Т.к. , то на уровне значимости 5% имеет место гетероскедостичность остатков относительно фактора пропорциональности X1.

Уровень значимости, при котором  принимается гипотеза о наличии гетероскедостичности остатков относительно фактора пропорциональности X1, составляет:

, или 0,98%.

т.е. доверительная вероятность наличия гетероскедостичности достаточно высока и равняется

1 - a  = 100 - 0,66 = 99,02%.

Гетероскедостичность остатков относительно фактора обратной пропорциональности X1 объясняется большим разбросом значений средней ожидаемой продолжительности жизни при рождении относительно ВВП.

5. Из таблицы 4 видно, что значимыми (на уровне значимости 5%) коэффициентами в уравнении регрессии (1) являются коэффициенты при переменных X1 и X4. По сути это означает, что факторы X1 и X4 значимо воздействуют на формирование средней продолжительности жизни в уравнении (1).

Построим теперь уравнение множественной  регрессии со статистически значимыми  факторами X1 и X4. Оно имеет вид:

.                                                                                             (2)

Результаты расчета приведены  в табл. 6.

                                                                                                                          Таблица 6

ВЫВОД ИТОГОВ

         
           

Регрессионная статистика

       

Множественный R

0,967954615

       

R-квадрат

0,936936137

       

Нормированный R-квадрат

0,93493411

       

Стандартная ошибка

2,267091708

       

Наблюдения

66

       
           

Дисперсионный анализ

         
 

df

SS

MS

F

Значимость F

Регрессия

2

4810,698597

2405,349298

467,993666

1,55987E-38

Остаток

63

323,8014033

5,139704814

   

Итого

65

5134,5

     
           
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Y-пересечение

75,4214603

0,991497603

76,06822251

1,04257E-63

73,44010924

X1

0,04600161

0,016135859

2,85089316

0,005886759

0,013756649

X4

-0,246818659

0,014188168

-17,39609113

9,63533E-26

-0,275171468

Информация о работе Контрольная работа по "Эконометрике"