Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели

Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 17:39, курсовая работа

Краткое описание

Целью работы является получение практических навыков построения эконометрических моделей. Эконометрический метод складывался в преодолении следующих трудностей, искажающих результаты применения классических статистических методов (сущность новых терминов будет раскрыта в дальнейшем): 1. асимметричности связей;
2. мультиколлинеарности связей; 3. эффекта гетероскедастичности; 4. автокорреляции; 5. ложной корреляции; 6. наличия лагов.

Содержание

Введение - 3 -
Глава I. Аналитическая часть - 5 -
1.1. Основы построения и тестирования адекватности экономических моделей множественной регрессии - 5 -
1.2. Проблема спецификации экономических моделей множественной регрессии - 13 -
1.3. Последствия ошибок спецификации экономических моделей множественной регрессии - 18 -
Глава II. Проектная часть - 21 -
2.1. Методическое обеспечение - 21 -
2.2. Информационное обеспечение - 30 -
2.3. Числовой пример модели множественной регрессии и выводы - 31 -
Заключение 51
Список литературы

Вложенные файлы: 1 файл

antonova1.docx

— 1.95 Мб (Скачать файл)

Рекомендуется после проверки общего качества уравнения регрессии  провести анализ его статистической значимости. Для этого используется F-статистика:  
  
Показатели F и R2 равны или не равен нулю одновременно. Если F=0, то R2=0, следовательно, величина Y линейно не зависит от X1,X2,…,Xm..Расчетное значение F сравнивается с критическим Fкр. Fкр, исходя из требуемого уровня значимости α и чисел степеней свободы v1 = m и v2 = n - m - 1, определяется на основе распределения Фишера. Если F>Fкр, то Rстатистически значим.

Проверка выполнимости предпосылок МНК множественной  регрессии. Статистика Дарбина-Уотсона  для множественной регрессии

Статистическая значимость коэффициентов множественной регрессии  и близкое к единице значение коэффициента детерминации Rне гарантируют высокое качество уравнения множественной регрессии. Поэтому следующим этапом проверки качества уравнения множественной регрессии является проверка выполнимости предпосылок МНК. Причины и последствия невыполнимости этих предпосылок, методы корректировки регрессионных моделей будут рассмотрены в последующих главах. В данном параграфе рассмотрим популярную в регрессионном анализе статистику Дарбина-Уотсона.

При статистическом анализе  уравнения регрессии на начальном  этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между  собой.

При этом проверяется некоррелированность  соседних величин ei,i=1,2,…n..  
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:  
 
Критические значения dи dопределяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n и количества объясняющих переменных m.

Автоматический расчет

Полностью произвести подобный расчет можно автоматически, используя  популярный сервис Множественная регрессия (с оформлением в Word)

Частные коэффициенты корреляции при множественной регрессии

Частные коэффициенты (или  индексы) корреляции, измеряющие влияние  на у фактора хпри неизменном уровне других факторов определяются по стандартной формуле линейного коэффициента корреляции, т.е. последовательно беруться пары yx1,yx2,... , x1x2, x1xи так далее и для каждой пары находится коэффициент корреляции 
Вычисления в MS Excel. Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция.

Для этого:

1) Выполнить команду Сервис / Анализ данных / Корреляция. 
2) Указать диапозон данных;

Проверка общего качества уравнения множественной регрессии

Для этой цели, как и в  случае множественной регрессии, используется коэффициентдетерминации R2

Справедливо соотношение 0 < =R< = 1. Чем ближе этот коэффициент к единице, тем больше уравнение множественной регрессии объясняет поведение Y.

Для множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение R2, так как каждая последующая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведениезависимой переменной.

Иногда при расчете  коэффициента детерминации для получения  несмещенных оценок в числителе  и знаменателе вычитаемой из единицы  дроби делается поправка на число  степеней свободы, т.е. вводится так  называемый скорректированный (исправленный) коэффициент детерминации: 

Соотношение может быть представлено в следующем виде: 
 
 для m>1. С ростом значения mскорректированный коэффициент детерминации растет медленнее, чем обычный.Очевидно, что  только при R= 1.   может принимать отрицательные значения.  
Доказано, что   увеличивается при добавлении новой объясняющей переменной тогда и только тогда, когда t-статистика для этой переменной по модулю больше единицы. Поэтому добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.

Рекомендуется после проверки общего качества уравнения регрессии  провести анализ его статистической значимости. Для этого используется F-статистика:

Показатели F и Rравны или не равен нулю одновременно. Если F=0, то R2=0, следовательно, величина Yлинейно не зависит от X1,X2,…,Xm.Расчетное значение F сравнивается с критическим Fкр. Fкр, исходя из требуемого уровня значимости α и чисел степеней свободы v= m и v= n - m - 1, определяется на основе распределения Фишера. Если F > Fкр, то Rстатистически значим.

2.2. Информационное обеспечение множественной регрессии 

По данным, представленным в таблице 2, изучается зависимость объёма валового национального продукта Y (млрд. долл.) от следующих переменных: Х1 – потребление, млрд. долл., Х2 – инвестиции, млрд. долл.

 

                                                                                               Таблица 2.

 

1

2

3

4

5

6

7

8

9

10

Y

8

9,5

11

12

13

14

15

16,5

17

18

Х1

1,65

1,8

2,0

2,1

2,2

2,4

2,65

2,85

3,2

3,55

Х2

14

16

18

20

23

23,5

25

26,5

28,5

30,5


 

  1. Для заданного набора данных постройте линейную модель множественной регрессии. Оцените точность и адекватность построенного уравнения регрессии.
  2. Дайте экономическую интерпретацию параметров модели.
  3. Для полученной модели проверьте выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.
  4. Проверьте полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
  5. Проверьте, адекватно ли предположение об однородности исходных данных в регрессионном смысле. Можно ли объединить две выборки (по первым 5 и остальным 5 наблюдениям) в одну и рассматривать единую модель регрессии Y по X?

 

 

 

 

2.3. Числовой пример модели множественной  регрессии  и выводы множественной регрессии 

 

  1. Построим линейную модель множественной регрессии с помощью Microsoft Office Excel.

 Регрессионный анализ  предназначен для исследования  зависимости исследуемой переменной  Y от различных факторов и отображение их взаимосвязи в форме регрессионной модели.

В зависимости от количества включенных в модель факторов Х модели делятся на:

  • Однофакторные (парная модель регрессии)
  • Многофакторные (модель множественной регрессии).

               Линейная модель множественной  регрессии имеет вид:

=b0+ b 1*x1+ b 2*x2+…+ b n*xn

Для построения линейной модели множественной регрессии на листе Microsoft Office Excel (2007)  создадим табличку с нашими данными (Рис. 1) и построим регрессию.  Для этого на закладке Данные выберем строку Анализ данных и в качестве инструмента данных – Регрессия - ок. В открывшемся окне Регрессии зададим Входной интервал Yи Х (рис.2,3).


 

 

 

 

                                                          

 

 

 

                   Рис. 1.   Линейная модель множественной регрессии                                      


 

 

                                  Рис. 2. Окно Анализ данных


 

                                                                            

                                                                                                 

                                                                      

 

 

 

 

 

                                                                          

 

 

 

 

Рис.3. Окно Регрессия.

Получим результаты регрессионного анализа на новом листе Регрессия (Рис.4)

 

Рис.4. Лист Регрессия.

По данным регрессионной  статистики мы получили следующие данные:

Множественный R – это √R2 , где R2 – коэффициент детерминации.


R-квадрат – это R2. В нашем примере значение R2=0,9883 свидетельствует о том, что изменения зависимой переменной Y(объём валового национального продукта (ВНП)) в основном (на 98,83%) можно объяснить изменениями включенных в модель объясняющих переменных - Х1, Х2 (потребление и инвестиции). И лишь на 1,17% (100-98,83)  объём ВНП зависит от других неучтённых факторов. Такое значение свидетельствует об адекватности модели.

Нормированный R-квадрат – поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.


Стандартная ошибка регрессии S=√S2, где S2=∑(еi2/(n-m)) – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); n- число наблюдений (в нашем случае 10), m- число объясняющих переменных (в нашем примере равно 2).

Наблюдения – число наблюдений n (10).

Рассмотрим таблицу с  результатами дисперсионного анализа:

df – число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант (m+1).

SS- сумма квадратов (регрессионная RSS, остаточная ESS и общая TSS соответственно).

MS – сумма квадратов на одну степень свободы. MS=SS/df.

F – расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F.  На уровне значимости α=0,05 уравнение регрессии признается значимым в целом, если Значимость F<0,05, и незначимым, если Значимость F≥0,05.

Для нашего примера имеем  следующие значения:

Таблица 2

 

df

SS

MS

F

Значимость F

Регрессия

m=2

RSS=97,74

RSS/df=48,87

 

(RSS/ESS)*

((n-m-1)/m) =295,50

1,73534E-07

Остаток

n-m- =7

ESS=1,15

ESS/df=0,165

   

Итого

n-1=9

TSS= 98,9

     

 

В нашем случае расчетное  значение F-критерия Фишера составляет 295,50. Значимость F=1,74E-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

В последней таблице приведены  значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные  значения t-критериев Стьюдента для оценки значимости отдельных параметров модели.

 

 

 

Таблица 4

 

Коэффи-циенты

Стандарт-ная ошибка

t-статистика

Р-значение

Нижние 95%

Верхние 95%

Y

b0=-0,26

mb0=0,58

tb0=-0,44

0,67

-1,62≤ b0≤ 1,11

X1

b1=0,47

mb1=0,88

tb1=0,53

0,61

-1,62≤ b1≤  2,56

X2

b2=0,56

mb2=0,10

tb2=5,53

0,0008

0,32≤ b2≤ 0,79

Информация о работе Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели