Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 17:39, курсовая работа
Целью работы является получение практических навыков построения эконометрических моделей. Эконометрический метод складывался в преодолении следующих трудностей, искажающих результаты применения классических статистических методов (сущность новых терминов будет раскрыта в дальнейшем): 1. асимметричности связей;
2. мультиколлинеарности связей; 3. эффекта гетероскедастичности; 4. автокорреляции; 5. ложной корреляции; 6. наличия лагов.
Введение - 3 -
Глава I. Аналитическая часть - 5 -
1.1. Основы построения и тестирования адекватности экономических моделей множественной регрессии - 5 -
1.2. Проблема спецификации экономических моделей множественной регрессии - 13 -
1.3. Последствия ошибок спецификации экономических моделей множественной регрессии - 18 -
Глава II. Проектная часть - 21 -
2.1. Методическое обеспечение - 21 -
2.2. Информационное обеспечение - 30 -
2.3. Числовой пример модели множественной регрессии и выводы - 31 -
Заключение 51
Список литературы
Анализ данной таблицы позволяет сделать вывод о том, что на уровне значимости α=0,05 значимым оказывается лишь коэффициент при факторе X2, так как лишь для него Р-значение меньше 0,05. Таким образом, фактор Х1 не существенен и его включение в модель не целесообразно.
Поскольку коэффициент регрессии в экономических исследованиях имеют четкую экономическую интерпретацию, то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, как например, -1,62≤ b1≤ 2,56. Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Это также подтверждает вывод о статистической незначимости коэффициентов регрессии при факторе Х1.
Таким образом, целесообразно исключить несущественный фактор Х1. Но мы оставим этот фактор, так как у нас всего 2 переменных и в случае его исключения, модель не будет многофакторной. Поэтому мы будем иметь ввиду, что фактор Х1 малозначим и построим уравнение зависимости Y (объёма валового национального продукта ) от значимой объясняющей переменной X2 (инвестиции) и незначимой Х1 (потребление) .
Оценим точность и адекватность полученной модели.
Согласно проведенной регрессионной статистики мы видим следующие результаты:
1.Коэффициент множественной корреляции (множественный R) равен 0,994. Следовательно, связь между факторами весьма тесная (по шкале Чудока)
2. Значение R2=0,9883 свидетельствует о том, что вариация зависимой переменной Y (объём валового национального продукта) в основном (на 98,78%) можно объяснить вариацией включенных в модель объясняющих переменных Х2 (инвестиции) и Х1. Это свидетельствует об адекватности модели.
3. По результатам дисперсионного анализа мы получили расчетное значение F-критерия Фишера, которое составляет 295,50. Рассчитаем с помощью Excel табличное значение Фишера (результат см. рис. 7). Для этого в ячейке Е14 (см. рис 4) обратимся к мастеру функций f(x) и выберем категорию: Статистические функции - функцию FРАСПОБР, как показано на рис. 5.
Рис. 5. Мастер функции.
Затем зададим нужные аргументы: Вероятность α=0,05. Степень свободы 1 – количество факторов Х. Степень свободы 2- это число степеней свободы: n-m-1=10-2-1=7, где n – число наблюдений (в нашем случае 10), m- число объясняющих переменных (в нашем примере равно 2) (см. рис. 6).
Рис. 6. Аргументы функции (расчет табличного значения Фишера в Microsoft Office Excel).
Рис. 7. Результат расчета табличного значения Фишера с помощью редактора Microsoft Office Excel.
Сравнивая расчетное значение F-критерия Фишера 295,50 с табличным 4,74 мы видим, что 295,50> 4,74. Следовательно, в целом, уравнение регрессии значимо.
Значимость F=1,735*10-7, что меньше 0,05. Это так же говорит о значимости уравнения.
Далее оценим значимость отдельных параметров построенной модели.
Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:
С надежностью 0,95 (с вероятностью 95%) коэффициент b1 лежит в интервале 0,55≤ b1≤ 0,66 .
Сравним полученное значение t-статистики с табличным, которое рассчитаем с помощью мастера функций (рис.8, 9)
Рис. 8 Мастер функций.
Рис. 9. Аргументы функции.
Результат расчета представлен на рис. 10 в ячейке D20.
Рис. 10. Результаты регрессии с рассчитанными табличными значениями F и t-статистики.
Сравнивая расчетные значения t-статистики с табличным 2,36 мы ещё раз убеждаемся, что значение переменной Х1 не значимое, так как 0,53< 2,36. А значение переменной Х2 является значимым, так как оно больше порогового 5,52>2,36.
Таким образом, модель балансовой прибыли предприятия торговли запишется в следующем виде:
=-0,26+0,47*Х1+0,57*X2.
Теперь построим в Excel заново нашу регрессию с выведением остатков:
Рис.11. Регрессия с остатками.
Получим:
Рис. 12. Регрессия с рассчитанными остатками.
Найдём долю ошибки в Y(по модулю):
Ошибка аппроксимации (выравнивания) А=| |*100%.
Разделим ошибку аппроксимации на число наблюдений и получим среднюю ошибку аппроксимации:
= ∑| |*100%.
Для нахождения А с помощью редактора Microsoft Office Excel воспользуемся математическими функциями:
Рис.13. Мастер функций.
Зададим аргументы функций (рис. 14.)
Найдём среднюю ошибку аппроксимации (рис. 15)
Рис. 15. Расчет ошибки аппроксимации и средней ошибки аппроксимации.
Мы получили среднюю ошибку аппроксимации равную =2,027. Это говорит о том, что исследуемая модель является точной (так как <10).
=-0,26+0,47*Х1+0,57*X2.
Коэффициент b1=0,47 означает, что при увеличении потребления на 1 млрд. долл. объём валового национального продукта возрастёт на 0,47 млрд. долл.
Коэффициент b2=0,57 означает, что увеличение инвестиций на 1 млрд. долл. приведёт к увеличению объёма валового национального продукта на 0,57 млрд. долл.
Разобьём модель на 3 части (см. рис. 16). Найдём регрессию 1-ой и 3-ей части (результат на рис.17).
Рис. 16. Модель разбили на 3 части.
Рис.17 Регрессия для 1 и 3 частей модели.
Определим значимость модели по формуле:
F= |
∑ ei2 (1) |
∑ ei2 (2) |
На рисунке 17 видно, что для нахождения F необходимо разделить результат ячейки С11 на результат ячейки С29. Получим:
F= |
0,018 |
=0,429 |
0,042 |
Для того, чтобы узнать табличное значение , воспользуемся встроенной в EXCEL функцией FРАСПОБР с параметрами α=0,05. В данном случае К1=К2=n| -m=4-2=2 (см. рис. 18)
Рис.18. Аргументы функции.
Рис. 19 Расчет табличного F.
Статистика Fрасч.=0,429 меньше табличного значения Фишера F=FРАСПОБР(0,05;2;2)=19. Следовательно, в данной моделе отсутствует гетероскедастичность остатков.
Если прослеживается влияние результатов предыдущих наблюдений на результаты последующих, случайные величины (ошибки) ɛi в регрессионной модели не оказываются независимыми. Такие модели называются моделями с наличием автокорреляции.
Как правило, если автокорреляция
присутствует, то наибольшее влияние
на последующее наблюдение оказывает
результат предыдущего
dw= |
∑ (ɛi -ɛi-1) 2 |
∑ ɛi 2 |
Определим его с помощью редактора EXCEL. Результаты расчета представлены на рис. 20.
Рис. 20. Расчет автокорреляции.
Таким образом, мы нашли расчетное значение dw=1,84. Найдём табличное значение статистики Дарбина-Уотсона для m=2 и n=10. Согласно таблицы получим d1= 0,7 и d2=1,64.
Значение статистики Дарбина-Уотсона распределено в интервале от 0 до 4. Соответственно, идеальное значение статистики равно 2 (автокорреляция отсутствует). Если расчетное значение:
0<dw<d1, то присутствует положительная автокорреляция.
4-d1<dw<4, то присутствует отрицательная автокорреляция.
d2<dw<4-d2, то автокорреляция отсутствует.
d1<dw<d2 и 4-d2<dw<4-d1, то вопрос о наличии или отсутствии автокорреляции остается открытым (расчетное значение попадает в зону неопределённости).
Для нахождения автокорреляции разобьём числовую прямую, как показано на рис. 21.
Рис. 21. Области автокорреляции для d1= 0,7 и d2=1,64.
Наше расчетное значение dw=1,84 попадает в область, где автокорреляции нет.
Для проверки предположения об однородности исходных данных в регрессионном смысле применим тест Чоу.
В соответствии со схемой теста построим уравнение регрессии по первым n1=5 наблюдениям и остальным n2=5 наблюдениям. Результаты представлены на рис. 22.
Результаты регрессионного и дисперсионного анализа модели, построенной по всем n=n1 + n2=10 наблюдениям, представлены на рис.4.
Рис. 22. Уравнение регрессии по первым n1=5 наблюдениям и остальным n2=5 наблюдениям.
Рассчитаем статистику F по формуле:
Fрасч.= |
(ESS-ESS1-ESS2)/(2+1) |
= |
(1,158-0,023-0,070)/3 |
=15,43 |
(ESS1+ESS2)/(10-2*2-2) |
(0,023+0,070)/4 |
Находим табличное значение Fтабл.=FРАСПОБР (0,05;3;4) с помощью редактора EXCEL. Получаем Fтабл.=6,59.
Так как Fрасч.>Fтабл. (15,43>6,59), то можно сделать вывод, что использовать единую модель по всем наблюдениям нельзя, то есть объединить две выборки (по первым 5 и остальным 5 наблюдениям) в одну и рассматривать единую модель регрессии Y по X не целесообразно.
Итак, многочисленные наблюдения и исследования показывают, что в окружающем нас мире величины существуют не изолированно друг от друга, а напротив, они связаны определенным образом.
Не важно рассматриваем мы экономическую сферу деятельности или какую-либо другую, везде существуют факторы, оказывающие влияние на объект/итог какого-либо процесса. Для верной интерпретации этого явления была разработаны методы математической статистики.
Наиболее простым методом, используемым
в экономике для определения
зависимости переменных, является модель
линейной регрессии. Также она может
случить началом
Но построение модели лишь половина дела, необходимо быть уверенным, что она соответствует реальности. Для проводят анализ качества модели, состоящий из нескольких этапов.
Одним из способов проверки является проверка общего качества уравнения регрессии. Для проведения этой проверки используют коэффициент детерминации. Этот показатель используют как универсальную меру связи одной случайной величины от другой. После расчета коэффициента детерминации специалисты смотрят на его величину, она может варьироваться от нуля до единицы, чем ближе полученная цифра к единице, тем сильнее влияние факторов на изучаемую величину.
Однако стандартный
По итогам проведенных расчетов
мною была построена модель множественной
линейной регрессии и на ее основе
рассчитаны коэффициенты детерминации,
общий и скорректированный. Была
выявлена обратная зависимость между
количеством малоимущего