Автор работы: Пользователь скрыл имя, 01 Апреля 2013 в 22:35, курсовая работа
Оценивание точности прогноза (в частности, с помощью доверительных интервалов) — необходимая часть процедуры прогнозирования. Обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для него (на основе Центральной Предельной Теоремы теории вероятностей).
Введение 3
Отчет №1. Построение парной регрессии. 5
1.1. Исходные данные 5
1.2. Построение модели парной регрессии. 6
1.3. Исследование остатков. 6
1.3.1. Проверка на автокорреляцию остатков (зависимость остатков) 7
1.3.2. Проверка на нормальность 7
1.3.3. Проверка на гетероскедастичность 8
1.4. Исследование модели регрессии 8
1.4.1. Проверка на значимость коэффициентов модели 8
1.4.2. Проверка функциональной формы 8
2.1 Исходные данные для индекса РТС 9
2.2 Проверка стационарности исходного ряда 9
2.2.1 Визуальный анализ и построение трендов 9
2.2.2. Тестирование нестационарности 11
2.3. Стационарные преобразования. 11
2.3.1. Разностные преобразования. 11
2.3.2. Логарифмические темпы роста 13
2.4. Исходные данные для индекса Доу-Джонса 15
2.5. Проверка стационарности исходного ряда (индекса Доу-Джонса) 16
2.5.1. Визуальный анализ и построение трендов 16
2.5.2. Тестирование нестационарности 18
2.6. Стационарные преобразования. 19
2.6.1. Разностные преобразования. 19
2.6.2. Логарифмические темпы роста 21
Отчет 3. "Методы краткосрочного прогнозирования. Модели ARMA" 24
3.1. Исходные данные 24
3.2. Проверка стационарности ряда 25
3.3. Построение моделей ARMA (p,q) 25
3.4. Диагностика модели 25
3.4.1. Проверка стационарности 25
3.4.2. Проверка прогнозной точности 30
3.5. Прогнозирование 31
Заключение 34
Список используемой литературы 35
Федеральное агентство связи
Государственное образовательное учреждение
высшего профильного образования
«Сибирский государственный
Информатики»
Кафедра ММБП
Тема работы:
«Методы моделирования и прогнозирования динамики социально-экономических индикаторов
(реализация в IHSEconometricVi
По предмету «Методы Социально-экономического прогнозирования»
проверил: профессор Канев В.С
выполнил: студент
Софронов Д.В.
Новосибирск 2012
Оглавление
Методы прогнозирования —
Простейшие методы восстановления используемых для прогнозирования зависимостей исходят из заданного временного ряда, который при этом часто рассматривается в рамках той или иной вероятностной модели с введением дополнительных факторов. Основные решаемые прогнозированием задачи — интерполяция и экстраполяция.
Оценивание точности прогноза (в частности, с помощью доверительных интервалов) — необходимая часть процедуры прогнозирования. Обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для него (на основе Центральной Предельной Теоремы теории вероятностей).
Весьма важна проблема проверки адекватности модели, а также проблема отбора факторов. Априорный список факторов, оказывающих влияние на отклик, обычно весьма обширен, желательно его сократить, и крупное направление современных исследований посвящено методам отбора «информативного множества признаков». Однако эта проблема пока еще окончательно не решена.
Современные компьютерные технологии прогнозирования основаны на интерактивных статистических методах прогнозирования с использованием баз эконометрических данных, имитационных и экономико-математических динамических моделей, сочетающих экспертные, математико-статистические и моделирующие блоки.
В данной работе рассматривается примеры
реализации ряда статистических методов
моделирования и
Рассматривается динамика индексов Доу-Джонса и РТС за период с 30 сентября 2003 года по 28 сентября 2010 года (периодичность наблюдений – 1 неделя, всего 360 наблюдений в каждой из выборок). Выборки сформированы по закрытию свечей. Динамика значений исходных рядов приведена на рис. 1.1. и 1.2.
Рис. 1.1. Динамика индекса Доу-Джонса, 30.09.2003 – 28.09.2010г., периодичность – 1 неделя.
Построим модель парной регрессии, где в качестве экзогенной переменной возьмем индекс Доу-Джонса (dj), а в качестве эндогенной переменной – индекс РТС (rtsi) соответственно. И оценим ее (табл. 1.1), используя метод наименьших квадратов.
Таблица 1.1. Результаты оценки модели МНК
Coefficient |
Std. Error |
t-Statistic |
Prob. | |
C(2) |
0.303229 |
0.012829 |
23.63527 |
0.0000 |
C(1) |
-2017.713 |
140.1838 |
-14.39334 |
0.0000 |
R-squared |
0.609437 |
Mean dependent var |
1266.500 | |
Adjusted R-squared |
0.608346 |
S.D. dependent var |
561.7520 | |
S.E. of regression |
351.5570 |
Akaike info criterion |
14.56816 | |
Sum squared resid |
44246051 |
Schwarz criterion |
14.58975 | |
Log likelihood |
-2620.269 |
Hannan-Quinn criter. |
14.57675 | |
F-statistic |
558.6262 |
Durbin-Watson stat |
0.044478 | |
Prob(F-statistic) |
0.000000 |
|||
Теперь, используя полученные результаты,
оценим существенность данного уравнения
регрессии и ее параметров.
Оценка значимости коэффициента с(1) осуществляется с помощью критерия Стьюдента. Нулевая гипотеза состоит в том, что коэффициент с(1) равен нулю, то есть фактор rtsi не влияет на значение dj. Гипотеза отвергается, так как вероятность ошибки первого рода составляет менее 5% . Значит, коэффициент с(1) значим.
Оценить значимости уравнения регрессии в целом можно с помощью F-статистики. Выдвигается нулевая гипотеза об отсутствии статистической зависимости между эндогенной и экзогенной переменными и о равенстве нулю всех коэффициентов регрессии. В данном случае нулевая гипотеза отвергается, так как вероятность ошибки первого рода составляет менее 5% . Значит, статистическая зависимость между rtsi и dj существенна и параметры регрессии значимы.
Остатки – это разность между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными значениями. Исследуя остатки, мы можем оценить степень адекватности модели опытным данным. Проверить, выполняются ли предпосылки того, что полученные оценки являются несмещенными, состоятельными и эффективными.
Для проверки автокорреляции воспользуемся Q-статистикой (табл. 1.2.).
Таблица 1.2.Проверка автокорреляции ошибок
Выдвигается нулевая гипотеза об отсутствии автокорреляции. Гипотеза отвергается, потому что вероятность ошибки первого рода меньше 5%. Следовательно, автокорреляция существенна. Автокорреляция приводит к следующим последствиям: оценки параметров не являются эффективными; дисперсии оценок являются смещенными; выводы, сделанные по результатам t- и F- статистикам, возможно неверны.
Для проверки нормальности распределения остатков воспользуемся статистикой Жарка – Беры (рисунок 1.3.). Нулевая гипотеза заключается в том, что распределение остатков не отличается от нормального. В данном случае гипотеза отвергается, так как вероятность ошибки первого рода меньше установленного уровня в 5%.
Рис. 1.3. Тест Жарка-Беры
Для обнаружения гетероскедастичности воспользуемся тестом Бройша-Пагана-Годфри (табл. 1.3). Нулевая гипотеза о наличии гомоскедастичности отвергается, так как вероятность ошибки первого рода меньше 0,05. Наличие гетероскедастичности приводит к уменьшению эффективности оценок параметров регрессии.
Таблица 1.3. Тест Бройша-Пагана-Годфри
Heteroskedasticity Test: Breusch-Pagan-Godfrey | ||||
F-statistic |
16.03895 |
Prob. F(1,358) |
0.0001 | |
Obs*R-squared |
15.43695 |
Prob. Chi-Square(1) |
0.0001 | |
Scaled explained SS |
7.841880 |
Prob. Chi-Square(1) |
0.0051 | |
Воспользуемся тестом Чоу для проверки значимости коэффициентов. Нулевая гипотеза о значимости коэффициентов отвергается, так как вероятность ошибки первого рода меньше 5%.
Таблица 1.4. Тест Чоу
Chow Breakpoint Test: 180 |
||||
Null Hypothesis: No breaks at specified breakpoints | ||||
Equation Sample: 1 360 |
||||
F-statistic |
336.5245 |
Prob. F(2,356) |
0.0000 | |
Log likelihood ratio |
382.1255 |
Prob. Chi-Square(2) |
0.0000 | |
Wald Statistic |
673.0490 |
Prob. Chi-Square(2) |
0.0000 | |
Воспользуемся тестом Рамсея для проверки функциональной формы уравнения (табл. 1.5.). Нулевая гипотеза о незначимости коэффициентов регрессии отклоняется, так как вероятность ошибки первого рода меньше 0,05.
Таблица 1.5. Тест Рамсея
Value |
df |
Probability |
||
F-statistic |
36.83333 |
(3, 355) |
0.0000 |
|
Likelihood ratio |
97.55794 |
3 |
0.0000 |
|
Отчет №2. Проверка стационарности. Стационарные преобразования.
Рассматривается динамика индекса РТС за период с 30 сентября 2003 по 28 сентября 2011 года (периодичность наблюдений — 1 неделя; всего 360 наблюдений в выборке). Выборка сформирована по закрытию свечей. Динамика значений исходного ряда приведена на рис. 2.1.
Рис. 2.1. Динамика индекса РТС, 30.09.2003 – 28.09.2010г., периодичность – 1 неделя.
Из рисунка 2.1. видно, что динамика рассматриваемых показателей неравномерна, что говорит о возможной нестационарности индекса РТС в среднем.
В таблице 2.1. приведены результаты оценивания МНК уравнений линейного и квадратичного трендов для рассматриваемого показателя.
Из таблицы 2.1. видно, что в уравнениях тренда значимы (по t-критерию) коэффициенты при трендовых компонентах; при этом уравнение линейного тренда показывает, что в среднем за весь период тенденция в динамике показателя восходящая, а уравнение с квадратичным трендом показывает, что характер тенденции менялся во времени. Это также видно на графиках расчетных и фактических значений, приведенных на рис. 2.2.(а, б).
Также наличие тренда можно видеть по характеру автокорреляционной функции (табл. 2.2.). Медленное убывание значений АКФ с увеличением лага характерно для временных рядов с тенденцией в среднем; о значимости коэффициентов автокорреляции можно судить по Q-статистикам — нулевая гипотеза о равенстве АКФ нулю отвергается для всех приведенных в таблице лагов.
Таблица 2.1. Результаты оценки уравнений с (а) линейным и (б) квадратичным трендом
(а) RTSI= C(1)+C(2)* @TREND |
||||
Coefficient |
Std. Error |
t-Statistic |
Prob. | |
C(1) |
834.1928 |
52.95702 |
15.75226 |
0.0000 |
C(2) |
2.408396 |
0.255322 |
9.432796 |
0.0000 |
(б) RTSI = C(1) + C(2)*@TREND + C(3)*@TREND^2 |
||||
Coefficient |
Std. Error |
t-Statistic |
Prob. | |
C(1) |
176.5956 |
63.96458 |
2.760834 |
0.0061 |
C(2) |
13.42958 |
0.823096 |
16.31594 |
0.0000 |
C(3) |
-0.030700 |
0.002220 |
-13.83144 |
0.0000 |