Автор работы: Пользователь скрыл имя, 17 Июня 2014 в 17:41, лабораторная работа
Основной задачей данного отчета является построение моделей с экспоненциальным сглаживанием временных рядов, а также моделей АРПСС по имеющимся данным. Для построения нормальной модели требуется как минимум 50 наблюдений, в файле исходных данных, т.к. уже для меньшего количества нет смысла подбирать модель.
Введение
Основной задачей данного отчета является построение моделей с экспоненциальным сглаживанием временных рядов, а также моделей АРПСС по имеющимся данным. Для построения нормальной модели требуется как минимум 50 наблюдений, в файле исходных данных, т.к. уже для меньшего количества нет смысла подбирать модель.
Экспоненциальное сглаживание очень популярный метод прогнозирования очень многих временных рядов. Исторически метод был независимо открыт Броуном и Холтом. Броун служил на флоте США во время второй мировой войны, где занимался обнаружением подводных лодок и системами наведения. Позже он применил открытый им метод для прогнозирования спроса на запасные части. Свои идеи он описал в книге, вышедшей в свет в 1959 году. Исследования Холта были поддержаны Департаментом военно-морского флота США. Независимо друг от друга, Броун и Холт открыли экспоненциальное сглаживание для процессов с постоянным трендом, с линейным трендом и для рядов с сезонной составляющей.
Процедуры оценки параметров и прогнозирования предполагают, что математическая модель процесса известна. В реальных данных часто нет отчетливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, тогда как нужно не только выделить регулярные компоненты, но также построить прогноз. Методология АРПСС позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость. Однако из-за мощности и гибкости, АРПСС - сложный метод.
Результатом данного проекта будет получение прогноза и выбор по различным параметрам наиболее адекватной модели.
Ниже представлены недельные данные начисленной премии по ОСАГО компании ООО «Росгосстрах».
№ |
Начисленная премия, ОСАГО, тыс. руб. |
№ |
Начисленная премия, ОСАГО, тыс. руб. |
№ |
Начисленная премия, ОСАГО, тыс. руб. |
1 |
101,28 |
18 |
105,41 |
35 |
92,53 |
2 |
104,54 |
19 |
90,07 |
36 |
96,21 |
3 |
96,23 |
20 |
93,01 |
37 |
98,91 |
4 |
95,68 |
21 |
104,96 |
38 |
95,31 |
5 |
104,22 |
22 |
98,09 |
39 |
102,35 |
6 |
94,20 |
23 |
100,06 |
40 |
103,31 |
7 |
102,05 |
24 |
99,85 |
41 |
96,30 |
8 |
101,58 |
25 |
97,12 |
42 |
97,22 |
9 |
99,83 |
26 |
99,09 |
43 |
89,19 |
10 |
106,13 |
27 |
85,62 |
44 |
97,49 |
11 |
94,78 |
28 |
93,07 |
45 |
100,85 |
12 |
100,10 |
29 |
100,14 |
46 |
95,89 |
13 |
103,37 |
30 |
93,94 |
47 |
103,34 |
14 |
96,56 |
31 |
98,95 |
48 |
99,14 |
15 |
100,56 |
32 |
98,34 |
49 |
102,10 |
16 |
105,01 |
33 |
102,04 |
50 |
107,84 |
17 |
96,25 |
34 |
101,83 |
51 |
99,57 |
В результате прогнозирования данного временного ряда необходимо построить несколько моделей экспоненциального сглаживания и затем выбрать самую адекватную. Для начала построим график исходных данных, по которому можно сделать вывод о наличии тренда и сезонности. И затем построить частную автокорреляционную функцию на основе, которой можно судить о цикличности временного ряда.
По графику исходных данных видно, что ряд гетероскедастичен, т.е. неоднородный, дисперсия вариативна и изменяется от наблюдения к наблюдению. Как таковой очевидной линейной тенденции нет. Дальше рассмотрим ЧАКФ. Из её графика видно, что есть небольшая цикличность, которая показывает, насколько статистически зависимы значения временного ряда при различных сдвигах времени, то есть с разницей в неделю.
Теперь можно предположить модели, с каким трендом и сезонной компонентой могут подойти для прогнозирования исходного временного ряда.
Выбирая параметры по сетке нужно руководствоваться следующими утверждениями: если значение Альфа равно 1, то предыдущие наблюдения полностью игнорируются. Если равно 0, то игнорируются текущие наблюдения. Значения между 0, 1 дают промежуточные результаты. Для выбора оптимальных значений альфа и гамма осуществляем поиск параметров на сетке, выбирая модель с наименьшими показателями.
Альфа |
Гамма |
Средняя |
Ср. абс. |
Сумма |
Средние |
Средн. % |
Ср. абс. | |
21 |
0,300000 |
0,300000 |
-0,587609 |
4,356295 |
1615,838 |
31,68310 |
-0,80956 |
4,477916 |
23 |
0,300000 |
0,500000 |
-0,345454 |
4,517785 |
1682,053 |
32,98143 |
-0,57057 |
4,637699 |
Исходя из сетки, выбираем параметры Альфа 0,3 и Гамма 0,3. Прогноз для модели выглядит следующим образом:
№ |
Сглаженные |
№ |
Сглаженные |
52 |
103,8117 |
57 |
108,568 |
53 |
104,746 |
58 |
109,5451 |
54 |
105,6887 |
59 |
110,531 |
55 |
106,6399 |
60 |
111,5258 |
56 |
107,5997 |
61 |
112,5295 |
Из таблицы прогнозов можно сделать вывод о том, что начисленная премия по ОСАГО в следующие 12 недель будет расти. Далее представлена таблица со значениями ошибок по модели с экспоненциальным трендом без сезонной компоненты.
Ошибка | |
Средн. ош. |
-0,58760853607 |
Ср. абсол. ошибка |
4,35629486341 |
Суммы квадратов |
1615,83820129948 |
Ср. квадрат |
31,68310198626 |
Средн. относ. ошибка |
-0,80956299406 |
Ср. абс. отн. ошибка |
4,47791641425 |
Как видно из графика, сглаженный ряд не совсем точно описывает исходный временной ряд и также имеется небольшой сдвиг, возможно для устранения его можно взять лаг большего порядка.
Теперь необходимо проверить построенную модель на адекватность. Для этого строим гистограмму распределения остатков экспоненциального сглаживания.
По гистограмме можно сказать о том, что распределение остатков не очень похоже на нормальное, но, только основываясь на гистограмму невозможно сделать вывод о том, что модель адекватна или не адекватна. Следующим этапом строим нормальные вероятностные графики остатков.
Эти графики позволяют визуально исследовать, насколько распределение данных близко к нормальному. Наблюдаемые значения должны быть распределены нормально, т.е. все значения на графике должны попасть на прямую линию. Если значения не являются нормально распределенными, то будет наблюдаться отклонение от прямой, как в данном случае. На этом графике можно визуально обнаружить выбросы. АКФ показывает то, являются ли остатки белым шумом, т.е. остатки не должны выходить за границы доверительных интервалов, либо выходить не значительно.
По данному графику видно, что остатки экспоненциального сглаживания не являются белым шумом, т.к. на трёх лагах они выходят за границы доверительного интервала.
В этой модели Анализа временных рядов простое экспоненциальное сглаживание применяется для обеих компонент: экспоненциального тренда сглаживается с параметром g (гамма) и мультипликативной сезонной компоненты сглаживается с параметром d (дельта).
Для вычисления сглаженных значений в первом сезоне необходимы начальные значения сезонных компонент. Выполняем поиск параметров по сетке.
Альфа |
Дельта |
Гамма |
Средняя ошибка |
Ср. абс. ошибка |
Сумма |
Средние |
Средн. % |
Ср. абс. | |
244 |
0,4 |
0,1 |
0,1 |
0,207 |
2,355 |
408,077 |
8,002 |
0,159 |
2,385 |
163 |
0,3 |
0,1 |
0,1 |
0,223 |
2,302 |
409,183 |
8,023 |
0,173 |
2,334 |
406 |
0,6 |
0,1 |
0,1 |
0,169 |
2,469 |
425,734 |
8,348 |
0,125 |
2,497 |
Выбираем модель под номером 244, т.к. при ней средняя абсолютная ошибка, сумма квадратов и средние квадратов минимальны. Строим модель мультипликативной сезонности с экспоненциальным трендом с параметрами Альфа= ,400 Дельт=,100 Гамма=,100, прогноз на 10 наблюдений представлен в следующей таблице:
№ |
Сглаженные |
№ |
Сглаженные |
52 |
102,7125 |
57 |
107,958 |
53 |
109,4966 |
58 |
113,2154 |
54 |
103,2263 |
59 |
101,2637 |
55 |
109,7911 |
60 |
107,6872 |
56 |
110,3349 |
61 |
114,7998 |
Ниже представлена таблица с результатами по ошибкам для выбранной по сетке модели и параметрам ей соответствующим.
Показатели |
Ошибка |
Средняя ошибка |
0,144272386546 |
Средняя абсолютная ошибка |
2,630963427364 |
Суммы квадратов |
472,044481550792 |
Средний квадрат |
9,255774148055 |
Средняя относительна ошибка |
0,103390551679 |
Ср. абс. отн. ошибка |
2,657775099370 |
Ряд, построенный по выбранным параметрам, достаточно точно сглаживает исходные данные, но ближе к последним значениям виден небольшой сдвиг.
Исходя из гистограммы остатков, можно предположить, что их распределение близко к нормальному, но для того чтобы удостовериться, что модель адекватна необходимо также построить нормальный вероятностный график и проанализировать автокорреляционную функцию.
Если в нормальном вероятностном графике наблюдаемые значения распределены нормально, то все значения на графике должны попасть на прямую линию. Если значения близки к нормальному распределению, то будет наблюдаться отклонение от прямой. На этом графике можно визуально обнаружить выбросы.
Из АКФ видно, что на 11 лаге стандартные ошибки не значительно выходят за границы доверительного интервала, но так как в природе не существует как такого чистого белого шума, можем предположить, что модель адекватна.
Необходимо отметить, что данная модель очень хорошо сглаживает исходный ряд, прогнозы выглядят довольно правдоподобно, к тому же распределение остатков близко к белому шума. Следовательно, логично считать
Аналогично предыдущим моделям выполняем поиск параметров по сете с лагом 8. В целях краткого изложения в таблице отображены только модели с минимальными значениями параметров.
Альфа |
Дельта |
Гамма |
Средняя ошибка |
Ср. абс. ошибка |
Сумма квадрат. |
Средние квадраты |
Средн. % ошибка |
Ср. абс. % ошиб. | |
244 |
0,4 |
0,1 |
0,1 |
0,206767 |
2,355239 |
408,0772 |
8,001513 |
0,159087 |
2,385331 |
163 |
0,3 |
0,1 |
0,1 |
0,223344 |
2,302095 |
409,1832 |
8,023201 |
0,173128 |
2,333785 |
406 |
0,6 |
0,1 |
0,1 |
0,168664 |
2,468510 |
425,7343 |
8,347732 |
0,125236 |
2,497251 |
Информация о работе Построенние моделей экспоненциального сглаживания