Построенние моделей экспоненциального сглаживания

Автор работы: Пользователь скрыл имя, 17 Июня 2014 в 17:41, лабораторная работа

Краткое описание

Основной задачей данного отчета является построение моделей с экспоненциальным сглаживанием временных рядов, а также моделей АРПСС по имеющимся данным. Для построения нормальной модели требуется как минимум 50 наблюдений, в файле исходных данных, т.к. уже для меньшего количества нет смысла подбирать модель.

Вложенные файлы: 1 файл

Готовый отчет.doc

— 4.37 Мб (Скачать файл)

 

 

Введение

Основной задачей данного отчета является построение моделей с экспоненциальным сглаживанием временных рядов, а также моделей АРПСС по имеющимся данным. Для построения нормальной модели требуется как минимум 50 наблюдений, в файле исходных данных, т.к. уже для меньшего количества нет смысла подбирать модель.

 Экспоненциальное сглаживание очень популярный метод прогнозирования очень многих временных рядов. Исторически метод был независимо открыт Броуном и Холтом. Броун служил на флоте США во время второй мировой войны, где занимался обнаружением подводных лодок и системами наведения. Позже он применил открытый им метод для прогнозирования спроса на запасные части. Свои идеи он описал в книге, вышедшей в свет в 1959 году. Исследования Холта были поддержаны Департаментом военно-морского флота США. Независимо друг от друга, Броун и Холт открыли экспоненциальное сглаживание для процессов с постоянным трендом, с линейным трендом и для рядов с сезонной составляющей.

Процедуры оценки параметров и прогнозирования предполагают, что математическая модель процесса известна. В реальных данных часто нет отчетливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, тогда как нужно не только выделить регулярные компоненты, но также построить прогноз. Методология АРПСС позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость. Однако из-за мощности и гибкости, АРПСС - сложный метод.

Результатом данного проекта будет получение прогноза и выбор по различным параметрам наиболее адекватной модели.

 

  1. Сезонное и несезонное экспоненциальное сглаживание

Ниже представлены недельные данные начисленной премии по ОСАГО компании ООО «Росгосстрах».

Начисленная премия,  ОСАГО, тыс. руб.

Начисленная премия,  ОСАГО, тыс. руб.

Начисленная премия,  ОСАГО, тыс. руб.

1

101,28

18

105,41

35

92,53

2

104,54

19

90,07

36

96,21

3

96,23

20

93,01

37

98,91

4

95,68

21

104,96

38

95,31

5

104,22

22

98,09

39

102,35

6

94,20

23

100,06

40

103,31

7

102,05

24

99,85

41

96,30

8

101,58

25

97,12

42

97,22

9

99,83

26

99,09

43

89,19

10

106,13

27

85,62

44

97,49

11

94,78

28

93,07

45

100,85

12

100,10

29

100,14

46

95,89

13

103,37

30

93,94

47

103,34

14

96,56

31

98,95

48

99,14

15

100,56

32

98,34

49

102,10

16

105,01

33

102,04

50

107,84

17

96,25

34

101,83

51

99,57


В результате прогнозирования данного временного ряда необходимо построить несколько моделей экспоненциального сглаживания и затем выбрать самую адекватную. Для начала построим график исходных данных, по которому можно сделать вывод о наличии тренда и сезонности. И затем построить частную автокорреляционную функцию на основе, которой можно судить о цикличности временного ряда.

По графику исходных данных видно, что ряд гетероскедастичен, т.е. неоднородный, дисперсия вариативна и изменяется от наблюдения к наблюдению. Как таковой очевидной линейной тенденции нет. Дальше рассмотрим ЧАКФ. Из её графика видно, что есть небольшая цикличность, которая показывает, насколько статистически зависимы значения временного ряда при различных сдвигах времени, то есть с разницей в неделю.

Теперь можно предположить модели, с каким трендом и сезонной компонентой могут подойти для прогнозирования исходного временного ряда.

    1. Модель с экспоненциальным трендом без сезонной компоненты

Выбирая параметры по сетке нужно руководствоваться следующими утверждениями: если значение Альфа равно 1, то предыдущие наблюдения полностью игнорируются. Если равно 0, то игнорируются текущие наблюдения. Значения между 0, 1 дают промежуточные результаты. Для выбора оптимальных значений альфа и гамма осуществляем поиск параметров на сетке, выбирая модель с наименьшими показателями.

 

Альфа

Гамма

Средняя

Ср. абс.

Сумма

Средние

Средн. %

Ср. абс.

21

0,300000

0,300000

-0,587609

4,356295

1615,838

31,68310

-0,80956

4,477916

23

0,300000

0,500000

-0,345454

4,517785

1682,053

32,98143

-0,57057

4,637699


Исходя из сетки, выбираем параметры Альфа 0,3 и Гамма 0,3. Прогноз для модели выглядит следующим образом:

Сглаженные

Сглаженные

52

103,8117

57

108,568

53

104,746

58

109,5451

54

105,6887

59

110,531

55

106,6399

60

111,5258

56

107,5997

61

112,5295


Из таблицы прогнозов можно сделать вывод о том,  что начисленная премия по ОСАГО в следующие 12 недель будет расти. Далее представлена таблица со значениями ошибок по модели с экспоненциальным трендом без сезонной компоненты.

 

Ошибка

Средн. ош.

-0,58760853607

Ср. абсол. ошибка

4,35629486341

Суммы квадратов

1615,83820129948

Ср. квадрат

31,68310198626

Средн. относ. ошибка

-0,80956299406

Ср. абс. отн. ошибка

4,47791641425


Как видно из графика, сглаженный ряд не совсем точно описывает исходный временной ряд и также имеется небольшой сдвиг, возможно для устранения его можно взять лаг большего порядка.

Теперь необходимо проверить построенную модель на адекватность. Для этого строим гистограмму распределения остатков экспоненциального сглаживания.

По гистограмме можно сказать о том, что распределение остатков не очень похоже на нормальное, но, только основываясь на гистограмму невозможно сделать вывод о том, что модель адекватна или не адекватна. Следующим этапом строим нормальные вероятностные графики остатков.

Эти графики позволяют визуально исследовать, насколько распределение данных близко к нормальному. Наблюдаемые значения должны быть распределены нормально, т.е. все значения на графике должны попасть на прямую линию. Если значения не являются нормально распределенными, то будет наблюдаться отклонение от прямой, как в данном случае. На этом графике можно визуально обнаружить выбросы. АКФ показывает то, являются ли остатки белым шумом, т.е. остатки не должны выходить за границы доверительных интервалов, либо выходить не значительно.

По данному графику видно, что остатки экспоненциального сглаживания не являются белым шумом, т.к. на трёх лагах они выходят за границы доверительного интервала.

    1. Модель с мультипликативной сезонностью и экспоненциальным трендом

В этой модели Анализа временных рядов простое экспоненциальное сглаживание применяется для обеих компонент: экспоненциального тренда сглаживается с параметром g (гамма) и мультипликативной сезонной компоненты сглаживается с параметром d (дельта).

Для вычисления сглаженных значений в первом сезоне необходимы начальные значения сезонных компонент. Выполняем поиск параметров по сетке.

 

Альфа

Дельта

Гамма

Средняя ошибка

Ср. абс. ошибка

Сумма

Средние

Средн. %

Ср. абс.

244

0,4

0,1

0,1

0,207

2,355

408,077

8,002

0,159

2,385

163

0,3

0,1

0,1

0,223

2,302

409,183

8,023

0,173

2,334

406

0,6

0,1

0,1

0,169

2,469

425,734

8,348

0,125

2,497


Выбираем модель под номером 244, т.к. при ней средняя абсолютная ошибка, сумма квадратов и средние квадратов минимальны. Строим модель мультипликативной сезонности с экспоненциальным трендом с параметрами Альфа= ,400 Дельт=,100 Гамма=,100, прогноз на 10 наблюдений представлен в следующей таблице:

Сглаженные

Сглаженные

52

102,7125

57

107,958

53

109,4966

58

113,2154

54

103,2263

59

101,2637

55

109,7911

60

107,6872

56

110,3349

61

114,7998


Ниже представлена таблица с результатами по ошибкам для выбранной по сетке модели и параметрам ей соответствующим.

Показатели

Ошибка

Средняя ошибка

0,144272386546

Средняя абсолютная ошибка

2,630963427364

Суммы квадратов

472,044481550792

Средний квадрат

9,255774148055

Средняя относительна ошибка

0,103390551679

Ср. абс. отн. ошибка

2,657775099370


Ряд, построенный по выбранным параметрам, достаточно точно сглаживает исходные данные, но ближе к последним значениям виден небольшой сдвиг.

Исходя из гистограммы остатков, можно предположить, что их распределение близко к нормальному, но для того чтобы удостовериться, что модель адекватна необходимо также построить нормальный вероятностный график и проанализировать автокорреляционную функцию.

Если в нормальном вероятностном графике наблюдаемые значения распределены нормально, то все значения на графике должны попасть на прямую линию. Если значения близки к нормальному распределению, то будет наблюдаться отклонение от прямой. На этом графике можно визуально обнаружить выбросы.

Из АКФ видно, что на 11 лаге стандартные ошибки не значительно выходят за границы доверительного интервала, но так как в природе не существует как такого чистого белого шума, можем предположить, что модель адекватна.

Необходимо отметить, что данная модель очень хорошо сглаживает исходный ряд,  прогнозы выглядят довольно правдоподобно, к тому же распределение остатков близко к белому шума. Следовательно, логично считать

    1. Модель с экспоненциальным трендом и аддитивной сезонной компонентой

Аналогично предыдущим моделям выполняем поиск параметров по сете с лагом 8. В целях краткого изложения в таблице отображены только модели с минимальными значениями параметров.

 

Альфа

Дельта

Гамма

Средняя ошибка

Ср. абс. ошибка

Сумма квадрат.

Средние квадраты

Средн. % ошибка

Ср. абс. % ошиб.

244

0,4

0,1

0,1

0,206767

2,355239

408,0772

8,001513

0,159087

2,385331

163

0,3

0,1

0,1

0,223344

2,302095

409,1832

8,023201

0,173128

2,333785

406

0,6

0,1

0,1

0,168664

2,468510

425,7343

8,347732

0,125236

2,497251

Информация о работе Построенние моделей экспоненциального сглаживания