Автор работы: Пользователь скрыл имя, 17 Июня 2014 в 17:41, лабораторная работа
Основной задачей данного отчета является построение моделей с экспоненциальным сглаживанием временных рядов, а также моделей АРПСС по имеющимся данным. Для построения нормальной модели требуется как минимум 50 наблюдений, в файле исходных данных, т.к. уже для меньшего количества нет смысла подбирать модель.
По результатам выбираем модель под номером 406, прогноз по ней представлен в следующей таблице:
№ |
Сглаженные |
№ |
Сглаженные |
52 |
103,9690 |
57 |
110,3469 |
53 |
110,6824 |
58 |
114,7604 |
54 |
105,0714 |
59 |
104,2118 |
55 |
111,3144 |
60 |
110,0915 |
56 |
111,9644 |
61 |
116,8479 |
Проверяем адекватность. Распределение остатков, исходя из гистограммы, приближенно к нормальному.
На АКФ видно, что остатки экспоненциального сглаживания близки к белому шуму, лишь на 11 лаге они выходят за доверительный интервал. Отсюда можно предположить, что выбранная модель адекватна.
Выполняем поиск по сетке. Эмпирические исследования показали, что весьма часто простое экспоненциальное сглаживание дает достаточно точный прогноз.
Альфа |
Дельта |
Фи |
Средняя |
Ср. абс. |
Сумма |
Средние |
Средн. % |
Ср. абс. | |
1 |
0,1 |
0,1 |
0,1 |
0,171 |
3,824 |
1087,120 |
21,316 |
-0,021 |
3,897 |
10 |
0,1 |
0,2 |
0,1 |
0,170 |
3,979 |
1175,112 |
23,041 |
-0,027 |
4,055 |
Прогноз для данной модели выглядит следующим образом:
№ |
Сглажен. |
№ |
Сглажен. |
52 |
101,1239 |
57 |
103,0498 |
53 |
103,0496 |
58 |
101,9818 |
54 |
101,9818 |
59 |
98,9806 |
55 |
98,9806 |
60 |
101,1258 |
56 |
101,1258 |
61 |
103,0498 |
Ниже представлен график сглаженного ряда, из которого видно, что сглаженный ряд построен со сдвигом, из-за этого возможны отклонения в прогнозах.
По гистограмме, которая отображена ниже, видно, что распределение остатков экспоненциального сглаживания очень близко к нормальному.
По нормально вероятностному графику можно сделать вывод о нормальности распределения остатков. Но, исходя из показаний АКФ, остатки далеки от белого шума. Следовательно, делаем вывод о неадекватности модели.
В этой модели Анализа временных рядов прогнозы простого экспоненциального сглаживания улучшаются демпфированным трендом, т.е. сглаживается независимо с параметром (фи); эта модель является расширением однопараметрической линейной модели Брауна и мультипликативной сезонной компонентой. Но, несмотря на достаточно хорошие показатели на гистограмме и на нормальном вероятностном графике, остатки экспоненциального сглаживания этой модели не являются белым шумом.
Методология построения ARIMA-модели для исследуемого временного ряда состоит из этапов идентификации пробной модели; оценивание параметров модели и диагностическую проверку адекватности модели; использование модели для прогнозирования.
В данном разделе будут рассматриваться недельные данные кросс-продаж мороженного компании «ИнМарко» в Приморском крае за 6 последовательных лет, которые показаны в таблице 1. Для данного временного ряда необходимо построить модель ARIMA и спрогнозировать по ней данные.
Таблица 1 – Кросс-продажи мороженного компании «ИнМарко» за 6 лет
Неделя |
Кол-во |
Неделя |
Кол-во |
Неделя |
Кол-во |
Неделя |
Кол-во |
Неделя |
Кол-во |
Неделя |
Кол-во |
1 |
263,2 |
13 |
270,3 |
25 |
340,8 |
37 |
401,9 |
49 |
460,6 |
61 |
479,4 |
2 |
277,3 |
14 |
296,1 |
26 |
352,5 |
38 |
423,0 |
50 |
460,6 |
62 |
441,8 |
3 |
310,2 |
15 |
331,4 |
27 |
418,3 |
39 |
453,6 |
51 |
554,6 |
63 |
552,3 |
4 |
303,2 |
16 |
317,3 |
28 |
383,1 |
40 |
425,4 |
52 |
552,3 |
64 |
533,5 |
5 |
284,4 |
17 |
293,8 |
29 |
404,2 |
41 |
430,1 |
53 |
538,2 |
65 |
549,9 |
6 |
317,3 |
18 |
350,2 |
30 |
418,3 |
42 |
512,3 |
54 |
571,1 |
66 |
620,4 |
7 |
347,8 |
19 |
399,5 |
31 |
467,7 |
43 |
540,5 |
55 |
620,4 |
67 |
709,7 |
8 |
347,8 |
20 |
399,5 |
32 |
467,7 |
44 |
568,7 |
56 |
639,2 |
68 |
688,6 |
9 |
319,6 |
21 |
371,3 |
33 |
432,4 |
45 |
491,2 |
57 |
557,0 |
69 |
608,7 |
10 |
279,7 |
22 |
312,6 |
34 |
380,7 |
46 |
448,9 |
58 |
495,9 |
70 |
538,2 |
11 |
244,4 |
23 |
267,9 |
35 |
343,1 |
47 |
404,2 |
59 |
423,0 |
71 |
477,1 |
12 |
277,3 |
24 |
329,0 |
36 |
390,1 |
48 |
455,9 |
60 |
472,4 |
72 |
538,2 |
Строим гистограмму и график переменной для определения вида распределения.
Из графика видно, что ряд имеет отчетливо возрастающий тренд, а также сезонную составляющую. Что и так очевидно, так как спрос на мороженное определенно имеет зависимость от различных факторов, чаще всего времени года (зима, лето, весна, осень). Имеет место предположение, исходя из графика о том, что временной ряд гетероскедастичен и не стационарен.
По гистограмме можно сделать вывод, что распределение переменной близко к нормальному.
Тренд и сезонная составляющая ряда выглядят очень отчетливо. Возьмем подходящие разности ряда и рассмотрим соответствующие автокорреляционные и частные автокорреляционные функции. Также видно, что амплитуда колебаний ряда увеличивается в зависимости от сезона, которая может сместить оценки автокорреляции. Прологарифмируем ряд.
Вот так выглядит график преобразованной переменной. Из графика видно, что цель преобразования достигнута, колебания стали более стабильными и теперь можно строить ARIMA-модель.
Если в соответствие со статистикой оценок АКФ ряд является нестационарным, то для перехода к стационарному ряду традиционно применяют оператор взятия последовательных разностей.
Далее строим, а затем проводим анализ автокорреляционной функции (АКФ). Быстрое затухание значений АКФ – тест на стационарность.
График показывает сильную периодическую зависимость, автокорреляции на лагах 1, 12 имеют максимальные значения. Ниже приведена таблица данных автокорреляционной функции моей переменной. Автокорреляция в лагах 1 и 2 имеет максимальные значения.
Авто- |
Ст. ошиб. |
Бокса- |
p | |
1 |
0,895275 |
0,115438 |
60,1476 |
0,000000 |
2 |
0,781754 |
0,114622 |
106,6640 |
0,000000 |
3 |
0,695529 |
0,113800 |
144,0188 |
0,000000 |
4 |
0,623325 |
0,112972 |
174,4615 |
0,000000 |
5 |
0,579124 |
0,112139 |
201,1321 |
0,000000 |
6 |
0,544986 |
0,111299 |
225,1089 |
0,000000 |
7 |
0,509680 |
0,110452 |
246,4023 |
0,000000 |
8 |
0,491473 |
0,109599 |
266,5110 |
0,000000 |
9 |
0,514136 |
0,108740 |
288,8663 |
0,000000 |
10 |
0,533884 |
0,107873 |
313,3607 |
0,000000 |
11 |
0,571248 |
0,107000 |
341,8632 |
0,000000 |
12 |
0,592340 |
0,106119 |
373,0203 |
0,000000 |
13 |
0,502739 |
0,105231 |
395,8445 |
0,000000 |
14 |
0,404151 |
0,104335 |
410,8491 |
0,000000 |
15 |
0,333677 |
0,103432 |
421,2565 |
0,000000 |
В соответствие с оценкой АКФ, ряд является нестационарным и для перехода к стационарному ряду необходимо применить оператор взятия последовательных разностей с лагом 1. График преобразованной переменной примет следующий вид.
Снова строим автокорреляционную функцию.
После взятия разности из прологарифмированного ряда исчезла корреляция не только на лаге 1, но также на большинстве других лагов. Из-за того что мы удалили зависимость более меньшую на больших лагах зависимость лишь увеличилась. Итак, используем разность для преобразования ряда в стационарный еще раз. Только теперь берем лаг равный 12. Ниже представлен график преобразованной переменной и ее автокорреляционная функция.
Большинство сильных автокорреляций теперь удалено. Хотя еще остались автокорреляции, больше брать разности ряда не будем, т.к. они могут исключить эффект скользящего среднего. Далее строим частные автокорреляции.
Необходимо отметить, что оценка частной автокорреляционной функции выглядит достаточно хорошо, и ряд готов для анализа с помощью АРПСС.
Выбираем опции для первоначальной переменной: Натуральный логарифм и Разность. Затем задаем Лаг равный 1 и устанавливаем Порядок равным 1. Задаём сезонную разность: во втором поле Лаг = 12 и Порядок=1. Еще нужно задать параметры модели АРПСС. На этапе идентификации АРПСС, мы пришли к выводу, что нужно оценить один регулярный параметр скользящего среднего (q), один сезонный (Q) и ни одного параметра авторегрессии. Результаты АРПСС:
Переменная: Кросс-пр: |
ln(x); D(-1); D(-12) |
Модель: |
(0,0,1)(0,0,1) Сезонный лаг: 12 |
Число набл.: |
59 Начальная SS=,18556 Итоговая SS=,11364 (61,24%) MS=,00199 |
Параметры (p/Ps-авторегрессии, q/Qs-скольз. средн.); выделение: p<.05 | |
q(1) Qs(1) | |
Оценка: |
,35896 ,75665 |
Ст.ошиб.: |
,12886 ,13171 |
Выводим таблицу результатов с оценками, стандартными ошибками, асимптотическими значениями t-статистик и т.д.
Модель(0,0,1)(0,0,1) Сезонный лаг: 12 MS Остаток= ,00199 | ||||||
Парам. |
Асимпт. |
Асимпт. |
p |
Нижняя |
Верхняя | |
q(1) |
0,358965 |
0,128861 |
2,785671 |
0,007240 |
0,100925 |
0,617005 |
Qs(1) |
0,756645 |
0,131710 |
5,744785 |
0,000000 |
0,492901 |
1,020390 |
Информация о работе Построенние моделей экспоненциального сглаживания