Прогнозирование в регрессионных моделях

Автор работы: Пользователь скрыл имя, 23 Декабря 2013 в 20:03, реферат

Краткое описание

В данном реферате в систематизированном виде изложены статистические методы анализа, классифицированные по учету прогнозного фона , а именно условные, безусловные прогнозы и прогнозирование при наличии авторегрессионных ошибок.

Содержание

ВВЕДЕНИЕ 4
1.ЭКОНОМИЧЕСКИЙ ПРОГНОЗ. КЛАССИФИКАЦИЯ ЭКОНОМИЧЕСКИХ ПРОГНОЗОВ 5
1.1 Проблемы прогнозирования. Моделирование 11
2.БЕЗУСЛОВНОЕ ПРОГНОЗИРОВАНИЕ И УСЛОВНОЕ ПРОГНОЗИРОВАНИЕ 13
3.ПРОГНОЗИРОВАНИЕ ПРИ НАЛИЧИИ АВТОРЕГРЕССИИ ОШИБОК 17
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 24

Вложенные файлы: 1 файл

эргонометрика.docx

— 147.08 Кб (Скачать файл)

 Регрессионные модели являются наиболее употребительными на практике среди различных моделей прогнозирования. Они позволяют расширить термин “прогнозирование”. Дело в том, что ряды наблюдений не обязательно имеют временную структуру, а задача оценки значения исследуемого показателя для некоторого набора значений объясняющих переменных, которых нет в выборке, вполне может быть реальной. Именно в этом смысле и следует понимать прогнозирование в эконометрике.

Проблема прогнозирования имеет много различных аспектов. Экстраполяция выявленных тенденций (продление на прогнозируемый период) позволяет получить точечный прогноз. Однако вероятность точного попадания в эту точку практически равна нулю. Отсюда следует необходимость вычисления оценок в виде “вилки” через интервальный прогноз, в котором истинное значение переменной находится с заданным уровнем надежности (доверия). Различают также безусловное прогнозирование (его иногда называют предсказанием) и условное прогнозирование (или просто прогноз) в зависимости от того известны ли значения объясняющих переменных в прогнозируемый период точно или приближенно. Прогнозы менее точны, чем предсказания, поскольку они подвержены воздействию дополнительного источника ошибки – предсказания значений объясняющих переменных. Эту дополнительную ошибку необходимо минимизировать, моделируя поведение объясняющих переменных.

При эконометрическом прогнозировании  на основании данных временных рядов следует учитывать особенности фактора времени, которые заключаются в следующем:

  • последовательные по времени уровни временных рядов, как правило, являются взаимозависимыми, что приводит к авто-корреляции, и тем самым не будет выполняться третье условие Гаусса-Маркова;
  • поскольку объясняющие переменные зависят от времени, то они будут коррелировать и между собой. Следовательно, в модели будет присутствовать мультиколлинеарность;
  • в зависимости от момента времени наблюдения обладают разной информативностью: по мере удаления от текущего момента времени информационная ценность наблюдений уменьшается. При прогнозировании возможно следует придать больший вес последним наблюдениям;
  • с увеличением длины временного ряда точность статистических характеристик не обязательно будет повышаться, а при появлении новых закономерностей развития она может даже снижаться;
  • текущее значение исследуемого показателя может зависеть не только от текущих значений объясняющих переменных, а и от предыдущих значений объясняющих и даже объясняемой переменных. Как следствие, при анализе временных рядов возникает необходимость в построении лаговых структур.

Таким образом, учет фактора  времени в регрессионном анализе  и прогнозировании по данным временных рядов является непременным условием, а его игнорирование может привести к неправильным оценкам и принятию ошибочных решений.(1,с.44)

 

2.БЕЗУСЛОВНОЕ ПРОГНОЗИРОВАНИЕ  И УСЛОВНОЕ ПРОГНОЗИРОВАНИЕ

Безусловным называют прогноз, в котором будущее состояние объекта прогнозируют без учета возможных будущих состояний прогнозного фона. Полученный таким образом прогноз основан либо на сложившейся в прошлом динамике объекта, либо на выявленных в прошлом взаимосвязях. Чем выше степень неопределенности и изменчивости прогнозного фона, тем менее достоверным становится прогноз.

Таким образом, термин безусловное  прогнозирование означает, что вектор независимых переменных n+i известен точно.

Предположим, что мы знаем  значения параметров /3 и сг2. Тогда естественно в качестве оценки yn = у величины уп+1 взять E(yn+i) = х'п+1(3) Среднеквадратичная ошибка такого прогноза есть E(yn+i — у)2 = Е(е2+1) = сг2. Если дополнительно предположить, что en+i имеет нормальное распределение. 

Предположим теперь, что  параметры /3 и сг2 неизвестны, что, как правило, и бывает на практике. Обозначим /3 и s2 их МНК- оценки на основании модели (1.1): /3 = (X'X)~lХ'у, s2 = е'е/{y-n} Возьмем в качестве оценки yn\ величину

Нетрудно проверить, что  поскольку Е/3 = /3, то Еу = Ey„+i, т. е. оценка у является несмещенной. Оказывается, в классе линейных (по у) несмещенных оценок она обладает наименьшей среднеквадратичной ошибкой.

Теорема. Пусть у = dy — оценка величины yn+i где с = (сі,..., Сп)' — некоторый вектор, и пусть оценка у несмещенная,

Еу = Ey„+i = yn+i. (1.4)

Тогда,

E(y-y’i)2^E(y-yn+1)2. Доказательство. Так как в силу (1.4)

 Еу = dXj3 = х'n+1(3 при любом f3), то

dX=x'n+1. (1.5)

Далее,

Е(у - yn+і)2 = Е(у - у + у – y’+i)2 = Е(у - у)2

+ Е(у - yn+1)2 + 2Е((у - у)(у – y’+i)). (1.6)

Покажем, что

Е((у — у)(у — Уn+і)) = 0- (7-7)

Имеем

Е((у - у)(У ' yn+i)) = E(dyx'n+l0) - E(x'n+l0x'n+lp)

— E(c'y(x'n+1/3 + en+i))

+ E (^n+l3(^n+l/^ + n+l ))

Первое слагаемое:

E(dyx'n+if3) = E{dyj3xn+1)

= E {dyy'X(X'X)-lxn+l) = dE(yy')X(X'X)~lxn+\ = d(o2I + X/30X')X{X'X)-lxn+1 = o2c'X{X'X)-'lxn+1+ dX/3/3'X'X(X'X)-1xn+1 (в силу (1.2)

o2x'n+ x(Х'Х)-1 »n+1 + x'n+l(3(3'xn+i)).

Второе слагаемое:

= х'n+1{а2(Х'Х)~1+/3/3')хn+, = а2х'n+1(Х'Х)~1хn+1 + х'n+6 хn

Третье слагаемое:

E{c'y(x'n+l/3+ еn+1)) = JE(y)0xn+i

= c'Xp(3'xn+i (в силу (1.5)) = х'п+1/3=n+1.

Четвертое слагаемое:

E(^n+l3(^n+l/3 + Єn+l)) = х'n+yn'хn+х. (Мы постоянно пользуемся тем, что для векторов хну одинаковой размерности х'у = у'х.)

Таким образом, выполнено (1.7), и теорема доказана.

Нетрудно проверить, что  среднеквадратичная ошибка прогноза есть

Zу~ J/n+i)2 = *2(1 + x^^X'XJ-^n+x). (1.8) Заменим а2 на ее оценку s2 и обозначим

8 = y/s2(l + x'n+1(X'X)->xn+l).

Используя те же аргументы, что и в п. 1.5, получаем, что если ошибки (e,en+i) имеют совместное нормальное распределение, то случайная величина {y—yn+i)/$ имеет распределение Стьюдента с п—к степенями свободы. Поэтому доверительным интервалом для Уп+1 с уровнем доверия 1-а будет интервал (у — <5*а/2> У + ^а/2), где ta/2 есть 100(а/2) процентная точка распределения Стьюдента с n — к степенями свободы.

Можно показать, что в  случае парной регрессии, т.е. когда  система (1.1) имеет вид:

yt = P i+foxt + ?t, t=l,...,n,

формула (1.8) выглядит так:

где х = і Из (1.9) следует, что среднеквадратичная ошибка прогноза минимальна при xn+i =х, и чем дальше хn+і от х, тем шире соответствующий доверительный интервал.(3,с.95)

 

Условное прогнозирование  учитывает возможные состояния  прогнозного фона и поэтому разрабатывается в нескольких вариантах. Состояние объекта прогнозирования ставится в зависимость от состояния прогнозного фона. В предыдущих рассуждениях предполагалось, что независимая переменная xn+i известна точно. Однако на практике встречаются ситуации, когда в xn+i содержатся ошибки.

Так, при прогнозировании  временных рядов часто приходится прогнозировать значения независимых переменных, что неизбежно приводит к отклонениям от истинных значений. Поэтому рассмотрим теперь заг дачу условного прогнозирования. Пусть выполнены соотношения (1.1) и (1.2), но вектор xn+i наблюдается с ошибкой

« = xn+i + и, (1.10)

где и — xn 1 случайный вектор, не зависящий от (е, en+i)» Eit = О, V(it) = о2 J. Прогноз (1.3) заменяется теперь на

y = z% (1.11)

Пусть е = у — уп+і — ошибка прогнозирования.

 Тогда Ее = Е(z'3) - x'n+1/3 = E((xn+i + и)'Р) - х'п+ф = Е(х^+13) + Е(и% - х'п+10 = 0,

так как и и z’3 независимы и Би = 0. Иными словами, оценка (1.11) является несмещенной. Можно проверить (мы оставляем это читателю в виде упражнения), что

Ее2 = a2(l+x;+1(X,X)-1xn+1+tT2tr((X,X)-1))+a2/3,/3. (1.12)

Таким образом, при наличии  ошибок в независимой переменной к ошибке прогнозирования (1.8) добавляются два новых положительных слагаемых, пропорциональных дисперсии а.(4,с.56)

В случае условного прогнозирования  нельзя так же просто, как при  безусловном прогнозировании, построить  доверительный интервал для уп+ь Это связано с тем, что при нормально распределенных ошибках (e,en+i,tt) оценка у есть скалярное произведение двух независимых нормальных векторов. Поэтому доверительный интервал нельзя найти аналитически, однако существуют численные процедуры, позволяющие строить его приближенно.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.ПРОГНОЗИРОВАНИЕ ПРИ НАЛИЧИИ АВТОРЕГРЕССИИ ОШИБОК

Авторегрессия (аutoregression) – это статистический метод определения потенциальной потери капитала или его дохода. В данном способе для предположения последующих значений используются предыдущие значения временных рядов.

Прогнозы, сделанные по методам  авторегрессии, считаются одними из наиболее точных статистических прогнозов, именно поэтому они нашли широкое распространение, включая рынок Форекс. Это объясняется тем, что моделями авторегрессии великолепно описывается большое количество самых разных экономических показателей. Прогнозирование с использованием модели авторегрессии опирается на предыдущие значения продаж. Слово авторегрессия означает зависимость последующего значения продажи от предыдущих продаж.

Метод авторегрессии работает четко, однако трейдер должен учитывать некоторые тонкости. Одна из них указывает на то, что любая модель прогнозирования обладает высокими шансами на точный прогноз лишь в случае совпадения распределения исходного ряда с распределением прогнозного ряда. На таком принципе строятся самые эффективные подходы к осуществлению идентификации модели. Однако на практике распределение исходного ряда значительно отличается от распределения ВР.(3,с.112)

По большому счету формулу автокорреляционной функции, которая применяется в  авторегрессивных моделях, использовать нельзя – она применима исключительно к стационарным рядам (см. рис. 1). Кроме этого, ее крайне сложно получить, а математическое ожидание, которое используется при расчете АКФ найти попросту невозможно. Существует огромное количество различных хитростей и тонкостей, когда суперпозицию аналитических функций называют «моделью локального процесса» - на ее основании получают достаточно сомнительную оценку автокорреляционной функции. 

 

 (3.1)

где сигма - это случайная величина, Х - вектор имеющихся отсчётов первых разностей прогнозируемого ВР, а Y(i)- коэффициенты авторегрессии, на вид которых имеются ограничения. Для вычисления коэффициентов авторегрессии необходимо решить систему линейных удобрений энного порядка, состоящую из значений автокорреляционной функции для ряда первых разностей. После нахождения разности Х(i+1) не сложно составить прогноз для исходного ВР, а именно: Y(i+1)=Y(i)+X(i+1).

Прогнозирование процессов авторегрессии

Рассмотримпроцесс порядка (p,d,0)

Эвентуальная прогнозирующая функция в этом случае есть решение  уравнения  . Она применима ко  всем упреждениям и проходит через последние  известных значений ряда. Например, модель ряда цен акций IBM (ряда  ) очень близка к

так что

Лучший прогноз на будущее  оказывается очень близким к  текущему значению цены. Весовая функция для  сосредоточена в точке  , и не происходит никакого осреднения по прошлому.

Стационарные модели авторегрессии. Процесс    порядка  , где    — стационарный оператор и   с  , будет в общем случае иметь прогнозирующую функцию, являющуюся совокупностью экспонент и затухающих синусоид.

В частности, при  = 1 модель порядка (1, 0, 0)

имеет прогнозирующую функцию, которая при любых   является решением уравнения  , Отсюда

             

Кроме того,  , так что 

и

Следовательно, прогноз с  минимальной среднеквадратичной ошибкой  предсказывает, что текущее отклонение от среднего должно экспоненциально спадать до нуля. На рис. 3.1, а показан временной ряд, генерируемый процессом  , с его прогнозирующей функцией для момента  . Поведение этой функции целиком определяется только отклонением  . Аналогично минимальная среднеквадратичная ошибка прогноза для процесса авторегрессии второго порядка такова, что текущее отклонение от среднего убывает до нуля как затухающая

синусоида или сумма двух экспонент. На рис. 3.1 показан временной ряд, генерируемый процессом   , и его прогноз для момента   . Поведение прогнозирующей функции для момента   целиком определяется последними двумя отклонениями   и  .

Рис. 3.1-. Прогнозирующие функции процессов авторегрессии первого и второго порядка:

а — выборка из процесса авторегрессии первого порядка   и прогнозирующая функция для момента  = 14. б — выборка из процесса авгорегрессии второго порядка   и прогнозирующая функция на момент  =14. 1  — ход прогноза, определяемый только по текущему отклонению, 2 — ход прогноза, определяемый по текущему и предпоследнему отклонениям.

Функция дисперсии для  прогноза процесса (1,0,0). Чтобы полнее проиллюстрировать использование , выведем функцию дисперсии для процесса авторегрессии первого порядка. Так как модель в момент   может быть представлена в виде

то из (5.4.15) следует, что

Отсюда

    (5.4.16)

Мы видим, что для этого  стационарного процесса при стремлении   к бесконечности дисперсия растет до постоянного значения  , равного среднеквадратичному отклонению процесса относительно окончательного прогноза  . Это поведение существенно иное, чем у нестационарных моделей, у которых функция дисперсии прогноза при больших упреждениях неограниченно растет.(9, с.500)

Информация о работе Прогнозирование в регрессионных моделях