Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели

Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 17:39, курсовая работа

Краткое описание

Целью работы является получение практических навыков построения эконометрических моделей. Эконометрический метод складывался в преодолении следующих трудностей, искажающих результаты применения классических статистических методов (сущность новых терминов будет раскрыта в дальнейшем): 1. асимметричности связей;
2. мультиколлинеарности связей; 3. эффекта гетероскедастичности; 4. автокорреляции; 5. ложной корреляции; 6. наличия лагов.

Содержание

Введение - 3 -
Глава I. Аналитическая часть - 5 -
1.1. Основы построения и тестирования адекватности экономических моделей множественной регрессии - 5 -
1.2. Проблема спецификации экономических моделей множественной регрессии - 13 -
1.3. Последствия ошибок спецификации экономических моделей множественной регрессии - 18 -
Глава II. Проектная часть - 21 -
2.1. Методическое обеспечение - 21 -
2.2. Информационное обеспечение - 30 -
2.3. Числовой пример модели множественной регрессии и выводы - 31 -
Заключение 51
Список литературы

Вложенные файлы: 1 файл

antonova1.docx

— 1.95 Мб (Скачать файл)

Эта постоянная дисперсия  обычно обозначается , или часто в более краткой форме , а условие записывается следующим образом:

.

    Выполнимость данного условия называется  гомоскедастичностью (постоянством дисперсии отклонений). Невыполнимость данной предпосылки называется гетероскедастичностью, (непостоянством дисперсии отклонений).

Третье условие  предполагает отсутствие систематической  связи между значениями случайной составляющей в любых двух наблюдениях. Например, если случайная составляющая велика и положительна в одном наблюдении, это не должно обусловливать систематическую тенденцию к тому, что она будет большой и положительной в следующем наблюдении. Случайные составляющие должны быть  независимы друг от друга.

В силу того, что  , данное условие можно записать следующим образом:

                                                                   

Возмущения  не коррелированны (условие независимости случайных составляющих в различных наблюдениях).

Это условие означает, что отклонения регрессии (а значит, и сама зависимая переменная) не коррелируют. Условие некоррелируемости  ограничительно, например, в случае временного ряда . Тогда третье условие означает отсутствие автокорреляции ряда . Четвертое условие состоит в том, что в модели (1.1) возмущение (или зависимая переменная ) есть величина случайная, а объясняющая переменная - величина неслучайная.

Если это условие  выполнено, то теоретическая ковариация между независимой переменной и случайным членом равна нулю.

 Наряду с условиями Гаусса— Маркова обычно также предполагается нормальность распределения случайного члена.

Качество модели регрессии  связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков - .

Анализ остатков позволяет  получить представление, насколько  хорошо подобрана сама модель и насколько  правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые (в действительности, почти независимые) одинаково распределенные случайные величины.

Качество модели регрессии  оценивается по следующим направлениям:

- проверка качества всего  уравнения регрессии;

- проверка значимости  всего уравнения регрессии;

- проверка статистической  значимости коэффициентов уравнения  регрессии;

- проверка выполнения  предпосылок МНК.

При анализе качества модели регрессии, в первую очередь, используется коэффициент детерминации, который  определяется следующим образом:

        ,                                     (1.5)

где  - среднее значение зависимой переменной,

       - предсказанное (расчетное) значение зависимой переменной.

Коэффициент  детерминации  показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

Чем ближе  к 1, тем выше качество модели.

Для оценки качества регрессионных  моделей целесообразно также  использовать коэффициент множественной корреляции (индекс корреляции) R

                 R =  =                                            (1.6)

Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных.

Важным моментом является проверка значимости  построенного уравнения в целом и отдельных  параметров.

Оценить значимость уравнения  регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и  Х, фактическим данным и достаточно ли включенных в уравнение объясняющих  переменных Х для описания зависимой  переменной Y

Оценка значимости уравнения  регрессии производится для того, чтобы узнать, пригодно уравнение  регрессии для практического  использования (например, для прогноза) или нет.

Для проверки значимости модели регрессии используется F-критерий Фишера. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель,  больше табличного при заданном уровне значимости, то модель считается значимой.

                                                                       (1.7)

В качестве  меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины  ( ) называется стандартной ошибкой:

                                                                                (1.8)

значимость отдельных коэффициентов регрессии проверяется по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена):

         

,                                                            (1.9)

где Saj — это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии aj. Величина Saj представляет собой квадратный корень из произведения несмещенной оценки дисперсии и j -го диагонального элемента матрицы, обратной матрице системы нормальных уравнений.

                    

 где  -  диагональный элемент матрицы .

Если расчетное значение t-критерия с (n - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).

1.2. Проблема спецификации экономических  моделей множественной регрессии 

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, который в свою очередь включает 2 круга вопросов: отбор факторов и выбор уравнения регрессии. Отбор факторов обычно осуществляется в два этапа: 1) теоретический анализ взаимосвязи результата и круга факторов, которые оказывают на него существенное влияние;

2) количественная оценка  взаимосвязи факторов с результатом.  При линейной форме связи между  признаками данный этап сводится  к анализу корреляционной матрицы  (матрицы парных линейных коэффициентов  корреляции): ry , y ry , x1 ryx2 .... ry , xm rx 1, y rx1, x2 rx2x 2 .... rx 2, xm ...... rxm , y rxm, x1 rxm , x2 .... rxm , xm где ry , xj – линейный парный  коэффициент корреляции, измеряющий  тесноту связи между признаками y и хj j=1;m , m -число факторов. rxj , xk – линейный парный коэффициент  корреляции, измеряющий тесноту  связи между признаками хj и  хk j,k =1;m. Факторы, включаемые во  множественную регрессию, должны  отвечать следующим требованиям: 

1. Они должны быть количественно  измеримы. Если необходимо включить  в модель качественный фактор, не имеющий количественного измерения,  то ему нужно придать количественную  определенность (например, в модели  урожайности качество почвы задается  в виде баллов).

2. Каждый фактор должен  быть достаточно тесно связан  с результатом (т.е. коэффициент  парной линейной корреляции между  фактором и результатом должен  быть существенным).

3. Факторы не должны  быть сильно коррелированы друг  с другом, тем более находиться  в строгой функциональной связи  (т.е. они не должны быть интеркоррелированы).

Разновидностью интеркоррелированности факторов является мультиколлинеарность - тесная линейная связь между факторами. Мультиколлинеарность может привести к нежелательным последствиям:

1) оценки параметров становятся  ненадежными. Они обнаруживают  большие стандартные ошибки. С  изменением объема наблюдений  оценки меняются (не только по  величине, но и по знаку), что  делает модель непригодной для  анализа и прогнозирования. 

2) затрудняется интерпретация  параметров множественной регрессии  как характеристик действия факторов  в «чистом» виде, ибо факторы  коррелированны; параметры линейной  регрессии теряют экономический  смысл; 

3) становится невозможным  определить изолированное влияние  факторов на результативный показатель.

Мультиколлинеарность имеет  место, если определитель матрицы межфакторной корреляции близок к нулю:

 

Если же определитель матрицы  межфакторной корреляции близок к единице, то мультколлинеарности нет. Существуют различные подходы преодоления сильной межфакторной корреляции. Простейший из них – исключение из модели фактора (или факторов), в наибольшей степени ответственных за мультиколлинеарность при условии, что качество модели при этом пострадает несущественно (а именно, теоретический коэффициент детерминации -R2y(x1...xm) снизится несущественно).

Определение факторов, ответственных  за мультиколлинеарность, может быть основано на анализе матрицы межфакторной корреляции. При этом определяют пару признаков-факторов, которые сильнее  всего связаны между собой (коэффициент линейной парной корреляции максимален по модулю). Из этой пары в наибольшей степени ответственным за мультиколлинеарность будет тот признак, который теснее связан с другими факторами модели (имеет более высокие по модулю значения коэффициентов парной линейной корреляции).

Еще один способ определения  факторов, ответственных за мультиколлинеарность основан на вычислении коэффициентов  множественной детерминации (R2xj(x1,...,xj-1,xj+1,...,xm)), показывающего зависимость фактора xj от других факторов модели x1,..., xj-1, x j+1,..., xm. Чем ближе значение коэффициента множественной детерминации к единице, тем больше ответственность за мультиколлинеарность фактора, выступающего в роли зависимой  переменной. Сравнивая между собой  коэффициенты множественной детерминации для различных факторов можно  проранжировать переменные по степени  ответственности за мультиколлинеарность.

При выборе формы уравнения  множественной регрессии предпочтение отдается линейной функции:

yi =a+b1·x1i+ b2·x2i+...+ bm·xmi+ui

в виду четкой интерпретации  параметров.

Данное уравнение регрессии  называют уравнением регрессии в  естественном (натуральном) масштабе. Коэффициент регрессии bj при факторе  хj называют условно-чистым коэффициентом  регрессии. Он измеряет среднее по совокупности отклонение признака-результата от его  средней величины при отклонении признака-фактора хj на единицу, при  условии, что все прочие факторы  модели не изменяются (зафиксированы  на своих средних уровнях).

Если не делать предположения  о значениях прочих факторов, входящих в модель, то это означало бы, что  каждый из них при изменении х j также изменялся бы (так как факторы связаны между собой), и своими изменениями оказывали бы влияние на признак-результат.

Понятие множественной регрессии  тесно связано с понятием временного ряда. В зависимости от составляющих уровней временных рядов выделяют:  Аддитивную, мультипликативную и  смешанную модели

Временным рядом называется ряд наблюдений за значениями некоторого показателя (признака), упорядоченный  в хронологической последовательности, т.е. в порядке возрастания переменной t- временного параметра. Отдельные  наблюдения временного ряда называются уровнями этого ряда.

Временные ряды делятся на моментные и интервальные. В моментных  временных рядах уровни характеризуют  значения показателя по состоянию на определенные моменты времени. Например, моментными являются временные ряды цен на определенные виды товаров, временные  ряды курсов акций, уровни которых фиксируются  для конкретных чисел. Примерами  моментных временных рядов могут  служить также ряды численности  населения или стоимости основных фондов, т.к. значения уровней этих рядов  определяются ежегодно на одно и то же число.

В интервальных рядах уровни характеризуют значение показателя за определенные интервалы (периоды) времени. Примерами рядов этого типа могут  служить временные ряды производства продукции в натуральном или  стоимостном выражении за месяц, квартал, год и т.д.

Иногда уровни ряда представляют собой не непосредственно наблюдаемые  значения, а производные величины: средние или относительные. Такие  ряды называются производными. Уровни таких временных рядов получаются с помощью некоторых вычислений на основе непосредственно наблюдаемых  показателей. Примерами таких рядов  могут служить ряды среднесуточного  производства основных видов промышленной продукции или ряды индексов цен.

Информация о работе Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели