Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели

Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 17:39, курсовая работа

Краткое описание

Целью работы является получение практических навыков построения эконометрических моделей. Эконометрический метод складывался в преодолении следующих трудностей, искажающих результаты применения классических статистических методов (сущность новых терминов будет раскрыта в дальнейшем): 1. асимметричности связей;
2. мультиколлинеарности связей; 3. эффекта гетероскедастичности; 4. автокорреляции; 5. ложной корреляции; 6. наличия лагов.

Содержание

Введение - 3 -
Глава I. Аналитическая часть - 5 -
1.1. Основы построения и тестирования адекватности экономических моделей множественной регрессии - 5 -
1.2. Проблема спецификации экономических моделей множественной регрессии - 13 -
1.3. Последствия ошибок спецификации экономических моделей множественной регрессии - 18 -
Глава II. Проектная часть - 21 -
2.1. Методическое обеспечение - 21 -
2.2. Информационное обеспечение - 30 -
2.3. Числовой пример модели множественной регрессии и выводы - 31 -
Заключение 51
Список литературы

Скачать в ZIP архиве (1.77 Мб) Сколько стоит заказать работу?

Вложенные файлы: 1 файл

antonova1.docx

— 1.95 Мб (Скачать файл)

Уровни ряда могут принимать детерминированные или случайные значения. Примером ряда с детерминированными значениями уровней - служит ряд последовательных данных о количестве дней в месяцах. Естественно, анализу, а в дальнейшем и прогнозированию, подвергаются ряды со случайными значениями уровней. В таких рядах каждый уровень может рассматриваться как реализация случайной величины - дискретной или непрерывной. Модели, которые построены по данным, характеризующим один объект за ряд определенных последовательных периодов, называется моделями временных рядов.

Как уже отмечалось, в модели временного ряда принято выделять две основные составляющие: детерминированную и случайную (рис.). Под детерминированной составляющей временного ряда понимают числовую последовательность , элементы которой вычисляются по определенному правилу как функция времени t. Исключив детерминированную составляющую из данных, мы получим колеблющийся вокруг нуля ряд, который может в одном предельном случае представлять чисто случайные скачки, а в другом – плавное колебательное движение. В большинстве случаев будет нечто среднее: некоторая иррегулярность и определенный систематический эффект, обусловленный зависимостью последовательных членов ряда.

Проблема спецификации экономических моделей множественной регрессии по существу решается на первых трех этапах моделирования и включает в себя:

- определение конечных целей моделирования (прогноз, имитация различных сценариев социально-экономического развития анализируемой системы, управление);

- определение списка экзогенных и эндогенных переменных;

- определение состава анализируемой системы уравнений и тождеств, их структуры и соответственно списка предопределенных переменных;

- формулировку исходных предпосылок и априорных ограничений относительно: стохастической природы остатков (в классических вариантах моделей постулируются их взаимная статистическая независимость или некоррелированность, нулевые значения их средних величин и, иногда, сохранение постоянными в процессе наблюдения значений их дисперсий - гомоскедастичностъ);

- числовых значений отдельных элементов матриц коэффициентов в модели;

-поведение некоторых эндогенных переменных.

Итак, спецификация модели — это первый и, быть может, важнейший шаг эконометрического исследования. От того, насколько удачно решена проблема спецификации и, в частности, насколько реалистичны наши решения и предположения относительно состава эндогенных, экзогенных и предопределенных переменных, структуры самой системы уравнений и тождеств, стохастической природы случайных остатков и конкретных числовых значений части элементов матриц коэффициентов, решающим образом зависит успех всего эконометрического моделирования.

Спецификация опирается на имеющиеся экономические теории, специальные знания или на интуитивные представления исследователя об анализируемой экономической системе. Эти априорные сведения определяют, в частности, природу матриц коэффициентов.

Например, информация (или предположение) о том, что определенные переменные непосредственно не участвуют в том или ином уравнении, означает равенство нулю соответствующих элементов в строках матриц коэффициентов. Дополнительные сведения о системе могут иметь вид ограничений на комбинации элементов матриц коэффициентов.

1.3. Последствия ошибок спецификации экономических моделей множественной регрессии

Возможные ошибки спецификации регрессионной модели:

- Невключение значимых переменных

- Включение незначимых переменных

Невключение значимых переменных

• (–) Смещенность оценок коэффициентов регрессии

• (–) Смещенность оценки дисперсии ошибок регрессии

• (+) Меньшая вариация оценок коэффициентов регрессии

Включение незначимых переменных

• (+) Несмещенность оценок коэффициентов регрессии

• (+) Несмещенность оценки дисперсии ошибок регрессии

• (–) Большая вариация оценок коэффициентов регрессии

Замещающие переменные, причины:

1. Необходимость показателя не была учтена при составлении выборки

2. Переменная трудноизмерима (например, уровень образования)

3. Сбор данных о переменной x1 требует значительных затрат

При оценивании модели без переменной x1 полученные оценки будут смешенными.

Последствия использования замещающих переменных:

1. Оценки коэффициентов при переменных x2,…, xk становятся несмещенными

2. Стандартные ошибки и t-статистики коэффициентов te ze

3. R2 имеет такое же значение, как и при оценивании с переменной x1

4. Коэффициент β1 нельзя оценить (оценивается только β1δ1), но его стандартная ошибка и t-статистика позволяет оценить значимость x1

5. Получить оценку свободного члена модели невозможно (но она часто и не особенно важна) последствия справедливы приблизительно

Мультиколлинеарность — это понятие, которое используется для описания проблемы, когда нестрогая линейная зависимость между объясняющими переменными приводит к получению ненадежных оценок регрессии. Оценка любой регрессии будет страдать от нее в определенной степени, если только все независимые переменные не окажутся абсолютно некоррелированными.

Различные методы, которые могут быть использованы для смягчения мультиколлинеарности, делятся на две категории: к первой категории относятся попытки повысить степень выполнения четырех условий, обеспечивающих надежность оценок регрессии; ко второй категории относится использование внешней информации, но можно привнести или усилить автокорреляцию, но она может быть нейтрализована. Кроме того, можно привнести (или усилить) смещение, вызванное ошибками измерения, если поквартальные данные измерены с меньшей точностью, чем соответствующие ежегодные данные.

Глава II. Проектная часть

2.1. Методическое обеспечение множественной регрессии

Суть регрессионного анализа: построение математической модели и определение ее статистической надежности.

Вид множественной линейной модели регрессионного анализа:

Y = b₀+ b₁x_i1+ ... + b_jx_ij+ ... + b_kx_ik+ e_i

где e_i- случайные ошибки наблюдения, независимые между собой, имеют нулевую среднюю и дисперсию s.

Назначение множественной регрессии: анализ связи между несколькими независимыми переменными и зависимой переменной.

Экономический смысл параметров множественной регрессии
Коэффициент множественной регрессии b_jпоказывает, на какую величину в среднем изменится результативный признак Y, если переменную X_jувеличить на единицу измерения, т. е. является нормативным коэффициентом.

Матричная запись множественной линейной модели регрессионного анализа:

Y = Xb + e

где Y - случайный вектор - столбец размерности (n x 1) наблюдаемых значений результативного признака (y₁, y₂,..., y_n);

X - матрица размерности [n x (k+1)] наблюдаемых значений аргументов;
b - вектор - столбец размерности [(k+1) x 1] неизвестных, подлежащих оценке параметров (коэффициентов регрессии) модели;

e - случайный вектор - столбец размерности (n x 1) ошибок наблюдений (остатков).

На практике рекомендуется, чтобы n превышало k не менее, чем в три раза.

Задачи регрессионного анализа
Основная задача регрессионного анализа заключается в нахождении по выборке объемом n оценки неизвестных коэффициентов регрессии b₀, b₁,..., b_k. Задачи регрессионного анализа состоят в том, чтобы по имеющимся статистическим данным для переменных X_iи Y:

получить наилучшие оценки неизвестных параметров b₀, b₁,..., b_k;
проверить статистические гипотезы о параметрах модели;
проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).

Построение моделей множественной регрессии состоит из следующих этапов:

выбор формы связи (уравнения регрессии);
определение параметров выбранного уравнения;
анализ качества уравнения и поверка адекватности уравнения эмпирическим данным, совершенствование уравнения.

Множественная регрессия:

Множественная регрессия с одной переменной
Множественная регрессия с двумя переменными
Множественная регрессия с тремя переменными

Пример решения нахождения модели множественной регрессии

Множественная регрессия с двумя переменными

Модель множественной регрессии вида Y = b₀+b₁X₁+ b₂X₂;
1) Найти неизвестные b₀, b₁,b₂можно, решим систему трехлинейных уравнений с тремя неизвестными b₀,b₁,b₂:

Для решения системы можете воспользоваться решение системы методом Крамера или использовав формулы

Для этого строим таблицу вида:

Таблица 1.

Y	x₁	x₂	(y-y_ср)²	(x₁-x_1ср)²	(x₂-x_2ср)²	(y-y_ср)(x₁-x_1ср)	(y-y_ср) (x₂-x_2ср)	(x₁-x_1ср) (x₂-x_2ср)

Выборочные дисперсии эмпирических коэффициентов множественной регрессии можно определить следующим образом:

Здесь z'_jj- j-тый диагональный элемент матрицы Z^-1=(X^TX)^-1.

При этом:

где m - количество объясняющих переменных модели.
В частности, для уравнения множественной регрессии

Y = b₀+ b₁X₁+ b₂X₂

с двумя объясняющими переменными используются следующие формулы:

Или

или
, , .
Здесь r₁₂- выборочный коэффициент корреляции между объясняющимипеременными X₁и X₂; Sb_j- стандартная ошибкакоэффициента регрессии; S - стандартная ошибка множественной регрессии (несмещенная оценка).
По аналогии с парной регрессией после определения точечных оценокb_jкоэффициентов βj (j=1,2,…,m) теоретического уравнения множественной регрессии могут быть рассчитаны интервальные оценки указанных коэффициентов.

Доверительный интервал, накрывающий с надежностью (1-α) неизвестное значение параметра βj, определяется как

Множественная регрессия в Excel

Чтобы найти параметры множественной регресии средствами Excel, используется функция ЛИНЕЙН(Y;X;0;1),

где Y - массив для значений Y

где X - массив для значений X (указывается как единый массив для всех значений Х_i)

Проверка статистической значимости коэффициентов уравнения множественной регрессии

Как и в случае множественной регрессии, статистическая значимость коэффициентовмножественной регрессии с m объясняющими переменными проверяется на основе t-статистики:

имеющей в данном случае распределение Стьюдента с числом степеней свободы v = n- m-1. При требуемом уровне значимости наблюдаемое значение t-статистики сравнивается с критической точной распределения Стьюдента.
В случае, если , то статистическая значимость соответствующего коэффициента множественной регрессии подтверждается. Это означает, что фактор Xj линейно связан с зависимой переменной Y. Если же установлен факт незначимости коэффициента b_j, то рекомендуется исключить из уравнения переменную Xj. Это не приведет к существенной потере качества модели, но сделает ее более конкретной.

Проверка общего качества уравнения множественной регрессии

Для этой цели, как и в случае множественной регрессии, используется коэффициентдетерминации R²:

Справедливо соотношение 0<=R2<=1. Чем ближе этот коэффициент к единице, тем больше уравнение множественной регрессии объясняет поведение Y.

Для множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение R², так как каждая последующая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведение зависимой переменной.
Иногда при расчете коэффициента детерминации для получения несмещенных оценок в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы, т.е. вводится так называемый скорректированный (исправленный) коэффициент детерминации:

Соотношение может быть представлено вследующем виде:

для m>1. С ростом значения m скорректированный коэффициент детерминации растет медленнее, чем обычный.Очевидно, что только при R²= 1. может принимать отрицательные значения.
Доказано, что увеличивается при добавлении новой объясняющей переменной тогда и только тогда, когда t-статистика для этой переменной по модулю больше единицы. Поэтому добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.

Информация о работе Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели