Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 17:39, курсовая работа
Целью работы является получение практических навыков построения эконометрических моделей. Эконометрический метод складывался в преодолении следующих трудностей, искажающих результаты применения классических статистических методов (сущность новых терминов будет раскрыта в дальнейшем): 1. асимметричности связей;
2. мультиколлинеарности связей; 3. эффекта гетероскедастичности; 4. автокорреляции; 5. ложной корреляции; 6. наличия лагов.
Введение - 3 -
Глава I. Аналитическая часть - 5 -
1.1. Основы построения и тестирования адекватности экономических моделей множественной регрессии - 5 -
1.2. Проблема спецификации экономических моделей множественной регрессии - 13 -
1.3. Последствия ошибок спецификации экономических моделей множественной регрессии - 18 -
Глава II. Проектная часть - 21 -
2.1. Методическое обеспечение - 21 -
2.2. Информационное обеспечение - 30 -
2.3. Числовой пример модели множественной регрессии и выводы - 31 -
Заключение 51
Список литературы
Рекомендуется после проверки
общего качества уравнения регрессии
провести анализ его статистической
значимости. Для этого используется
F-статистика:
Показатели F и R2 равны или не равен нулю
одновременно. Если F=0, то R2=0, следовательно,
величина Y линейно не зависит от X1,X2,…,Xm..Расчетное
значение F сравнивается с критическим
Fкр. Fкр, исходя из требуемого уровня значимости α и чисел степеней свободы v1
= m и v2 = n - m - 1, определяется на основе распределения
Фишера. Если F>Fкр, то R2 статистически значим.
Статистическая значимость
коэффициентов множественной
При статистическом анализе
уравнения регрессии на начальном
этапе часто проверяют
При этом проверяется
Для анализа коррелированности отклонений
используют статистику Дарбина-Уотсона:
Критические значения d1 и d2 определяются
на основе специальных таблиц для требуемого
уровня значимости α,
числа наблюдений n и
количества объясняющих переменных m.
Полностью произвести подобный расчет можно автоматически, используя популярный сервис Множественная регрессия (с оформлением в Word)
Частные коэффициенты (или
индексы) корреляции, измеряющие влияние
на у фактора хi при неизменном уровне других
факторов определяются по стандартной
формуле линейного коэффициента корреляции,
т.е. последовательно беруться пары yx1,yx2,...
, x1x2, x1x3 и так далее и для каждой пары
находится коэффициент корреляции
Вычисления в MS Excel. Матрицу парных коэффициентов
корреляции переменных можно рассчитать,
используя инструмент анализа данных
Корреляция.
Для этого:
1) Выполнить команду Сервис / Анализ данных
/ Корреляция.
2) Указать диапозон данных;
Для этой цели, как и в
случае множественной регрессии, используется
коэффициентдетерминации R2:
Справедливо соотношение 0 < =R2 < = 1. Чем ближе этот коэффициент к единице, тем больше уравнение множественной регрессии объясняет поведение Y.
Для множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение R2, так как каждая последующая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведениезависимой переменной.
Иногда при расчете
коэффициента детерминации для получения
несмещенных оценок в числителе
и знаменателе вычитаемой из единицы
дроби делается поправка на число
степеней свободы, т.е. вводится так
называемый скорректированный (исправленный)
коэффициент детерминации:
Соотношение может быть представлено
в следующем виде:
для m>1. С ростом значения mскорректированный
коэффициент детерминации растет медленнее, чем обычный.Очевидно,
что
только при R2 = 1.
может принимать отрицательные
значения.
Доказано, что
увеличивается при добавлении новой объясняющей
переменной тогда и только тогда, когда
t-статистика для этой переменной по модулю
больше единицы. Поэтому добавление в
модель новых объясняющих переменных
осуществляется до тех пор, пока растет
скорректированный коэффициент детерминации.
Рекомендуется после проверки общего качества уравнения регрессии провести анализ его статистической значимости. Для этого используется F-статистика:
Показатели F и R2 равны или не равен нулю одновременно. Если F=0, то R2=0, следовательно, величина Yлинейно не зависит от X1,X2,…,Xm.Расчетное значение F сравнивается с критическим Fкр. Fкр, исходя из требуемого уровня значимости α и чисел степеней свободы v1 = m и v2 = n - m - 1, определяется на основе распределения Фишера. Если F > Fкр, то R2 статистически значим.
По данным, представленным в таблице 2, изучается зависимость объёма валового национального продукта Y (млрд. долл.) от следующих переменных: Х1 – потребление, млрд. долл., Х2 – инвестиции, млрд. долл.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 | |
Y |
8 |
9,5 |
11 |
12 |
13 |
14 |
15 |
16,5 |
17 |
18 |
Х1 |
1,65 |
1,8 |
2,0 |
2,1 |
2,2 |
2,4 |
2,65 |
2,85 |
3,2 |
3,55 |
Х2 |
14 |
16 |
18 |
20 |
23 |
23,5 |
25 |
26,5 |
28,5 |
30,5 |
Регрессионный анализ
предназначен для исследования
зависимости исследуемой
В зависимости от количества включенных в модель факторов Х модели делятся на:
Линейная модель множественной регрессии имеет вид:
=b0+ b 1*x1+ b 2*x2+…+ b n*xn
Для построения линейной модели множественной регрессии на листе Microsoft Office Excel (2007) создадим табличку с нашими данными (Рис. 1) и построим регрессию. Для этого на закладке Данные выберем строку Анализ данных и в качестве инструмента данных – Регрессия - ок. В открывшемся окне Регрессии зададим Входной интервал Yи Х (рис.2,3).
Рис. 1. Линейная модель множественной
регрессии
Рис.3. Окно Регрессия.
Получим результаты регрессионного анализа на новом листе Регрессия (Рис.4)
Рис.4. Лист Регрессия.
По данным регрессионной статистики мы получили следующие данные:
Множественный R – это √R2 , где R2 – коэффициент детерминации.
R-квадрат – это R2. В нашем примере значение R2=0,9883 свидетельствует о том, что изменения зависимой переменной Y(объём валового национального продукта (ВНП)) в основном (на 98,83%) можно объяснить изменениями включенных в модель объясняющих переменных - Х1, Х2 (потребление и инвестиции). И лишь на 1,17% (100-98,83) объём ВНП зависит от других неучтённых факторов. Такое значение свидетельствует об адекватности модели.
Нормированный R-квадрат – поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.
Стандартная ошибка регрессии S=√S2, где S2=∑(еi2/(n-m)) – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); n- число наблюдений (в нашем случае 10), m- число объясняющих переменных (в нашем примере равно 2).
Наблюдения – число наблюдений n (10).
Рассмотрим таблицу с результатами дисперсионного анализа:
df – число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант (m+1).
SS- сумма квадратов (регрессионная RSS, остаточная ESS и общая TSS соответственно).
MS – сумма квадратов на одну степень свободы. MS=SS/df.
F – расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости α=0,05 уравнение регрессии признается значимым в целом, если Значимость F<0,05, и незначимым, если Значимость F≥0,05.
Для нашего примера имеем следующие значения:
Таблица 2
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
m=2 |
RSS=97,74 |
RSS/df=48,87 |
(RSS/ESS)* ((n-m-1)/m) =295,50 |
1,73534E-07 |
Остаток |
n-m- =7 |
ESS=1,15 |
ESS/df=0,165 |
||
Итого |
n-1=9 |
TSS= 98,9 |
В нашем случае расчетное значение F-критерия Фишера составляет 295,50. Значимость F=1,74E-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.
В последней таблице приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критериев Стьюдента для оценки значимости отдельных параметров модели.
Таблица 4
Коэффи-циенты |
Стандарт-ная ошибка |
t-статистика |
Р-значение |
Нижние 95% |
Верхние 95% | |
Y |
b0=-0,26 |
mb0=0,58 |
tb0=-0,44 |
0,67 |
-1,62≤ b0≤ 1,11 | |
X1 |
b1=0,47 |
mb1=0,88 |
tb1=0,53 |
0,61 |
-1,62≤ b1≤ 2,56 | |
X2 |
b2=0,56 |
mb2=0,10 |
tb2=5,53 |
0,0008 |
0,32≤ b2≤ 0,79 |