Автор работы: Пользователь скрыл имя, 16 Сентября 2014 в 10:56, контрольная работа
Термину регрессионная модель, используемому в регрессионном анализе, можно сопоставить синонимы: «теория», «гипотеза». Эти термины пришли из статистики, в частности из раздела «проверка статистических гипотез». Регрессионная модель есть прежде всего гипотеза, которая должна быть подвергнута статистической проверке, после чего она принимается или отвергается.
Регрессионная модель — это параметрическое семейство функций, задающее отображение
где — пространтсво параметров, — пространство свободных переменных, — пространство зависимых переменных.
Более простой способ выявления и устранения избыточности факторов состоит в оценке мультиколлинеарности (чем больше мультиколлинеарность, тем больше избыточность) и в последующем использовании метода исключения переменных.
Метод исключения переменных заключается в том, что высококоррелированные объясняющие переменные (факторы) устраняются из регрессии последовательно в несколько этапов, после чего она заново оценивается:
где: βk - коэффициент β k-го фактора;
σx k - СКО k-го фактора;
σy - СКО функции;
ak - коэффициент регрессии при k-ом факторе.
Из двух факторов может быть исключен тот, который имеет меньшее значение β.
tk=ak /Sa k, (3.2)
где: ak - коэффициент регрессии при k-ом факторе;
Sa k - стандартное отклонение оценки параметра ak.
Значение tk, рассчитанное по (3.2), сравнивают с табличным значением критерия tf,α, найденным по таблице квантилей t-распределения (для этого предварительно задаются величиной уровня значимости α и определяют число степеней свободы f =n-m-1, где: n - число наблюдений в исходном статистическом ряде; m - количество факторов в модели).
Если tk<t f,α, то k-ый фактор не оказывает существенного влияния на y, в связи с чем, он может быть исключен из модели.
Проверка адекватности регрессионной модели. Целью этого этапа является проверка качества окончательного варианта регрессионной модели. Данный этап включает:
Оценка значимости коэффициента детерминации необходима для ответа на вопрос: оказывают ли выбранные факторы достаточное влияние на y? Для оценки значимости используется F-статистика Фишера:
F= [D∙(n -m- 1)] / [m∙(1 -D)], (3.3)
где: D -коэффициент множественной детерминации,
D =R2 (здесь R коэффициент множественной корреляции);
n - число наблюдений в исходном статистическом ряде;
m - количество факторов в модели.
Значение F, рассчитанное по (3.3), сравнивают с табличным значением Ff1,f2,α, найденным по таблице квантилей F-распределения Фишера (для этого предварительно задаются величиной уровня значимости α и определяют число степеней свободы f1=m; f2=n-m- 1,
где: n - число наблюдений в исходном статистическом ряде;
m - количество факторов в модели).
Если F>Ff1,f2,α , то включенные в регрессию факторы достаточно полно объясняют зависимую переменную y, что позволяет говорить о значимости самой регрессии (модели).
Вычисление средней ошибки аппроксимации позволяет проверить качество подбора теоретического уравнения. Средняя ошибка аппроксимации регрессии определяется по формуле:
n
E= {{∑[(y i-y i т) /y i т]} /n} ∙100 %,
i = 1
где: n - число наблюдений в исходном статистическом ряде;
yi - значения зависимой переменной, полученные в i-ом наблюдении (в i-ой точке исходного статистического ряда);
yi т - значения зависимой переменной, рассчитанные с помощью регрессии для i-ой точки.
Смысловая интерпретация
полученной модели. Целью этого этапа является осмысление функциональных возм