Автор работы: Пользователь скрыл имя, 17 Октября 2013 в 20:16, контрольная работа
Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.
Различают два класса нелинейных регрессий:
1) Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, например
полиномы различных степеней – , ;
равносторонняя гипербола – ;
полулогарифмическая функция – .
I. Теоретическая часть
1. Нелинейная регрессия. Корреляция для нелинейной регрессии.
Средняя ошибка аппроксимации………………………………………………...3
2. Спецификация модели. Отбор факторов при построении
множественной регрессии………………………………………………………14
II. Практическая часть
Задачи…………………………………………………………………………….20
Список использованной литературы…………………………………………...25
Найдем уравнение регрессии:
; .
Т.е. получаем следующее уравнение регрессии: . Теперь заполняем столбцы 8-11 таблицы 3.
Индекс корреляции: , а индекс детерминации , который показывает, что 99,1% вариации результативного признака объясняется вариацией признака-фактора, а 0,9% приходится на долю прочих факторов.
Средняя ошибка аппроксимации: показывает, что линия регрессии хорошо приближает исходные данные.
-критерий Фишера:
значительно превышает табличное .
Изобразим на графике исходные данные и линию регрессии:
Для нахождения параметров регрессии необходимо провести ее линеаризацию, как было показано выше: , где , , , .
Составляем вспомогательную
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
0,182 |
-0,105 |
-0,019 |
0,033 |
0,011 |
0,8149 |
0,0851 |
0,0072 |
9,46 |
2 |
1,131 |
0,182 |
0,206 |
1,280 |
0,033 |
1,3747 |
-0,1747 |
0,0305 |
14,56 |
3 |
1,668 |
0,588 |
0,980 |
2,781 |
0,345 |
1,8473 |
-0,0473 |
0,0022 |
2,63 |
4 |
2,001 |
0,788 |
1,578 |
4,006 |
0,622 |
2,2203 |
-0,0203 |
0,0004 |
0,92 |
5 |
2,262 |
0,956 |
2,161 |
5,116 |
0,913 |
2,5627 |
0,0373 |
0,0014 |
1,43 |
6 |
2,468 |
1,065 |
2,628 |
6,092 |
1,134 |
2,8713 |
0,0287 |
0,0008 |
0,99 |
7 |
2,674 |
1,194 |
3,193 |
7,151 |
1,425 |
3,2165 |
0,0835 |
0,0070 |
2,53 |
8 |
2,929 |
1,335 |
3,910 |
8,576 |
1,782 |
3,7004 |
0,0996 |
0,0099 |
2,62 |
Итого |
15,315 |
6,002 |
14,637 |
35,035 |
6,266 |
18,608 |
0,0919 |
0,0595 |
35,14 |
Среднее значение |
1,914 |
0,750 |
1,830 |
4,379 |
0,783 |
– |
– |
0,0074 |
4,39 |
0,846 |
0,470 |
– |
– |
– |
– |
– |
– |
– | |
0,716 |
0,221 |
– |
– |
– |
– |
– |
– |
– |
Найдем уравнение регрессии:
; .
Т.е. получаем следующее уравнение регрессии: . После потенцирования находим искомое уравнение регрессии:
Заполняем столбцы 7-10 таблицы 4.
Индекс корреляции:
а индекс детерминации , который показывает, что 96,7% вариации результативного признака объясняется вариацией признака-фактора, а 3,3% приходится на долю прочих факторов.
Средняя ошибка аппроксимации: показывает, что линия регрессии хорошо приближает исходные данные.
-критерий Фишера:
значительно превышает табличное .
Изобразим на графике исходные данные и линию регрессии:
Сравним построенные модели по индексу детерминации и средней ошибке аппроксимации:
Таблица 5
Модель |
Индекс детерминации, |
Средняя ошибка аппроксимации, |
Линейная модель, |
0,987 |
6,52 |
Полулогарифмическая модель, |
0,918 |
14,51 |
Модель с квадратным корнем, |
0,991 |
4,98 |
Степенная модель, |
0,967 |
4,39 |
Наиболее хорошо исходные данные аппроксимирует модель с квадратным корнем. Но в данном случае, так как индексы детерминации линейной модели и модели с квадратным корнем отличаются всего на 0,004, то вполне можно обойтись более простой линейной функцией.
2. Спецификация модели. Отбор факторов при построении множественной регрессии.
Парная регрессия может дать
хороший результат при
Такого рода уравнение может использоваться при изучении потребления. Тогда коэффициенты - частные производные потребления по соответствующим факторам :
в предположении, что все остальные постоянны.
В 30 – е гг. ДЖ. Кейнс сформулировал свою гипотезу потребительской функции. С того времени исследователи неоднократно обращались к проблеме ее совершенствования. Современная потребительская функция чаще всего рассматривается как модель вида
С – потребление, y – доход, Р – цена, индекс стоимости жизни, Ь – наличные деньги, Z – ликвидные активы.
При этом 0< <1.
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:
1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.
2. Факторы не должны быть
Включение в модель факторов
с высокой интеркорреляцией, может
привести к нежелательным последствиям
– система нормальных уравнений
может оказаться плохо
Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Так, в уравнении предполагается, что факторы и независимы друг от друга, т. е. . Тогда можно говорить, что параметр измеряет силу влияния фактора на результат при неизменном значении фактора . Если , то с изменением фактора фактор не может оставаться неизменным. Отсюда и нельзя интерпретировать как показатели раздельного влияния и на .
Пример
Рассмотрим регрессию
себестоимости единицы
Коэффициент регрессии при переменной показывает, что с ростом производительности труда на 1 ед. себестоимость единицы продукции снижается в среднем на 10 руб. при постоянном уровне оплаты труда. Вместе с тем параметр при нельзя интерпретировать как снижение себестоимости единицы продукции за счет роста заработной платы. Отрицательное значение коэффициента регрессии при переменной в данном случае обусловлено высокой корреляцией между и : ( ). Потому роста заработной платы при неизменности производительности труда быть не может.
Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором m факторов, то для нее рассчитывается показатель детерминации , который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии m факторов. Влияние других, не учтенных в модели факторов, оценивается как 1- с соответствующей остаточной дисперсией .
При дополнительном включении в регрессию m +1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:
Если же этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним фактором. Так, если для регрессии, включающей пять факторов, коэффициент детерминации 0,857 и включение шестого фактора дало коэффициент детерминации 0,858, то вряд ли целесообразно дополнительно включать в модель этот фактор.
Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по критерию Стьюдента.
Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют статистики для параметров регрессии.
Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если 0,7. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
Наибольшие трудности
в использовании аппарата множественной
регрессии возникают при
Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:
1. Затрудняется интерпретация
параметров множественной
2. Оценки параметров
ненадежны, обнаруживают
Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.
Существует ряд подходов
преодоления сильной
Одним из путей учета внутренней корреляции факторов является переход к совмещенным уравнениям регрессии, т.е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если y = f ( , , ), то возможно построение следующего совмещенного уравнения:
y = a +
Рассматриваемое уравнение включает взаимодействие первого порядка (взаимодействие двух факторов). Возможно включение в модель и взаимодействий более высокого порядка, если будет доказана их статистическая значимость по F -критерию Фишера, но, как правило, взаимодействия третьего и более высоких порядков оказываются статистически незначимыми.
Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии соответственно к разным методикам. В зависимости от того, какая методика построения уравнения регрессии принята, меняется алгоритм ее решения на ЭВМ.