Нелинейная регрессия. Корреляция для нелинейной регрессии. Средняя ошибка аппроксимации

Автор работы: Пользователь скрыл имя, 17 Октября 2013 в 20:16, контрольная работа

Краткое описание

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.
Различают два класса нелинейных регрессий:
1) Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, например
полиномы различных степеней – , ;
равносторонняя гипербола – ;
полулогарифмическая функция – .

Содержание

I. Теоретическая часть
1. Нелинейная регрессия. Корреляция для нелинейной регрессии.
Средняя ошибка аппроксимации………………………………………………...3
2. Спецификация модели. Отбор факторов при построении
множественной регрессии………………………………………………………14
II. Практическая часть
Задачи…………………………………………………………………………….20
Список использованной литературы…………………………………………...25

Вложенные файлы: 1 файл

контр эконометрика.doc

— 1.03 Мб (Скачать файл)

Найдем уравнение регрессии:

.

Т.е. получаем следующее  уравнение регрессии: . Теперь заполняем столбцы 8-11 таблицы 3.

Индекс корреляции: ,  а индекс детерминации , который показывает, что 99,1% вариации результативного признака объясняется вариацией признака-фактора, а 0,9% приходится на долю прочих факторов.

Средняя ошибка аппроксимации: показывает, что линия регрессии хорошо приближает исходные данные.

-критерий Фишера: 

значительно превышает  табличное  .

Изобразим на графике исходные данные и линию регрессии:

Для нахождения параметров регрессии  необходимо провести ее линеаризацию, как было показано выше: , где , , , .

Составляем вспомогательную таблицу  для преобразованных данных:

    Таблица 4

 

1

2

3

4

5

6

7

8

9

10

1

0,182

-0,105

-0,019

0,033

0,011

0,8149

0,0851

0,0072

9,46

2

1,131

0,182

0,206

1,280

0,033

1,3747

-0,1747

0,0305

14,56

3

1,668

0,588

0,980

2,781

0,345

1,8473

-0,0473

0,0022

2,63

4

2,001

0,788

1,578

4,006

0,622

2,2203

-0,0203

0,0004

0,92

5

2,262

0,956

2,161

5,116

0,913

2,5627

0,0373

0,0014

1,43

6

2,468

1,065

2,628

6,092

1,134

2,8713

0,0287

0,0008

0,99

7

2,674

1,194

3,193

7,151

1,425

3,2165

0,0835

0,0070

2,53

8

2,929

1,335

3,910

8,576

1,782

3,7004

0,0996

0,0099

2,62

Итого

15,315

6,002

14,637

35,035

6,266

18,608

0,0919

0,0595

35,14

Среднее значение

1,914

0,750

1,830

4,379

0,783

0,0074

4,39

0,846

0,470

0,716

0,221


Найдем уравнение регрессии:

.

Т.е. получаем следующее уравнение регрессии: . После потенцирования находим искомое уравнение регрессии:

.

Заполняем столбцы 7-10 таблицы 4.

Индекс корреляции:

,

а индекс детерминации , который показывает, что 96,7% вариации результативного признака объясняется вариацией признака-фактора, а 3,3% приходится на долю прочих факторов.

Средняя ошибка аппроксимации: показывает, что линия регрессии хорошо приближает исходные данные.

-критерий Фишера:

значительно превышает  табличное .

Изобразим на графике  исходные данные и линию регрессии:

Сравним построенные  модели по индексу детерминации и  средней ошибке аппроксимации:

   Таблица 5

Модель

Индекс детерминации,

(
,
)

Средняя ошибка аппроксимации,

, %

Линейная модель,

0,987

6,52

Полулогарифмическая модель,

0,918

14,51

Модель с квадратным корнем,

0,991

4,98

Степенная модель,

0,967

4,39


Наиболее хорошо исходные данные аппроксимирует модель с квадратным корнем. Но в данном случае, так как индексы детерминации линейной модели и модели с квадратным корнем отличаются всего на 0,004, то вполне можно обойтись более простой линейной функцией.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Спецификация модели. Отбор факторов при построении множественной регрессии.

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Например, при построении модели потребления  того или иного товара от дохода исследователь предполагает, что в каждой группе дохода одинаково влияние на потребление таких факторов, как цена товара, размер, семьи, ее состав. Вместе с тем исследователь никогда не может быть уверен в справедливости данного предположения. Для того чтобы иметь правильное представление о влиянии дохода на потребление, необходимо изучить их корреляцию при неизменном уровне других факторов. Прямой путь решения такой задачи состоит в отборе единиц совокупности с одинаковыми значениями всех других факторов, кроме дохода. Он приводит к планированию эксперимента – методу, который используется в химических, физических, биологических исследованиях.  Поведение некоторых экономических переменных контролировать нельзя, т. е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. построить уравнение множественной регрессии

.

Такого рода уравнение  может использоваться при изучении потребления. Тогда коэффициенты - частные производные потребления по соответствующим факторам :

, …,

в предположении, что  все остальные  постоянны.

В 30 – е гг. ДЖ. Кейнс  сформулировал свою гипотезу потребительской  функции. С того времени исследователи  неоднократно обращались к проблеме ее совершенствования. Современная потребительская функция  чаще всего рассматривается как модель вида

, где

С – потребление, y –  доход, Р – цена, индекс стоимости  жизни, Ь – наличные деньги, Z –  ликвидные активы.

При этом 0< <1.

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Включение в уравнение множественной  регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. Они должны быть количественно  измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2. Факторы не должны быть интеркоррелированы  и тем более находиться в  точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, может  привести к нежелательным последствиям – система нормальных уравнений  может оказаться плохо обусловленной  и повлечь за собой неустойчивость и ненадежность оценок коэффициентов  регрессии.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Так,  в уравнении предполагается, что факторы и независимы друг от друга, т. е. . Тогда можно говорить, что параметр измеряет силу влияния фактора на результат при неизменном значении фактора . Если , то с изменением фактора фактор не может оставаться неизменным. Отсюда и нельзя интерпретировать как показатели раздельного влияния и на .

Пример

Рассмотрим регрессию  себестоимости единицы продукции (руб., ) от заработной платы работника (руб., ) и производительности его труда (ед. в час, ):     .

Коэффициент регрессии  при переменной показывает, что с ростом производительности труда на 1 ед. себестоимость единицы продукции снижается в среднем на 10 руб. при постоянном уровне оплаты труда. Вместе с тем параметр при нельзя интерпретировать как снижение себестоимости единицы продукции за счет роста заработной платы. Отрицательное значение коэффициента регрессии при переменной в данном случае обусловлено высокой корреляцией между и : ( ). Потому роста заработной платы при неизменности производительности труда быть не может.

Включаемые во множественную  регрессию факторы должны объяснить  вариацию независимой переменной. Если строится модель с набором m факторов, то для нее рассчитывается показатель детерминации , который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии m факторов. Влияние других, не учтенных в модели факторов, оценивается как 1-   с соответствующей остаточной дисперсией .

При дополнительном включении в регрессию m +1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:

     и   
.

Если же этого не происходит и данные показатели практически  не отличаются друг от друга, то включаемый в анализ фактор  не улучшает модель и практически является лишним фактором. Так, если для регрессии, включающей пять факторов, коэффициент детерминации 0,857 и включение шестого фактора дало коэффициент детерминации 0,858, то вряд ли целесообразно дополнительно включать в модель этот  фактор.

Насыщение модели лишними  факторами не только не снижает величину остаточной дисперсии и не увеличивает  показатель детерминации, но и приводит к статистической незначимости параметров регрессии по критерию Стьюдента.

Таким образом, хотя теоретически регрессионная модель позволяет  учесть любое число факторов, практически  в этом нет необходимости. Отбор  факторов производится на основе качественного  теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют статистики для параметров регрессии.

Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать  из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если 0,7. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.

Наибольшие трудности  в использовании аппарата множественной  регрессии возникают при наличии  мультиколлинеарности факторов, когда  более чем два фактора связаны  между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих  последствий:

1. Затрудняется интерпретация  параметров множественной регрессии  как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл.

2. Оценки параметров  ненадежны, обнаруживают большие  стандартные ошибки и меняются  с изменением объема наблюдений (не только по величине, но и  по знаку), что делает модель непригодной для анализа и прогнозирования.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Существует ряд подходов преодоления сильной межфакторной корреляции. Самый простой путь устранения мультиколлинеарности состоит в исключении из модели одного или нескольких факторов. Другой подход связан с преобразованием факторов, при котором уменьшается корреляция между ними.

Одним из путей учета  внутренней корреляции факторов является переход к совмещенным уравнениям регрессии, т.е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если y = f ( , , ), то возможно построение следующего совмещенного уравнения:

y = a +

+ε.

Рассматриваемое уравнение  включает взаимодействие первого порядка (взаимодействие двух факторов). Возможно включение в модель и взаимодействий более высокого порядка, если будет  доказана их статистическая значимость по F -критерию Фишера, но, как правило, взаимодействия третьего и более высоких порядков оказываются статистически незначимыми.

Отбор факторов, включаемых в регрессию, является одним из важнейших  этапов практического использования  методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии соответственно к разным методикам. В зависимости от того, какая методика построения уравнения регрессии принята, меняется алгоритм ее решения на ЭВМ.

Информация о работе Нелинейная регрессия. Корреляция для нелинейной регрессии. Средняя ошибка аппроксимации