Модель парной регрессии

Автор работы: Пользователь скрыл имя, 29 Апреля 2013 в 07:47, контрольная работа

Краткое описание

В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии. Любое эконометрическое исследование начинается со спецификации модели, т. е. с формулировки вида модели, исходя из соответствующей теории связи между переменными. Иными словами, исследование начинается с теории, устанавливающей связь между явлениями.

Вложенные файлы: 1 файл

эконометрика.docx

— 132.90 Кб (Скачать файл)

 

 

Модель парной регрессии

 

В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.

Простая регрессия представляет собой регрессию между двумя  переменными — у и х, т. е. модель вида

где у — зависимая  переменная (результативный признак);

х - независимая, или  объясняющая, переменная (признак-фактор).

Любое эконометрическое исследование начинается со спецификации модели, т. е. с формулировки вида модели, исходя из соответствующей теории связи  между переменными. Иными словами, исследование начинается с теории, устанавливающей связь между явлениями.

Прежде всего из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Предположим, что выдвигается гипотеза о том, что величина спроса у на товар А находится в обратной зависимости от цены х, т. е. . В этом случае необходимо знать, какие остальные факторы предполагаются неизменными, возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.

Уравнение простой регрессии  характеризует связь между двумя  переменными, которая проявляется  как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В уравнении регрессии  корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых:

где — фактическое значение результативного признака;

 — теоретическое значение  результативного признака, найденное  исходя из соответствующей математической  функции связи у и х, т. е. из уравнения регрессии;

 — случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.

Случайная величина е  называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.

Поэтому от правильно  выбранной спецификации модели зависит  величина случайных ошибок: они тем  меньше, чем в большей мере теоретические  значения результативного признака ух подходят к фактическим данным у.

К ошибкам спецификации будут относиться не только неправильный выбор той или иной математической функции для ух, но и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование  парной регрессии вместо множественной.

Наряду с ошибками спецификации могут иметь место  ошибки выборки, поскольку исследователь  чаще всего имеет дело с выборочными  данными при установлении закономерной связи между признаками. Ошибки выборки  имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики.

Использование временной  информации также представляет собой  выборку из всего множества хронологических  дат. Изменив временной интервал, можно получить другие результаты регрессии.

Наибольшую опасность  в практическом использовании методов  регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки — увеличивая объем исходных данных, то ошибки измерения  практически сводят на нет все  усилия по количественной оценке связи  между признаками. Особенно велика роль ошибок измерения при исследовании на макроуровне. Так, в исследованиях  спроса и потребления в качестве объясняющей переменной широко используется «доход на душу населения». Вместе с  тем статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов.

Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам  спецификации модели.

В парной регрессии выбор  вида математической функции ух =f(x) может быть осуществлен тремя методами:

      • графическим;
      • аналитическим, т. е. исходя из теории изучаемой взаимосвязи;
      • экспериментальным.

При изучении зависимости  между двумя признаками графический  метод подбора вида уравнения  регрессии достаточно нагляден. Он основан на поле корреляции.

Линейная регрессия описывается  уравнением

Различают два класса нелинейных регрессий:

      • регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;
      • регрессии, нелинейные по оцениваемым параметрам.

Примером нелинейной регрессии по включаемым в нее  объясняющим переменным могут служить  следующие функции:

      • полиномы разных степеней
      • равносторонняя гипербола .

К нелинейным регрессиям по оцениваемым параметрам относятся  функции:

      • степенная
      • показательная
      • экспоненциальная

 

 

Фиктивный переменные

 

Может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В отечественной литературе можно встретить термин «структурные переменные».

Рассмотрим применение фиктивных переменных для функции  спроса. Предположим, что по группе лиц мужского и женского пола изучается  линейная зависимость потребления  кофе от цены. В общем виде для  совокупности обследуемых уравнение регрессии имеет вид:

где у — количество потребляемого кофе;

х — цена.

Аналогичные уравнения  могут быть найдены отдельно для  лиц мужского пола: и женского пола: .

Различия в потреблении  кофе проявятся в различии средних  и . Вместе с тем сила влияния х на у может быть одинаковой, т. е. . В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения и и вводя фиктивные переменные, можно прийти к следующему выражению:

где и — фиктивные переменные, принимающие значения:

В общем уравнении  регрессии зависимая переменная у рассматривается как функция не только цены х, но и пола ( , ). Переменная z рассматривается как дихотомическая переменная, принимающая всего два значения: 1 и 0. При этом когда , то и, наоборот.

Для лиц мужского пола, когда и , объединенное уравнение регрессии составит: , а для лиц женского пола, когда и , объединенное уравнение регрессии составит: . Иными словами, различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии: . Параметр b является общим для всей совокупности лиц, как для мужчин, так и для женщин.

Следует иметь в виду, что при введении фиктивных переменных и в модель применение МНК для оценивания параметров и приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в данном уравнении появляется свободный член, т. е. уравнение примет вид

Предполагая при параметре А независимую переменную, равную 1, имеем матрицу исходных данных:

В рассматриваемой матрице  существует линейная зависимость между  первым, вторым и третьим столбцами: первый равен сумме второго и  третьего столбцов. Поэтому матрица  исходных факторов вырождена. Выходом  из создавшегося затруднения может  явиться переход к уравнениям

т. е. каждое уравнение  включает только одну фиктивную переменную или

Предположим, что определено уравнение

Где - принимает значения 1 для мужчин и 0 для женщин.

Теоретические значения размера потребления кофе для  мужчин будут получены из уравнения

Для женщин соответствующие  значения получим из уравнения

Сопоставляя эти результаты, видим, что различия в уровне потребления  мужчин и женщин состоят в различии свободных членов данных уравнений: А - для женщин и А + А1 — для мужчин.

 

 

 

Системы линейных одновременных уравнений.

 

Сложные системы и процессы в них, как правило, описываются  не одним уравнением, а системой уравнений. При этом между переменными  имеются связи, так что по крайней мере некоторые из таких связей между переменными требуют корректировки МНК для адекватного оценивания параметров модели (параметров системы уравнений). Удобно сначала рассмотреть оценивание системы, в которой уравнения связаны только благодаря корреляции между ошибками (остатками) в разных уравнениях системы. Такая система называется системой внешне несвязанных между собой уравнений:

В такой системе каждая зависимая переменная рассматривается как функция одного и того же набора факторов; правда, этот набор факторов вовсе не обязан быть представлен весь целиком во всех уравнениях системы, а может варьировать от одного уравнения к другому. Можно рассматривать каждое уравнение такой системы независимо от остальных и применять для оценивания его параметров МНК. Но в практически важных задачах описываемые отдельными уравнениями зависимости представляют объекты и взаимодействие между этими объектами, которые находятся в одной общей среде. Наличие этой единой экономической среды обусловливает взаимосвязи между объектами и соответствующее взаимодействие, за что отвечают в данном случае остатки (корреляция между ошибками). Поэтому объединение уравнений в систему и применение обобщенного метода наименьших квадратов (ОМНК) для ее решения существенно повышает эффективность оценивания параметров уравнений.

Более общей является модель так называемых рекурсивных уравнений , когда зависимая переменная одного уравнения выступает в роли фактора х, оказываясь в правой части другого уравнения системы. При этом каждое последующее уравнение системы (зависимая переменная в правой части этих уравнений) включает в качестве факторов все зависимые переменные предшествующих уравнений наряду с набором их собственных факторов х. Здесь опять каждое уравнение системы может рассматриваться независимо, но тоже эффективнее рассматривать взаимосвязь через остатки и применять ОМНК:

Наконец, общим и самым  полным является случай системы взаимосвязанных уравнений. Такие уравнения еще называют одновременными, или взаимозависимыми. Также это система совместных одновременных уравнений. Здесь уже одни и те же переменные рассматриваются одновременно как зависимые в одних уравнениях и независимые — в других. Такая форма модели называется структурной формой модели. Теперь уже нельзя рассматривать каждое уравнение системы по отдельности (как самостоятельное), так что для оценки параметров системы традиционный МНК неприменим!

Для этой структурной формы  модели существенное значение получает деление переменных модели на два  класса: эндогенные переменные — взаимозависимые переменные, которые определяются внутри модели (внутри самой системы) и обозначаются у; экзогенные переменные — независимые переменные, которые определяются вне системы и обозначаются как х. Кроме того, вводится также понятие предопределенных переменных. Под ними понимаются экзогенные переменные системы и лаговые эндогенные переменные системы (лаговые — это переменные, относящиеся к предыдущим моментам времени).

Структурная форма модели в правой части содержит при эндогенных и экзогенных переменных коэффициенты, которые называются структурными коэффициентами модели. Можно представить систему (модель) в другой форме: записать ее как систему, в которой все эндогенные переменные линейно зависят уже только от экзогенных переменных. Иногда практически то же формулируют несколько более общим образом — требуют, чтобы эндогенные переменные линейно зависели только от всех предопределенных переменных системы (т.е. экзогенных и лаговых эндогенных переменных системы). В любом из этих двух случаев такая форма называется приведенной формой модели. Приведенная форма уже ничем внешне не отличается от системы независимых уравнений:

Ее параметры оцениваются  по МНК. После чего несложно оценить и значения эндогенных переменных с помощью значений экзогенных. Но коэффициенты приведенной формы модели являются нелинейными функциями коэффициентов структурной формы модели. Таким образом, получение оценок параметров структурной формы модели по параметрам приведенной формы технически является не столь уж простым.

Нужно отметить также, что  приведенная форма модели аналитически уступает структурной форме модели, т.к. именно в последней имеется  взаимосвязь между эндогенными  переменными. В приведенной форме модели отсутствуют оценки взаимосвязи между эндогенными переменными. С другой стороны, в структурной форме модели в полном виде имеется большее количество параметров, чем в приведенной. И это большее количество параметров, которые требуется определить по меньшему числу определяемых в приведенной форме параметров, невозможно однозначно найти, если только не ввести определенные ограничения на сами структурные коэффициенты.

Информация о работе Модель парной регрессии