Моделирование зависимости общих расходов населения от наблюдаемых доходов

Автор работы: Пользователь скрыл имя, 22 Ноября 2013 в 12:29, курсовая работа

Краткое описание

Цель работы заключается в моделировании зависимости общих расходов населения от наблюдаемых доходов, применение данной модели на примере Республики Беларусь. Основные задачи курсовой работы:
- определить статьи доходной и расходной частей баланса;
- изучить принципы регрессионного анализа;
- проанализировать построенную зависимость общих расходов от наблюдаемых доходов;
Объектом исследования являются общие расходы населения и его наблюдаемые доходы.

Содержание

ВВЕДЕНИЕ………………………………………………………………………4
1 Баланс денежных доходов и расходов населения……………………………5
Доходная часть баланса……………………………………………………...5
Расходная часть баланса……………………………………………………..7
Моделирование зависимости общих расходов населения от
наблюдаемых доходов…………………………………………………………10
2.1 Взаимосвязь экономических переменных………………………………..10
2.2 Суть регрессионного анализа……………………………………………..13
2.3 Парная линейная регрессия…………………………………………………17
3 Моделирование зависимости общих расходов населения от
наблюдаемых доходов на примере Республике Беларусь……………………23
ЗАКЛЮЧЕНИЕ………………………………………………………………….27
Список использованных источников…………………………………………...28

Вложенные файлы: 4 файла

МИНИСТЕРСВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ.docx

— 283.42 Кб (Скачать файл)

 

 

2.2 Суть регрессионного  анализа

 

 

Можно указать два варианта рассмотрения взаимосвязей между двумя переменными X и Y. В первом случае обе переменные считаются равноценными в том смысле, что они не подразделяются на первичную и вторичную (независимую и зависимую) переменные. Основным в этом случае является вопрос о наличии и силе взаимосвязи между этими переменными. Например, между ценой товара и объемом спроса на него, между урожаем картофеля и урожаем зерна, между интенсивностью движения и числом аварий. При исследовании силы линейной зависимости между такими переменными мы попадаем в область корреляционного анализа, основной мерой которого является коэффициент корреляции Вполне вероятно, что связь в этом случае вообще не носит направленного характера. Например, урожайность картофеля и зерновых обычно изменяется в одном и том же направлении. Однако очевидно, что ни одна из этих переменных не является определяющей. Аналогичным образом будет построена взаимосвязь и интересующих нас показателей совокупных доходов и расходов. [4]

Другой вариант рассмотрения взаимосвязей выделяет одну из величин как независимую (объясняющую), а другую - как зависимую (объясняемую). В этом случае изменение первой из них может служить причиной для изменения другой. Например, рост дохода ведет к увеличению потребления. Рост цены - к снижению спроса. Снижение процентной ставки увеличивает инвестиции. Увеличение обменного курса валюты сокращает объем чистого экспорта и т. д. Однако такая зависимость не является однозначной в том смысле, что каждому конкретному значению объясняющей переменной (набору объясняющих переменных) может соответствовать не одно, а множество значений из некоторой области. Другими словами, каждому конкретному значению объясняющей переменной (набору объясняющих переменных) соответствует некоторое вероятностное распределение зависимой переменной (рассматриваемой как случайные величины). Поэтому анализируют, как объясняющая(ие) переменная(ые) влияет(ют) на зависимую переменную "в среднем". Зависимость такого типа, выражаемая соотношением

 

 М(Y|х) = f (х)      (1)

 

где М(Y|х) – матожидание значений парной регрессии Y на Х;

       X - независимая (объясняющая) переменная (регрессор),

       Y - зависимая (объясняемая) переменная. [5, с. 151]

 

При рассмотрении зависимости двух случайных величин говорят о парной регрессии. Зависимость же нескольких переменных, выражаемая функцией (2) – множественная регрессия.

 

М(Y|х1,x 2, …, xm) = f (х1,x 2, …, xm)   (2)

 

где   М(Y|х1,x 2, …, xm) – матожидание значений множественной линейной регрессии;

         Y - зависимая (объясняемая) переменная.

         (х1,x 2, …, xm) – набор независимых (объясняющих) переменных (регрессоров). [5, с. 152]

 

Термин регрессия (движение назад, возвращение в прежнее состояние) был введен Фрэнсисом Галтоном в конце XIX века при анализе зависимости между ростом родителей и ростом детей. Галтон заметил, что рост детей у очень высоких родителей в среднем меньше, чем средний рост родителей. У очень низких родителей, наоборот, средний рост детей выше. И в том и в другом случае средний рост детей стремится (возвращается) к среднему росту людей в данном регионе. Отсюда и выбор термина, отражающего такую зависимость.

В настоящее время под регрессией понимается функциональная зависимость  между объясняющими переменными  и условным математическим ожиданием (средним значением) зависимой переменной, которая строится с целью предсказания (прогнозирования) этого среднего значения при фиксированных значениях первых.

Для отражения того факта, что реальные значения зависимой переменной не всегда совпадают с ее условными математическими ожиданиями и могут быть различными при одном и том же значении объясняющей переменной (наборе объясняющих переменных), фактическая зависимость должна быть дополнена некоторым слагаемым e, которое, по существу, является случайной величиной и указывает на стохастическую суть зависимости. Из этого следует, что связи между зависимой и объясняющей(ими) переменными выражаются соотношениями (3) и (4), называемыми регрессионными моделями (уравнениями):

 

Y = М(Y|х) + e.                        (3)

Y = М (Y|х1,x 2, …, xm) + e                       (4)

 

где  М(Y|х) – матожидание значений парной регрессии Y на Х;

       М(Y|х1,x 2, …, xm) – матожидание значений множественной линейной регрессии;

        e - некоторая случайная величина, указывающая на стохастическую суть зависимости. [5, с. 152]

 

Возникает вопрос, в чем  причина обязательного присутствия  в регрессионных моделях случайного фактора (отклонения). Этому может быть достаточно много объяснений, среди которых выделим наиболее существенные:

  • Невключение в модель всех объясняющих переменных. Любая регрессионная (в частности, эконометрическая) модель является упрощением реальной ситуации. Реальная ситуация всегда представляет собой сложнейшее переплетение различных факторов, многие из которых в модели не учитываются, что порождает отклонение реальных значений зависимой переменной от ее модельных значений. Проблема здесь ещё в том, что никогда заранее неизвестно, какие факторы при создавшихся условиях действительно являются определяющими, а какими можно пренебречь. Здесь уместно отметить, что в ряде случаев учесть непосредственно какой-то фактор нельзя в силу невозможности получения по нему статистических данных Например, величина сбережений домохозяйств может определяться не только доходами его членов, но и, например, их здоровьем, информация о котором в цивилизованных странах составляет врачебную тайну и не раскрывается. Кроме того, ряд факторов носит принципиально случайный характер (например, погода), что добавляет неоднозначности при рассмотрении некоторых моделей (например, модель, прогнозирующая объем урожая).
  • Неправильный выбор функциональной формы модели. Из-за слабой изученности исследуемого процесса, либо из-за его переменчивости может быть неверно подобрана функция, его моделирующая. Это. безусловно, скажется на отклонении модели от реальности, что отразится на величине случайного члена. Кроме того, неверным может быть подбор объясняющих переменных
  • Агрегирование переменных. Во многих моделях рассматриваются зависимости между факторами, которые сами представляют сложную комбинацию других, более простых переменных. Например, при рассмотрении в качестве зависимой переменной совокупного спроса проводится анализ зависимости, в которой объясняемая переменная является сложной композицией индивидуальных спросов. оказывающих на нее определенное влияние помимо факторов, учитываемых в модели. Это может оказаться причиной отклонения реальных значений от модельных.
  • Ошибки измерений. Какой бы качественной ни была модель, ошибки измерений переменных отразятся на несоответствии модельных значений эмпирическим данным, что также отразится на величине случайного члена.
  • Ограниченность статистических данных. Зачастую строятся модели, выражаемые непрерывными функциями. Но для этого используется набор данных, имеющих дискретную структуру Это несоответствие находит также свое выражение в случайном отклонении
  • Непредсказуемость человеческого фактора. Эта причина может "испортить" самую качественную модель. Действительно, при правильном выборе формы модели, скрупулезном подборе объясняющих переменных все равно невозможно спрогнозировать поведение каждого индивидуума.

Таким образом, случайный член является отражением влияния всех описанных  выше причин и не только их. Этот список может быть дополнен.

Задача построения качественного  уравнения регрессии, соответствующего эмпирическим данным и целям исследования, является достаточно сложным и многоступенчатым процессом. Его можно разбить на три этапа:

  • выбор формулы уравнения регрессии:
  • определение параметров выбранного уравнения:
  • анализ качества уравнения и поверка адекватности уравнения эмпирическим данным, совершенствование уравнения.

Выбор формулы связи переменных называется спецификацией уравнения регрессии. В случае парной регрессии выбор формулы обычно осуществляется по графическому изображению реальных статистических данных в виде точек в декартовой системе координат, которое называется корреляционным полем (диаграммой рассеивания) (Рисунок 1).

 

 

Рисунок 1- Корреляционные поля

Примечание – Источник: [5, с. 158]

 

На рис 1 представлены три ситуации:

     На графике 1.а   взаимосвязь между X и Y близка к линейной, и прямая 1 достаточно хорошо соответствует эмпирическим точкам. Поэтому в данном случае в качестве зависимости между X и У целесообразно выбрать линейную функцию: Y = b0 + b1Х.

     На графике 1.б реальная  взаимосвязь между X и Y. скорее всего, описывается квадратичной функцией: Y = аx2 + bx + с (линия 2). и какую бы мы не провели прямую (например, линия 1), отклонения точек наблюдений от нее будут существенными и неслучайными.

     На графике 1.в явная  взаимосвязь между X и Y отсутствует. Какую бы мы не выбрали форму связи, результаты ее спецификации и параметризации (определение коэффициентов уравнения) будут неудачными. В частности, прямые 1 и 2, проведенные через центр «облака» наблюдений и имеющие противоположный наклон, одинаково плохи для того, чтобы делать выводы об ожидаемых значениях переменной Y по значениям переменной X.

 

 

 

 

    1.  Парная линейная регрессия

 

 

Если функция регрессии линейна, то речь ведут о линейной регрессии. Модель линейной регрессии является наиболее распространенным (и простым) уравнением зависимости между экономическими переменными. Кроме того, построенное линейное уравнение может быть начальной точкой эконометрического анализа.

Линейная регрессия (теоретическое линейное уравнение регрессии) представляет собой линейную функцию между условным математическим ожиданием М(Y|х=xi) зависимой переменной Y и одной объясняющей переменной X.

 

М(Y|х=xi) = b0+b1xj                    (5)

 

где М(Y|х=xi) – условное математическое ожидание зависимой переменной Y и одной объясняющей переменной X;

      b0 и b1 - теоретические параметры уравнения (коэффициенты регрессии). [5, с. 161]

 

Отметим, что принципиальной в данном случае является линейность по параметрам b0 и b1 уравнения.

Для отражения того факта, что каждое индивидуальное значение уi отклоняется от соответствующего условного математического ожидания, необходимо ввести в соотношение (5) случайное слагаемое (ei ), получив тем самым теоретическую регрессионную модель (6): 

 

уi = М(Y|х=xi) + ei = b0+b1xj +ei             (6)

 

где  уi – индивидуальное значение зависимой переменной Y;

       М(Y|х=xi) - – условное математическое ожидание зависимой переменной Y и одной объясняющей переменной X;

       b0 и b1 - теоретические параметры уравнения (коэффициенты регрессии).

       ei – некоторое случайное отклонение [5, с. 161]

 

Следовательно, индивидуальные значения уi представляются в виде суммы двух компонент - систематической (b0+b1xj) и случайной (ei). В общем виде теоретическую линейную регрессионную модель будем представлять в виде

 

Y = b0+ b1X +e (7)

 

где Y – зависимая переменная уравнения;

       b0 и b1 - теоретические параметры уравнения (коэффициенты регрессии);

       e - случайное отклонение. [5, с. 162]

 

Для определения значений теоретических  коэффициентов регрессии необходимо знать и использовать все значения переменных X и Y генеральной совокупности, что практически невозможно.

Таким образом, задачи линейного регрессионного анализа состоят в том, чтобы по имеющимся статистическим данным (хi, уi), i=1,2,…n. переменных X и Y:

а) получить наилучшие оценки неизвестных параметров b0 и b1;

б) проверить статистические гипотезы о параметрах модели;

в) проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).

Следовательно, по выборке ограниченного  объема мы сможем построить так называемое эмпирическое уравнение регрессии (8)

 

yi* =b0+b1х (8)

 

где yi* - оценка условного математического ожидания М(Y|х=xi);

       b0, b1- оценки неизвестных параметров b0 и b1, называемые эмпирическими коэффициентами регрессии. [5, с. 163]

 

Следовательно, в конкретном случае

 

yi = bo + b1xi +ei  (9)

 

где уi – индивидуальное значение зависимой переменной Y;

       b0, b1- оценки неизвестных параметров b0 и b1, называемые эмпирическими коэффициентами регрессии.

       ei  - оценка теоретического случайного отклонения ei. [5, с. 163]

 

В силу несовпадения статистической базы для генеральной совокупности и выборки оценки b0 и b1 практически всегда отличаются от истинных значений коэффициентов b0 и b1, что приводит к несовпадению эмпирической и теоретической линий регрессии. Различные выборки из одной и той же генеральной совокупности обычно приводят к определению отличающихся друг от друга оценок. Возможное соотношение между теоретическим и эмпирическим уравнениями регрессии схематично изображено на рис. 2.

 

 

Рисунок 3 - Возможное соотношение  между теоретическим и эмпирическим уравнениями регрессии

Примечание – Источник: [5, с. 164]



 

Задача состоит в том, чтобы  по конкретной выборке (xi, yi), i = 1,2,…, n найти оценки b0 и b1 неизвестных параметров b0 и b1 так, чтобы построенная линия регрессии являлась бы наилучшей в определенном смысле среди всех других прямых.  Другими словами, построенная прямая Y* = b0 +b1Х  должна быть "ближайшей" к точкам наблюдений по их совокупности. Мерами качества найденных оценок могут служить определенные композиции отклонений еi, i = 1,2,…,n.  Например, коэффициенты b0 и b1 эмпирического уравнения регрессии могут быть оценены, исходя из условия минимизации одной из следующих сумм:

 

 

||||

 

 

Однако первая сумма не может  быть мерой качества найденных оценок в силу того, что существует бесчисленное количество прямых (в частности, Y = `у), для которых Sei =0. 

Метод определения оценок коэффициентов  из условия минимизации второй суммы называется методом наименьших модулей (МНМ).

Все же самым распространенным и  теоретически обоснованным является метод  нахождения коэффициентов, при котором  минимизируется сумма квадратов  отклонений. Он получил название метод наименьших квадратов (МНК). Этот метод оценки является наиболее простым с вычислительной точки зрения. Кроме того, оценки коэффициентов регрессии, найденные МНК при определенных предпосылках, обладают рядом оптимальных свойств. Простота и достаточная разработанность данного метода обусловила применение его для расчёта всех неизвестных параметров регрессии, а также непосредственного её построения и анализа полученных результатов.

Структура денежных расходов РБ за 2005.docx

— 12.67 Кб (Просмотреть документ, Скачать файл)

Структура денежных доходов и расходов РБ за 2005.docx

— 12.69 Кб (Просмотреть документ, Скачать файл)

Приложение 1.docx

— 13.03 Кб (Просмотреть документ, Скачать файл)

Информация о работе Моделирование зависимости общих расходов населения от наблюдаемых доходов