Автор работы: Пользователь скрыл имя, 28 Ноября 2013 в 21:17, курсовая работа
В современном обществе статистика стала одним из важнейших инструментов управления экономическими процессами. Она собирает информацию, характеризующую развитие экономики страны, культуры и жизненного уровня народа. С помощью статистической методологии вся полученная информация обобщается, анализируется и в результате дает возможность увидеть стройную систему взаимосвязей в экономике, яркую картину и динамику развития, позволяет делать международные сопоставления.
Введение……………………………………………………………………………….3
1.Теоретическая часть………….………………………………………………..……5
2.Расчетная часть………………………………………………………………..……19
3.Аналитическая часть……………………………………………………………….37
Заключение…………………………………………………………………………...47
Литература……………………………………………………………………………48
Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации факторного признака x на результативный y. Цель данной работы - овладение теорией и практикой парной корреляции, как исходного этапа познания других приёмов и методов изучения корреляционной связи. В качестве иллюстрации будем использовать задания расчётной части, а именно корреляционную связь Товарооборота и Численности населения в выбранных городах условного региона.
При изучении связи показателей применяются различного вида уравнения прямолинейной и криволинейной связи.
Так, при анализе прямолинейной
зависимости применяется
ух = а0 + а1х,
где ух – теоретические значения результативного признака;
х – факторный признак;
а0 и а1 – параметры уравнения связи
При криволинейной зависимости применяется ряд математических функций:
полулогарифмическая ух = а0 + а1 lg x;
показательная yx = a0 + a1x;
степенная yx = a0 xa ;
параболическая yx = a0 + a1 x + a2 x2;
гиперболическая yx = a0 + a1
и другие[4]. Ниже будет рассмотрен критерий выбора между прямолинейной и криволинейной формами связи.
Решение математических уравнений связи состоит в вычислении по исходным данным их параметров. Это осуществляется способом выравнивания эмпирических данных методом наименьших квадратов. В основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных уi от выравненных yx :
Для прямой:
.
Приравнивая к нулю частные производные этой функции по параметрам a0 и a1 получают систему двух нормальных уравнений
В общем виде решение системы следующее:
Параметры a0 и a1 можно исчислять и иным способом, при котором результат остаётся тем же:
Определив значения a0 и a1, подставляем их в уравнение связи и находим значения ŷ, которые зависят только от заданного значения x.
Параметр а1 называется коэффициентом регрессии и показывает изменения результативного признака при изменении факторного признака на единицу. Параметр а0 не имеет экономического содержания, так как может принимать отрицательные значения.
Часто исследуемые признаки имеют разные единицы измерения, поэтому для оценки влияния факторного признака на результативный применяется коэффициент эластичности. Он вычисляется для каждой точки и в среднем для всей совокупности. Теоретический коэффициент эластичности вычисляют по формуле:
где - первая производная уравнения регрессии ух.
Средний коэффициент эластичности для уравнения прямой вычисляется так:
Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на один процент.
1.2.1.2. Оценка качества модели.
Адекватность регрессионной модели фактическим статистическим данным очень важна для практического применения. В большинстве случаев анализируется для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции (параметры уравнения регрессии, коэффициенты корреляции и детерминации) могут быть искажены действием случайных факторов. Поэтому требуется проверить насколько данные показатели характерны для всей генеральной совокупности.
В случае малых выборок (при объёме выборки n ≤ 30) необходимо проверить статистическую значимость корреляционной связи признаков, что позволяет количественно оценить, насколько выявленная связь между факторным и результативным признаками носит неслучайный характер, то есть насколько она является типичной, существенной для изучаемого явления.
Значимость коэффициентов простой линейной регрессии осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчётные (фактические) значения t-критерия:
для параметра а0 |
для параметра а1 |
|
где - среднее квадратическое отклонение результативного признака y от выравненных значений ;
- среднее квадратическое
Расчётные значения t-критерия сравнивают с критическими, которые определяют по таблице Стьюдента при определённом уровне значимости α и числом степеней свободы вариации υ=n-2. В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Если tрасч>tтабл, то параметр признаётся значимым, и гипотеза о случайности параметров отвергается.
Изучение вариации (колеблемости, рассеивания) признака по всей совокупности в целом, предусматривает изучение вариации для каждой из составляющих ее групп, а также между этими группами. В простейшем случае, когда совокупность разбита на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.
Общая дисперсия измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака (хi) от общей средней величины и может быть вычислена как:
1. простая дисперсия 2. взвешенная дисперсия
При выполнении задания расчётной части мы рассчитали общую и внутригрупповую дисперсию результирующего признака по формуле простой дисперсии (табл.9).
Межгрупповая дисперсия (факторная) характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:
Межгрупповая дисперсия в
Внутригрупповая дисперсия (частная, остаточная, случайная) отражает случайную вариацию неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы (хi) от средней арифметической этой группы (xср) (групповой средней) и может быть исчислена как:
1. простая дисперсия 2. взвешенная дисперсия
На основании внутригрупповой дисперсии по каждой группе можно определить общую среднюю из внутригрупповых дисперсий:
Согласно правилу сложения дисперсий, общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.
Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак. Так, решая задание 2 расчётной части, мы получили:
Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации - показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:
При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи – единице. В примере , что означает детерминированность на 93,2% вариации Товарооборота в городах вариацией численности Численности населения, связь близка к функциональной, так как лишь 6,8% вариации результирующего признака обусловлено влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение – это корень квадратный из эмпирического коэффициента детерминации:
Он показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.
Эмпирическое корреляционное отношение, рассчитанное в примере, составляет 0,965, что характеризует связь изучаемых параметров как весьма тесную и близкую к функциональной.
Для оценки тесноты связи при любой форме связи (как линейной, так и нелинейной) пользуются теоретическим корреляционным отношением, которое определяет отношение среднего квадратического отклонения выровненных (вычисленных по уравнению регрессии) значений результативного признака к среднему квадратическому отклонению эмпирических (фактических) значений результативного признака:
η=
где - межгрупповая дисперсия результативного признака y, обусловленная влиянием только фактора x;
- общая дисперсия признака y, обусловленная влиянием на y всех факторов, включая x.
Теоретическое корреляционное отношение изменяется от 0 до 1. Чем ближе корреляционное отношение к единице, тем теснее связь между признаками, и соответственно, модель считается адекватной фактическим данным.
Степень тесноты связи между факторными значениями x и расчётными результативными значениями y оценивают с помощью индекса корреляции R по формуле ,
где - остаточная дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтённых факторов. Индекс корреляции принимает значения в пределах 0 ≤ R ≤ 1. Если R близок к единице, то связь между признаками хорошо описывается избранным уравнением корреляционной зависимости; если R равен или близок к нулю, то связи между признаками либо нет, либо связь есть, но она не может быть охарактеризована выбранным уравнением корреляционной связи.
Подкоренное выражение индекса корреляции представляет собой коэффициент детерминации R2, показывающий, какая часть общей вариации расчётных (теоретических) значений признака y объясняется вариацией фактора x.
При линейной форме уравнения корреляционной связи применяется другой показатель тесноты связи признаков – линейный коэффициент корреляции, вычисляемый по формуле:
Данный коэффициент принимает значения в пределах -1 ≤ r ≤ 1. Чем ближе│r│к 1, тем теснее связь и больше сила связи между признаками; если r = 0, то связь отсутствует; если r = ±1, то связь – функциональная. Знак при r указывает на направление связи: знак «+» соответствует прямолинейной зависимости, а знак «–» – обратной.
При наличии прямолинейной связи
значения теоретического корреляционного
отношения η и линейного
При небольшом объёме статистической совокупности показатели тесноты связи могут искажаться. Поэтому необходимо проверять их существенность, чтобы в дальнейшем выводы по результатам выборки можно было распространять на генеральную совокупность. Для того чтобы оценить значимость коэффициента корреляции r, необходимо рассчитать t-критерий Стьюдента, применяемый при t-распределении, отличном от нормального. При линейной однофакторной связи t-критерий рассчитывается по формуле:
tрасч
= r
где (n-2) – число степеней свободы при заданном уровне значимости α и объёме выборки n. Затем значение tрасч сравнивается с табличным: если оно превосходит табличное значение критерия, то гипотеза о случайности найденного значения коэффициента корреляции отклоняется.
Линейный коэффициент корреляции имеет важное значение для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному.
Информация о работе Статистический анализ влияния численности населения на объём товарооборота