Автор работы: Пользователь скрыл имя, 13 Апреля 2014 в 17:17, курсовая работа
Цель данной работы: провести статистический анализ окружающей среды на примере Российской Федерации.
Для достижения поставленной цели необходимо решить следующий ряд задач:
1. Рассмотреть теоретические аспекты статистики окружающей среды.
2. Провести статистическую оценку окружающей среды РФ.
3. Определить особенности статистического изучения эффективности природоохранной деятельности.
Корреляционный анализ изучает взаимосвязи показателей и позволяет решить следующие задачи:
1) Оценка тесноты связи между показателями с помощью парных, частных и множественных коэффициентов корреляции.
2) Оценка уравнения регрессии.
Основной предпосылкой корреляционного анализа является необходимость подчинения совокупности значений всех факторных (x1, x2,…xk) и результативного (У) признаков k-мерному нормальному закону распределения или близость к нему.
Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (x1, x2,….xk).
Основной предпосылкой регрессионного анализа является то, что только результативный признак подчиняется нормальному закону распределения, а факторные признаки могут иметь произвольный закон распределения.
Одна из проблем построения уравнения регрессии – это её размерность, т.е. определение числа факторных признаков включаемых в модель, их число должно быть оптимальным. Сокращение размерности модели, за счёт исключения второстепенных несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. Но построение модели малой по размерам, может привести к тому, что она будет не достаточно полно описывать исследуемое явление или процесс.
Построение корреляционно-регрессионных моделей, какими бы сложными они не были, не показывает все причинно-следственные связи. Основой их адекватности является предварительный качественный анализ, основанный на учёте специфики и особенностей сущности исследуемых социально-экономических явлений и процессов.
Корреляционная связь устанавливается между двумя переменными. Возьмем в качестве этих переменных такие показатели как выбросы загрязняющих атмосферу веществ автомобильным транспортом и количество автотранспортов, т.е. попытаемся выяснить, как величина загрязнение атмосферы автомобильным транспортом зависит от их количества. Для проведения анализа необходимо рассматривать данные за 2010-2012 года(Таблица 1).
Таблица 1.
год |
месяц |
количество автотранспортов, тыс.шт |
выбросы загрязняющих атмосферу веществ автомобильным транспортом, тыс. тонн |
год |
месяц |
количество автотранспортов, тыс.шт |
выбросы загрязняющих атмосферу веществ автомобильным транспортом, тыс.тонн | |
2010 |
январь |
3058,2 |
750,4 |
2012 |
январь |
2427,15 |
984,2 | |
февраль |
3120 |
822 |
февраль |
2698,7 |
1005,6 | |||
март |
3120,3 |
1020,4 |
март |
2896,3 |
1009,3 | |||
апрель |
3130,8 |
1062 |
апрель |
3138,55 |
1045,9 | |||
май |
3214,5 |
1076 |
май |
3303,25 |
1068,3 | |||
июнь |
3227,2 |
1098,2 |
июнь |
3325,6 |
1086,5 | |||
июль |
3250 |
1128,25 |
июль |
3446,35 |
1105,3 | |||
август |
3311,7 |
1158,2 |
август |
3470,5 |
1127,6 | |||
сентябрь |
3311,7 |
1180,4 |
сентябрь |
3698 |
1153,6 | |||
октябрь |
3314,5 |
1236,4 |
октябрь |
3986 |
1180 | |||
ноябрь |
3334,1 |
1500,35 |
ноябрь |
4580 |
1198,4 | |||
декабрь |
3334,4 |
1506 |
декабрь |
5489 |
1360,5 | |||
2011 |
январь |
2569 |
717,5 | |||||
февраль |
2770,3 |
758,65 | ||||||
март |
3080,1 |
958,7 | ||||||
апрель |
3114,8 |
1000 | ||||||
май |
3229,3 |
1058,3 | ||||||
июнь |
3250 |
1058,55 | ||||||
июль |
3448,5 |
1082,7 | ||||||
август |
3485 |
1092 | ||||||
сентябрь |
3498 |
1135,2 | ||||||
октябрь |
3569 |
1184,2 | ||||||
ноябрь |
3780 |
1459 | ||||||
декабрь |
4399,2 |
1600 |
Построение модели парной регрессии заключается в нахождении уравнении связи двух показателей у и х, т.е. определяется как повлияет изменение одного показателя на другой.
Уравнение модели парной регрессии можно записать в общем виде: у=(x), где у=зависимый показатель, а х = независимый. В нашем примере х=количество автотранспортов, у=выбросы загрязняющих атмосферу веществ автомобильным транспортом.
Определим вид аналитической функции, которая отразит механизм связи между факторным и результативным признаками и даст количественную оценку этой связи по средней ошибке аппроксимации:
A = ∑|yi - yx| : yi;n100%
линейная форма связи: y = 0.2202 x + 367.9133
A = 3.36;36 100% = 9.32%
нелинейная форма связи:
степенная: y = e0.70119720x0.7762 = 2.01617x0.7762
A = 0.47;36 100% = 1.31%
логарифмическая: y = 849.9117 ln(x) - 5783.7291
A = 3.38;36 100% = 9.38%
показательная: y = e6.3246*e0.000199x = 558.11316*1.0002x
A = 0.48;36 100% = 1.33%
Величина ошибки самая низкая у степенного уравнения, то данное уравнение можно использовать в качестве регрессии, так как точность регрессионной модели будет высоко точной.
Степенное уравнение регрессии имеет вид y = a xb (ln y = lna + blnx + ε)
МНК позволяет определить параметры регрессии:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Система уравнений имеет вид
36a + 292.01 b = 251.89
292.01 a + 2369.41 b = 2043.79
Получаем коэффициенты регрессии: a = 0.7012, b = 0.7762,
Уравнение регрессии:
y = e0.70119720x0.7762 = 2.01617x0.7762
Для расчета параметров регрессии построим расчетную таблицу(Таблица 2).
Таблица 2
ln(x) |
ln(y) |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
8,03 |
6.62 |
6.93 |
0.14 |
0.0959 |
0.00736 |
0.0468 |
8,05 |
6.71 |
6.95 |
0.0813 |
0.0548 |
0.00433 |
0.0349 |
8,05 |
6.93 |
6.95 |
0.00475 |
0.000322 |
0.00432 |
0.00259 |
8,05 |
6.97 |
6.95 |
0.000841 |
0.000376 |
0.00389 |
0.00278 |
8,08 |
6.98 |
6.97 |
0.000253 |
0.000144 |
0.00129 |
0.00172 |
8,08 |
7 |
6.97 |
2.0E-5 |
0.000863 |
0.00103 |
0.0042 |
8,09 |
7.03 |
6.98 |
0.000993 |
0.00259 |
0.000624 |
0.00724 |
8,11 |
7.05 |
6.99 |
0.00333 |
0.00391 |
3.8E-5 |
0.00886 |
8,11 |
7.07 |
6.99 |
0.00588 |
0.00664 |
3.8E-5 |
0.0115 |
8,11 |
7.12 |
6.99 |
0.0151 |
0.0162 |
2.8E-5 |
0.0179 |
8,11 |
7.31 |
7 |
0.1 |
0.0999 |
0 |
0.0432 |
8,11 |
7.32 |
7 |
0.1 |
0.1 |
0 |
0.0437 |
7,85 |
6.58 |
6.8 |
0.18 |
0.0481 |
0.0677 |
0.0333 |
7,93 |
6.63 |
6.85 |
0.13 |
0.0493 |
0.0341 |
0.0335 |
8,03 |
6.87 |
6.94 |
0.0172 |
0.00494 |
0.00619 |
0.0102 |
8,04 |
6.91 |
6.94 |
0.00795 |
0.00135 |
0.00455 |
0.00532 |
8,08 |
6.96 |
6.97 |
0.00106 |
6.6E-5 |
0.000984 |
0.00117 |
8,09 |
6.96 |
6.98 |
0.00104 |
0.000165 |
0.000624 |
0.00185 |
8,15 |
6.99 |
7.02 |
9.4E-5 |
0.00132 |
0.00118 |
0.0052 |
8,16 |
7 |
7.03 |
1.0E-6 |
0.00129 |
0.00201 |
0.00514 |
8,16 |
7.03 |
7.03 |
0.00142 |
0 |
0.00236 |
0 |
8,18 |
7.08 |
7.05 |
0.00639 |
0.000709 |
0.00471 |
0.00376 |
8,24 |
7.29 |
7.09 |
0.0833 |
0.0364 |
0.0159 |
0.0262 |
8,39 |
7.38 |
7.21 |
0.15 |
0.0273 |
0.0772 |
0.0224 |
7,79 |
6.89 |
6.75 |
0.011 |
0.0199 |
0.1 |
0.0204 |
7,9 |
6.91 |
6.83 |
0.00698 |
0.00642 |
0.0445 |
0.0116 |
7,97 |
6.92 |
6.89 |
0.00638 |
0.000837 |
0.0197 |
0.00418 |
8,05 |
6.95 |
6.95 |
0.00196 |
5.0E-6 |
0.00359 |
0.000317 |
8,1 |
6.97 |
6.99 |
0.000533 |
0.000266 |
7.6E-5 |
0.00234 |
8,11 |
6.99 |
7 |
3.8E-5 |
2.2E-5 |
4.0E-6 |
0.000665 |
8,15 |
7.01 |
7.02 |
0.00012 |
0.00023 |
0.00113 |
0.00217 |
Продолжение таблицы 2.
8.15 |
7.03 |
7.03 |
0.000957 |
0 |
0.00165 |
8.8E-5 |
8.22 |
7.05 |
7.08 |
0.00289 |
0.000735 |
0.0108 |
0.00384 |
8.29 |
7.07 |
7.14 |
0.00583 |
0.00393 |
0.0321 |
0.00886 |
8.43 |
7.09 |
7.24 |
0.00843 |
0.024 |
0.1 |
0.0219 |
8.61 |
7.22 |
7.38 |
0.0478 |
0.0285 |
0.25 |
0.0234 |
292.01 |
251.89 |
251.89 |
1.12 |
0.64 |
0.8 |
0.47 |
Рассчитаем средние значения:
x = ∑xi;n = 292.01;36 = 8.11
y = ∑yi;n = 251.89;36 = 7
xy = ∑xiyi;n = 2043.79;36 = 56.77
Из полученных расчетов коэффициента вариации по факторному признаку делаем вывод: совокупность однородная.
Для нелинейных форм регрессии в качестве характеристики силы связи между факторным и результативным признаком следует использовать корреляционное отношение (а не коэффициент прямолинейной корреляции Пирсона).
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
η = ∑y - yx2; ∑yi - y2
η = 0.48;1.12 = 0.66
y - yx2 = 1.12 - 0.64 = 0.48
Коэффициент эластичности находится по формуле:
E = ∂y;∂x x;y = b
E = b = 0.78
Индекс корреляции.
R = 1 - ∑yi - yx2; ∑yi - y2
R = 1 - 0.64;1.12 = 0.66
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y. Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
R = 1 - ∑yi - yx2; ∑yi - y2
Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.
В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].
Индекс детерминации. Чаще всего, давая интерпретацию индекса детерминации, его выражают в процентах.
R2 = 1 - ∑yi - yx2; ∑yi - y2
R2 = 1- 0.64;1.12 = 0.43 т.е. в 43.11 % случаев изменения х приводят к изменению y. Значит, точность подбора уравнения регрессии - средняя. Остальные 56.89 % изменения Y объясняются факторами, не учтенными в модели.
Ошибка аппроксимации.
A = 0.47;36 100% = 1.31%
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Значимость коэффициента корреляции.
tнабл = rxy n-2;1 - r2xy
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если |tнабл| > tкрит — нулевую гипотезу отвергают.
tнабл = 0.66 34;1 - 0.662 = 6.53
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=34 находим tкрит:
tкрит (n-m-1;α/2) = (34;0.025) = 2.021
где m = 1 - количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции
Доверительный интервал для коэффициента корреляции
r - tкрит 1-r2;n; r + tкрит 1-r2;n
0.66 - 2.0211-0.662;36; 0.66 + 2.0211-0.662;36
r(0.46;0.85)
Коэффициент ранговой корреляции Спирмена. Присвоим ранги признаку ei и фактору X. Найдем сумму разности квадратов d2. По формуле вычислим коэффициент ранговой корреляции Спирмена.
p = 1 - 6∑d2;n3-n
Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т. е. одинаковые средние номера; например, вместо одинаковых по порядку третьего и четвертого значений признака будут два ранга по 3,5. В таком случае коэффициент Спирмена вычисляется как:
p = 1 - 6∑d2 - A - B;n3-n-12An3-n-12B
A = 1;12∑A3j - Aj
B = 1;12∑B3k - Bk
j - номера связок по порядку для признака х;
Аj - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
Вk - число одинаковых рангов в k-й связке по у.
Таблица3.
X |
ei |
ранг X, dx |
ранг ei, dy |
(dx - dy)2 |
8.03 |
0.31 |
6 |
34 |
784 |
8.05 |
0.23 |
9 |
33 |
576 |
8.05 |
0.018 |
10 |
10 |
0 |
8.05 |
0.0194 |
11 |
11 |
0 |
8.08 |
0.012 |
13 |
6 |
49 |
8.08 |
0.0294 |
14 |
15 |
1 |
8.09 |
0.0509 |
16.5 |
19 |
6.25 |
8.11 |
0.0625 |
19.5 |
20 |
0.25 |
8.11 |
0.0815 |
19.5 |
24 |
20.25 |
8.11 |
0.13 |
21 |
25 |
16 |
8.11 |
0.32 |
23 |
35 |
144 |
8.11 |
0.32 |
24 |
36 |
144 |
7.85 |
0.22 |
2 |
31 |
841 |
7.93 |
0.22 |
4 |
32 |
784 |
8.03 |
0.0703 |
7 |
22 |
225 |
8.04 |
0.0368 |
8 |
18 |
100 |
8.08 |
0.00814 |
15 |
5 |
100 |
8.09 |
0.0129 |
16.5 |
7 |
90.25 |
8.15 |
0.0363 |
26 |
17 |
81 |
8.16 |
0.0359 |
28 |
16 |
144 |
8.16 |
2.7E-5 |
29 |
1 |
784 |
8.18 |
0.0266 |
30 |
12 |
324 |
8.24 |
0.19 |
32 |
30 |
4 |
8.39 |
0.17 |
34 |
28 |
36 |
7.79 |
0.14 |
1 |
26 |
625 |
7.9 |
0.0801 |
3 |
23 |
400 |
7.97 |
0.0289 |
5 |
14 |
81 |
8.05 |
0.0022 |
12 |
3 |
81 |
8.1 |
0.0163 |
18 |
9 |
81 |
8.11 |
0.00465 |
22 |
4 |
324 |
8.15 |
0.0152 |
25 |
8 |
289 |
8.15 |
0.000618 |
27 |
2 |
625 |
8.22 |
0.0271 |
31 |
13 |
324 |
8.29 |
0.0627 |
33 |
21 |
144 |
8.43 |
0.16 |
35 |
27 |
64 |
8.61 |
0.17 |
36 |
29 |
49 |
|
|
|
8341 |
Информация о работе Статистика окружающей среды на примере Российской Федерации