Статистика окружающей среды на примере Российской Федерации

Автор работы: Пользователь скрыл имя, 13 Апреля 2014 в 17:17, курсовая работа

Краткое описание

Цель данной работы: провести статистический анализ окружающей среды на примере Российской Федерации.
Для достижения поставленной цели необходимо решить следующий ряд задач:
1. Рассмотреть теоретические аспекты статистики окружающей среды.
2. Провести статистическую оценку окружающей среды РФ.
3. Определить особенности статистического изучения эффективности природоохранной деятельности.

Вложенные файлы: 1 файл

ХАД.docx

— 267.53 Кб (Скачать файл)

Корреляционный анализ изучает взаимосвязи показателей и позволяет решить следующие задачи:

1) Оценка тесноты связи между показателями с помощью парных, частных и множественных коэффициентов корреляции.

2) Оценка уравнения регрессии.

Основной предпосылкой корреляционного анализа является необходимость подчинения совокупности значений всех факторных (x1, x2,…xk) и результативного (У) признаков k-мерному нормальному закону распределения или близость к нему.

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (x1, x2,….xk).

Основной предпосылкой регрессионного анализа является то, что только результативный признак подчиняется нормальному закону распределения, а факторные признаки могут иметь произвольный закон распределения.

Одна из проблем построения уравнения регрессии – это её размерность, т.е. определение числа факторных признаков включаемых в модель, их число должно быть оптимальным. Сокращение размерности модели, за счёт исключения второстепенных несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. Но построение модели малой по размерам, может привести к тому, что она будет не достаточно полно описывать исследуемое явление или процесс.

Построение корреляционно-регрессионных моделей, какими бы сложными они не были, не показывает все причинно-следственные связи. Основой их адекватности является предварительный качественный анализ, основанный на учёте специфики и особенностей сущности исследуемых социально-экономических явлений и процессов.

ГЛАВА 3.Корреляционно-регрессионный анализ природных ресурсов РФ

Корреляционная  связь устанавливается между двумя переменными. Возьмем в качестве этих переменных такие показатели как выбросы загрязняющих атмосферу веществ автомобильным транспортом и количество автотранспортов, т.е. попытаемся выяснить, как величина загрязнение атмосферы автомобильным транспортом зависит от их количества. Для проведения анализа необходимо рассматривать данные за 2010-2012 года(Таблица 1).

Таблица 1.

год

месяц

 

 

количество автотранспортов, тыс.шт

выбросы загрязняющих атмосферу веществ автомобильным транспортом, тыс. тонн

 

 

 

год

 

 

месяц

 

 

 

количество автотранспортов, тыс.шт

выбросы загрязняющих атмосферу веществ автомобильным транспортом, тыс.тонн

2010

январь

3058,2

750,4

2012

январь

 

2427,15

984,2

февраль

3120

822

февраль

 

2698,7

1005,6

март

3120,3

1020,4

март

 

2896,3

1009,3

апрель

3130,8

1062

апрель

 

3138,55

1045,9

май

3214,5

1076

май

 

3303,25

1068,3

июнь

3227,2

1098,2

июнь

 

3325,6

1086,5

июль

3250

1128,25

июль

 

3446,35

1105,3

август

3311,7

1158,2

август

 

3470,5

1127,6

сентябрь

3311,7

1180,4

сентябрь

 

3698

1153,6

октябрь

3314,5

1236,4

октябрь

 

3986

1180

ноябрь

3334,1

1500,35

ноябрь

 

4580

1198,4

декабрь

3334,4

1506

декабрь

 

5489

1360,5

2011

январь

2569

717,5

февраль

2770,3

758,65

март

3080,1

958,7

апрель

3114,8

1000

май

3229,3

1058,3

июнь

3250

1058,55

июль

3448,5

1082,7

август

3485

1092

сентябрь

3498

1135,2

октябрь

3569

1184,2

ноябрь

3780

1459

декабрь

4399,2

1600


 

Построение модели парной регрессии заключается в нахождении уравнении связи двух показателей у и х, т.е.  определяется как  повлияет изменение одного показателя на другой.

Уравнение модели парной регрессии  можно записать в общем виде: у=(x), где  у=зависимый показатель, а х = независимый. В нашем примере х=количество автотранспортов, у=выбросы загрязняющих атмосферу веществ автомобильным транспортом.

   Определим вид аналитической функции, которая отразит механизм связи между факторным и результативным признаками и даст количественную оценку этой связи по средней ошибке аппроксимации:

 A = ∑|yi - yx| : yi;n100%

линейная форма связи: y = 0.2202 x + 367.9133

A = 3.36;36 100% = 9.32%

нелинейная форма связи: 

степенная: y = e0.70119720x0.7762 = 2.01617x0.7762

A = 0.47;36 100% = 1.31%

логарифмическая: y = 849.9117 ln(x) - 5783.7291

A = 3.38;36 100% = 9.38%

показательная: y = e6.3246*e0.000199x = 558.11316*1.0002x

A = 0.48;36 100% = 1.33%

Величина ошибки самая низкая у степенного уравнения, то данное уравнение можно использовать в качестве регрессии, так как точность регрессионной модели будет высоко точной.

Степенное уравнение регрессии имеет вид y = a xb (ln y = lna + blnx + ε)

МНК позволяет определить параметры регрессии:

S = ∑(yi - y*i)2 → min

 

Система нормальных уравнений.

a•n + b∑x = ∑y

a∑x + b∑x2 = ∑y•x

Система уравнений имеет вид

36a + 292.01 b = 251.89

292.01 a + 2369.41 b  = 2043.79

Получаем коэффициенты регрессии: a = 0.7012, b = 0.7762,

Уравнение регрессии:

y = e0.70119720x0.7762 = 2.01617x0.7762

Для расчета параметров регрессии построим расчетную таблицу(Таблица 2).

Таблица 2

ln(x)

ln(y)

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y - yx|:y

8,03

6.62

6.93

0.14

0.0959

0.00736

0.0468

8,05

6.71

6.95

0.0813

0.0548

0.00433

0.0349

8,05

6.93

6.95

0.00475

0.000322

0.00432

0.00259

8,05

6.97

6.95

0.000841

0.000376

0.00389

0.00278

8,08

6.98

6.97

0.000253

0.000144

0.00129

0.00172

8,08

7

6.97

2.0E-5

0.000863

0.00103

0.0042

8,09

7.03

6.98

0.000993

0.00259

0.000624

0.00724

8,11

7.05

6.99

0.00333

0.00391

3.8E-5

0.00886

8,11

7.07

6.99

0.00588

0.00664

3.8E-5

0.0115

8,11

7.12

6.99

0.0151

0.0162

2.8E-5

0.0179

8,11

7.31

7

0.1

0.0999

0

0.0432

8,11

7.32

7

0.1

0.1

0

0.0437

7,85

6.58

6.8

0.18

0.0481

0.0677

0.0333

7,93

6.63

6.85

0.13

0.0493

0.0341

0.0335

8,03

6.87

6.94

0.0172

0.00494

0.00619

0.0102

8,04

6.91

6.94

0.00795

0.00135

0.00455

0.00532

8,08

6.96

6.97

0.00106

6.6E-5

0.000984

0.00117

8,09

6.96

6.98

0.00104

0.000165

0.000624

0.00185

8,15

6.99

7.02

9.4E-5

0.00132

0.00118

0.0052

8,16

7

7.03

1.0E-6

0.00129

0.00201

0.00514

8,16

7.03

7.03

0.00142

0

0.00236

0

8,18

7.08

7.05

0.00639

0.000709

0.00471

0.00376

8,24

7.29

7.09

0.0833

0.0364

0.0159

0.0262

8,39

7.38

7.21

0.15

0.0273

0.0772

0.0224

7,79

6.89

6.75

0.011

0.0199

0.1

0.0204

7,9

6.91

6.83

0.00698

0.00642

0.0445

0.0116

7,97

6.92

6.89

0.00638

0.000837

0.0197

0.00418

8,05

6.95

6.95

0.00196

5.0E-6

0.00359

0.000317

8,1

6.97

6.99

0.000533

0.000266

7.6E-5

0.00234

8,11

6.99

7

3.8E-5

2.2E-5

4.0E-6

0.000665

8,15

7.01

7.02

0.00012

0.00023

0.00113

0.00217




 

Продолжение таблицы 2. 

8.15

7.03

7.03

0.000957

0

0.00165

8.8E-5

8.22

7.05

7.08

0.00289

0.000735

0.0108

0.00384

8.29

7.07

7.14

0.00583

0.00393

0.0321

0.00886

8.43

7.09

7.24

0.00843

0.024

0.1

0.0219

8.61

7.22

7.38

0.0478

0.0285

0.25

0.0234

292.01

251.89

251.89

1.12

0.64

0.8

0.47


Рассчитаем средние значения:

x = ∑xi;n =  292.01;36 = 8.11

y = ∑yi;n =  251.89;36 = 7

xy = ∑xiyi;n =  2043.79;36 = 56.77

Из полученных расчетов коэффициента вариации по факторному признаку делаем вывод:   совокупность однородная.

    Для нелинейных форм регрессии в качестве характеристики силы связи между факторным и результативным признаком следует использовать корреляционное отношение (а не коэффициент прямолинейной корреляции Пирсона).

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < η < 0.3: слабая;

0.3 < η < 0.5: умеренная;

0.5 < η < 0.7: заметная;

0.7 < η < 0.9: высокая;

0.9 < η < 1: весьма высокая;

η = ∑y - yx2; ∑yi - y2

η = 0.48;1.12 = 0.66

y - yx2 = 1.12 - 0.64 = 0.48

Коэффициент эластичности находится по формуле:

E = ∂y;∂x x;y = b

E = b = 0.78

Индекс корреляции.

R = 1 - ∑yi - yx2; ∑yi - y2

R = 1 - 0.64;1.12 = 0.66

Полученная величина свидетельствует о том, что фактор x умеренно влияет на y. Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

R = 1 - ∑yi - yx2; ∑yi - y2

Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0;1].

Индекс детерминации. Чаще всего, давая интерпретацию индекса детерминации, его выражают в процентах.

R2 = 1 - ∑yi - yx2; ∑yi - y2

R2 = 1- 0.64;1.12 = 0.43  т.е. в 43.11 % случаев изменения х приводят к изменению y. Значит, точность подбора уравнения регрессии - средняя. Остальные 56.89 % изменения Y объясняются факторами, не учтенными в модели.

Ошибка аппроксимации.

A = 0.47;36 100% = 1.31%

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Значимость коэффициента корреляции.

tнабл = rxy n-2;1 - r2xy

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если |tнабл| > tкрит — нулевую гипотезу отвергают.

tнабл = 0.66 34;1 - 0.662 = 6.53

 

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=34 находим tкрит:

tкрит (n-m-1;α/2) = (34;0.025) = 2.021

где m = 1 - количество объясняющих переменных.

Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции

Доверительный интервал для коэффициента корреляции

r - tкрит 1-r2;n; r + tкрит 1-r2;n

0.66 - 2.0211-0.662;36; 0.66 + 2.0211-0.662;36

r(0.46;0.85)

Коэффициент ранговой корреляции Спирмена. Присвоим ранги признаку ei и фактору X. Найдем сумму разности квадратов d2. По формуле вычислим коэффициент ранговой корреляции Спирмена.

p = 1 - 6∑d2;n3-n

Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т. е. одинаковые средние номера; например, вместо одинаковых по порядку третьего и четвертого значений признака будут два ранга по 3,5. В таком случае коэффициент Спирмена вычисляется как:

p = 1 - 6∑d2 - A - B;n3-n-12An3-n-12B

A = 1;12∑A3j - Aj

B = 1;12∑B3k - Bk

j - номера связок по порядку для признака х;

Аj - число одинаковых рангов в j-й связке по х;

k - номера связок по порядку для признака у;

Вk - число одинаковых рангов в k-й связке по у.

 

 

Таблица3.

X

ei

ранг X, dx

ранг ei, dy

(dx - dy)2

8.03

0.31

6

34

784

8.05

0.23

9

33

576

8.05

0.018

10

10

0

8.05

0.0194

11

11

0

8.08

0.012

13

6

49

8.08

0.0294

14

15

1

8.09

0.0509

16.5

19

6.25

8.11

0.0625

19.5

20

0.25

8.11

0.0815

19.5

24

20.25

8.11

0.13

21

25

16

8.11

0.32

23

35

144

8.11

0.32

24

36

144

7.85

0.22

2

31

841

7.93

0.22

4

32

784

8.03

0.0703

7

22

225

8.04

0.0368

8

18

100

8.08

0.00814

15

5

100

8.09

0.0129

16.5

7

90.25

8.15

0.0363

26

17

81

8.16

0.0359

28

16

144

8.16

2.7E-5

29

1

784

8.18

0.0266

30

12

324

8.24

0.19

32

30

4

8.39

0.17

34

28

36

7.79

0.14

1

26

625

7.9

0.0801

3

23

400

7.97

0.0289

5

14

81

8.05

0.0022

12

3

81

8.1

0.0163

18

9

81

8.11

0.00465

22

4

324

8.15

0.0152

25

8

289

8.15

0.000618

27

2

625

8.22

0.0271

31

13

324

8.29

0.0627

33

21

144

8.43

0.16

35

27

64

8.61

0.17

36

29

49

 

 

 

 

 

 

 

8341

Информация о работе Статистика окружающей среды на примере Российской Федерации