Статистический анализ средней продолжительности жизни в странах Африки

Автор работы: Пользователь скрыл имя, 06 Января 2013 в 22:03, курсовая работа

Краткое описание

Целью данной работы является статистический анализ средней ожидаемой продолжительности жизни населения при рождении в странах Африки.
Задачи данной работы следующие:
Рассмотреть среднюю продолжительность жизни как объект статистического исследования
Выявить факторы, оказывающие воздействие на продолжительность жизни методами корреляционного анализа
Построить и проанализировать регресионную модель средней ожидаемой продолжительности жизни при рождении
Провести снижение признакового пространства методом компонентного анализа
Выявить группы однородных объектов методом кластерного анализа
Уточнить результаты полученной классификации с помощью дискриминантного анализа.

Содержание

Введение 1
1. Предварительный анализ данных 3
2. Проверка данных на нормальный закон распределения 6
3. Проверка данных на аномальные наблюдения и выбросы 8
4. Корреляционный анализ 10
5. Компонентный анализ 20
6. Кластерный анализ 25
7. Дискриминантный анализ 33
Заключение 40
Список использованной литературы: 45
Приложение 1 46
Приложение 2 49
Приложение 3 50
Приложение 4 54

Вложенные файлы: 1 файл

курсийн ажил МСМ1.docx

— 453.45 Кб (Скачать файл)

Содержание

Введение 1

1. Предварительный  анализ данных 3

2. Проверка данных на нормальный закон распределения 6

3. Проверка данных на аномальные наблюдения и выбросы 8

4. Корреляционный анализ 10

5. Компонентный анализ 20

6. Кластерный анализ 25

7. Дискриминантный анализ 33

Заключение 40

Список использованной литературы: 45

Приложение 1 46

Приложение 2 49

Приложение 3 50

Приложение 4 54

 

 

Введение

Ожидаемая продолжительность жизни при рождении — важнейший демографический показатель, характеризующий уровень смертности населения. Упрощенно говоря, он обозначает среднее количество лет предстоящей жизни человека, достигшего данного возраста.

Целью данной работы является статистический анализ средней ожидаемой продолжительности жизни населения при рождении в странах Африки.

Задачи данной работы следующие:

  • Рассмотреть среднюю продолжительность жизни как объект статистического исследования
  • Выявить факторы, оказывающие воздействие на продолжительность жизни методами корреляционного анализа
  • Построить и проанализировать регресионную модель средней ожидаемой продолжительности жизни при рождении
  • Провести снижение признакового пространства методом компонентного анализа
  • Выявить группы однородных объектов методом кластерного анализа
  • Уточнить результаты полученной классификации с помощью дискриминантного анализа.

Объектом исследования является средная продолжительность жизни населения в странах Африки.

Предметом исследования является совокупность показателей, характеризующих продолжительность жизни населения.

Основными источниками информации для исследований являются данные, взяты с официального сайта ЦРУ (World Factbook),  Всемирного банка (worldbank.org).

Структура  работы состоит  из:

      • Введения
      • Основной части
      • Заключения
      • Списка использованной литературы
      • Приложений

В работе содержатся 11 рисунков и 36 таблиц.

 

 

1. Предварительный анализ  данных

Численность населения Африки составляет около 1 миллиарда человек. В Африке самые высокие темпы естественного прироста населения. Естественный прирост во многих странах превышает 30 человек на 1000 жителей в год. Сохраняется высокая доля детских возрастов (50 %) и небольшая доля людей старшего поколения (около 5 %). За последние 50 лет возросла средняя продолжительность жизни — с 39 до 54 лет.

С целью анализа средней ожидаемой продолжительности жизни населения были рассмотрены показатели по 47 странам Африки за 2010 год (табл.1).

Для  анализа взаимосвязи взяты следующие показатели:

Результативный  признак:

Y – Ожидаемая продолжительность жизни населения при рождении, лет

Факторные признаки Xi:

X1 – Территория, в тыс. км2

X2 – Численность населения в млн. чел.

X3 – Коэффициент суммарной рождаемости число детей на 1 женщину

X4– Коэффициент смертности на 1000 жителей

Х5 – Коэффициент младенческой смертности на 1000 рождений

Х6 – ВНП на 1 жителя, в долларах.

Таблица 1.

Исходные данные

П/п

СТРАНЫ 

Территория,  в тыс. км

Численность населения в  млн

Коэффициент суммарной рождаемости  число детей на 1 женщину

Коэффициент смертности на 1000 жителей

Коэффициент младенческой смертности на 1000 рождений

ВНП на 1 жителя, в долларах

Ожидаемая продолжительность  жизни при рождении, лет

X1

X2

X3

X4

Х5

Х6

Y

1

Алжир

2381

30,8

4,1

6

44

297,3

70,54

2

Египет

1001

66,9

3,3

6

52

501,3

70,41

3

Судан

2506

28,9

4,6

12

70

97,5

55,4

4

Тунис

1164

9,5

2,8

7

35

89,9

74,4

5

ЮАР

1221

42,6

3,3

11

52

528,4

49,3

6

Ботсвана

582

1,5

4,1

21

56

27,6

32,26

7

Лесото

30

2,1

4,3

12

80

3,3

36,94

8

Намибия

824

1,6

5,1

20

68

14,6

42,77

9

Свазиленд

17

1

5,2

10

72

5,9

39,47

10

Ангола

1247

12,5

6,8

19

125

115,1

36,96

11

Камерун

475

15,5

5,2

12

77

44,3

48,05

12

Центрально-Африканская республика

623

3,4

5,1

17

97

3,4

41,71

13

Конго

342

2,7

5,1

17

107

17

50,02

14

Габон

268

1,2

5,4

16

106

22,4

57,12

15

Экваториальная Гвинея

28

0,44

5,9

18

87

24,1

54,75

16

Сан-Томе и Принсипи

1

0,16

6,2

9

51

0,31

66,28

17

Чад

1284

7,7

6,6

18

110

15,2

48,51

18

Конго (Дем.Респ., Заир)

2345

50,5

6,6

16

117

22,7

48,93

19

Бенин

113

6,2

6,3

14

94

13,9

51,08

20

Буркина-Фасо

274

11,6

6,7

18

94

20,5

44,46

21

Берег Слоновой Кости

322

15,8

6,1

16

98

37,2

56,8

22

Гамбия

11

1,3

5,6

19

130

2,4

54,38

23

Гана

239

19,7

5,4

10

66

39,6

56,53

24

Гвинея

246

7,5

5,7

18

134

10,8

49,54

25

Гвинея-Бисау

36

1,2

5,9

21

136

1,7

46,97

26

Мали

1240

11

6,7

16

123

16,2

45,43

27

Мавритания

1026

2,6

5,5

13

92

6,6

51,93

28

Нигер

1267

10

7,5

24

123

11,2

42,21

29

Нигерия

924

113,8

6,2

13

73

377,1

51,01

30

Сенегал

197

9,2

5,7

13

68

23,8

56,37

31

Сьерра-Леоне

72

5,3

6,3

18

136

4,8

42,84

32

Того

57

4,5

5,4

15

80

5,9

53,43

33

Бурунди

28

6,7

6,5

18

105

3,4

43,2

34

Коморские о-ва

2

0,56

5,1

10

77

0,8

61,18

35

Джибути

23

0,63

5,8

16

115

1,9

43,13

36

Эритрея

118

4

6,1

13

82

2,8

53,18

37

Эфиопия        

1104

59,7

7

21

128

85,7

41,24

38

Кения

580

28,8

4,7

14

74

66,2

45,22

39

Мадагаскар

587

14,4

6

14

96

19,9

56,14

40

Малави 

118

10

5,9

24

137

13

37,98

41

Мозамбик

802

19,1

5,6

19

134

21,8

31,3

42

Уганда

241

22,8

6,9

20

81

42,2

44,88

43

Руанда

26

8,2

6

18

114

12,2

39,33

44

Сейшельские о-ва

0,45

0,08

2,2

8

8

1,9

71,25

45

Танзания

945

31,3

5,7

17

100

62,2

44,56

46

Замбия

753

9,7

6,1

23

109

20

35,25

47

Зимбабве

391

11,2

4

20

53

5,9

39,01


 

 

2. Проверка данных на нормальный закон распределения

При помощи пакета анализа  данных SPSS расcчитаны средние значения, моды, медианы, коэффициенты асимметрии и эксцесса (табл.2).

Таблица 2

Статистики

   

x1

x2

x3

x4

x5

x6

y

N

Valid

47

47

47

47

47

47

47

Missing

0

0

0

0

0

0

0

Mean

5,4950E2

14,4398

5,4957

15,5319

90,7660

6,9213E2

49,2266

Median

3,4200E2

9,2000

5,7000

16,0000

94,0000

3,4000E2

48,5100

Mode

28,00a

1,20a

5,10

18,00

52,00a

210,00a

31,30a

Skewness

1,037

3,197

-,982

-,290

-,366

4,622

,656

Std. Error of Skewness

,347

,347

,347

,347

,347

,347

,347

Kurtosis

1,086

13,106

,946

-,502

-,265

24,695

,171

Std. Error of Kurtosis

,681

,681

,681

,681

,681

,681

,681

a. Multiple modes exist. The smallest value is shown

       

Мода показывает нам наиболее часто встречающееся значение, а  медиана – значение признака, делящее  весь ряд на две равные части. Коэффициент  асимметрии показывает на какую относительную величину и в какую сторону сдвинута мода, а коэффициент эксцесса – меру остроты пика распределения. Значения коэффициентов асимметрии и эксцесса дают нам возможность сделать вывод о нормальном распределении только двух показателей – Х4 (коэффициент смертности на 1000 жителей) и Х5 (коэффициент младенческой смертности на 1000 рождений), что видно на полученных гистограммах (рис.1, преложение 1).  

Рисунок 1. Гистограмма «Коэффициент младенческой смертности на 1000 рождений»

На этом рисунке наблюдается  нормальный закон распределения, коэффициенты асимметрии и эксцесса не намного отличаются от нуля (по модулю не превышают 0,5). Коэффициент асимметрии оказался отрицательным , что свидетельствует о небольшой левосторонней асимметрии данного распределения. Эксцесс оказался также отрицательным . Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальным, имеет несколько более плоскую вершину. 

 

3. Проверка данных на аномальные наблюдения и выбросы

Для проверки на аномальные наблюдения может использоваться правило  трех сигм. Согласно этому правилу  практически все значения нормально распределённой случайной величины лежат в интервале 

При проверке по этому правилу  не обгаружили аномальные наблюдения и выбросы в результативном признаке Y (ожидаемая продолжительность жизни населения при рождении) при интервале от 18,2 до 79,6; в факторнах признаках: X1 (территория) при интервале от -1319,7 до 2514,6; X2 (численность населения) при интервале от -48,1 до 78,98; X3 (коэффициент суммарной рождаемости число детей на 1 женщину) при интервале от 2,15 до 8,84; X4 (Коэффициент смертности на 1000 жителей) при интервале от 1,89 до 29,17; Х5 (Коэффициент младенческой смертности на 1000 рождений) при интервале от 0,25 до 181,28.

А по факторному признаку Х6 (ВНП на 1 жителя, рис.2) в число выбросов попали Сейшельские острова (6910) при интервале от -2905,2 до 4608,6.

рисунок 2. Графика  ВНП на 1 жителя.

Таким образом к числу выбросов относим Сейшельские острова.

Другой способ обнаружить выбросы – это ящичковые диаграммы (рис.3, приложение 2).

* - значения, отстоящие от 75%-го процентиля более чем на 3 длины ящичка (экстремумы);

° - значения, отстоящие от 75%-го процентиля более чем на 1,5 длины ящичка (выбросы);

верхний «ус» - наибольшее из наблюденных значений, которое не является ни выбросом, ни экстремумом;

нижний «ус» - наименьшее из наблюденных значений, которое  не является ни выбросом, ни экстремумом;

верхний край ящичка – 75% процентиль;

нижний край ящичка – 25% процентиль;

горизонтальная линия  в ящичке – медиана.

 

рисунок 3. Ящичковый диаграмм ожидаемой продолжительности жизни населения

 Таким образом, в результативном признаке Y (ожидаемая продолжительность жизни населения при рождении) нет выбросов.

 

 

4. Корреляционный анализ

4.1. Построение матрицы парных коэффициентов корреляции

Парные коэффициенты корреляции характеризуют взаимосвязь между  двумя выбранными переменными на фоне действия остальных показателей  и являются самыми распространёнными  показателями тесноты связи при  статистическом анализе данных. Анализ проведен с использованием пакета анализа  данных SPSS (табл.3).

Таблица 3.

Матрица парных коэффициентов  корреляции исследуемых показателей

 

y

x1

x2

x3

x4

x5

x6

y

Корреляция Пирсона

1

,111

,104

-,429**

-,753**

-,562**

,301*

Знч.(2-сторон)

 

,457

,485

,003

,000

,000

,040

N

47

47

47

47

47

47

47

x1

Корреляция Пирсона

,111

1

,482**

,013

-,128

-,070

,425**

Знч.(2-сторон)

,457

 

,001

,930

,391

,638

,003

N

47

47

47

47

47

47

47

x2

Корреляция Пирсона

,104

,482**

1

,012

-,183

-,108

,732**

Знч.(2-сторон)

,485

,001

 

,935

,217

,469

,000

N

47

47

47

47

47

47

47

x3

Корреляция Пирсона

-,429**

,013

,012

1

,454**

,542**

-,311*

Знч.(2-сторон)

,003

,930

,935

 

,001

,000

,034

N

47

47

47

47

47

47

47

x4

Корреляция Пирсона

-,753**

-,128

-,183

,454**

1

,709**

-,420**

Знч.(2-сторон)

,000

,391

,217

,001

 

,000

,003

N

47

47

47

47

47

47

47

x5

Корреляция Пирсона

-,562**

-,070

-,108

,542**

,709**

1

-,354*

Знч.(2-сторон)

,000

,638

,469

,000

,000

 

,015

N

47

47

47

47

47

47

47

x6

Корреляция Пирсона

,301*

,425**

,732**

-,311*

-,420**

-,354*

1

Знч.(2-сторон)

,040

,003

,000

,034

,003

,015

 

N

47

47

47

47

47

47

47

**. Корреляция значима  на уровне 0.01 (2-сторон.).

*. Корреляция значима на  уровне 0.05 (2-сторон.).

Информация о работе Статистический анализ средней продолжительности жизни в странах Африки