Автор работы: Пользователь скрыл имя, 06 Января 2013 в 22:03, курсовая работа
Целью данной работы является статистический анализ средней ожидаемой продолжительности жизни населения при рождении в странах Африки.
Задачи данной работы следующие:
Рассмотреть среднюю продолжительность жизни как объект статистического исследования
Выявить факторы, оказывающие воздействие на продолжительность жизни методами корреляционного анализа
Построить и проанализировать регресионную модель средней ожидаемой продолжительности жизни при рождении
Провести снижение признакового пространства методом компонентного анализа
Выявить группы однородных объектов методом кластерного анализа
Уточнить результаты полученной классификации с помощью дискриминантного анализа.
Введение 1
1. Предварительный анализ данных 3
2. Проверка данных на нормальный закон распределения 6
3. Проверка данных на аномальные наблюдения и выбросы 8
4. Корреляционный анализ 10
5. Компонентный анализ 20
6. Кластерный анализ 25
7. Дискриминантный анализ 33
Заключение 40
Список использованной литературы: 45
Приложение 1 46
Приложение 2 49
Приложение 3 50
Приложение 4 54
Содержание
Введение 1
1. Предварительный анализ данных 3
2. Проверка данных на нормальный закон распределения 6
3. Проверка данных на аномальные наблюдения и выбросы 8
4. Корреляционный анализ 10
5. Компонентный анализ 20
6. Кластерный анализ 25
7. Дискриминантный анализ 33
Заключение 40
Список использованной литературы: 45
Приложение 1 46
Приложение 2 49
Приложение 3 50
Приложение 4 54
Ожидаемая продолжительность жизни при рождении — важнейший демографический показатель, характеризующий уровень смертности населения. Упрощенно говоря, он обозначает среднее количество лет предстоящей жизни человека, достигшего данного возраста.
Целью данной работы является статистический анализ средней ожидаемой продолжительности жизни населения при рождении в странах Африки.
Задачи данной работы следующие:
Объектом исследования является средная продолжительность жизни населения в странах Африки.
Предметом исследования является совокупность показателей, характеризующих продолжительность жизни населения.
Основными источниками информации для исследований являются данные, взяты с официального сайта ЦРУ (World Factbook), Всемирного банка (worldbank.org).
Структура работы состоит из:
В работе содержатся 11 рисунков и 36 таблиц.
Численность населения Африки составляет около 1 миллиарда человек. В Африке самые высокие темпы естественного прироста населения. Естественный прирост во многих странах превышает 30 человек на 1000 жителей в год. Сохраняется высокая доля детских возрастов (50 %) и небольшая доля людей старшего поколения (около 5 %). За последние 50 лет возросла средняя продолжительность жизни — с 39 до 54 лет.
С целью анализа средней ожидаемой продолжительности жизни населения были рассмотрены показатели по 47 странам Африки за 2010 год (табл.1).
Для анализа взаимосвязи взяты следующие показатели:
Результативный признак:
Y – Ожидаемая продолжительность жизни населения при рождении, лет
Факторные признаки Xi:
X1 – Территория, в тыс. км2
X2 – Численность населения в млн. чел.
X3 – Коэффициент суммарной рождаемости число детей на 1 женщину
X4– Коэффициент смертности на 1000 жителей
Х5 – Коэффициент младенческой смертности на 1000 рождений
Х6 – ВНП на 1 жителя, в долларах.
Таблица 1.
Исходные данные
№ П/п |
СТРАНЫ |
Территория, в тыс. км |
Численность населения в млн |
Коэффициент суммарной рождаемости число детей на 1 женщину |
Коэффициент смертности на 1000 жителей |
Коэффициент младенческой смертности на 1000 рождений |
ВНП на 1 жителя, в долларах |
Ожидаемая продолжительность жизни при рождении, лет |
X1 |
X2 |
X3 |
X4 |
Х5 |
Х6 |
Y | ||
1 |
Алжир |
2381 |
30,8 |
4,1 |
6 |
44 |
297,3 |
70,54 |
2 |
Египет |
1001 |
66,9 |
3,3 |
6 |
52 |
501,3 |
70,41 |
3 |
Судан |
2506 |
28,9 |
4,6 |
12 |
70 |
97,5 |
55,4 |
4 |
Тунис |
1164 |
9,5 |
2,8 |
7 |
35 |
89,9 |
74,4 |
5 |
ЮАР |
1221 |
42,6 |
3,3 |
11 |
52 |
528,4 |
49,3 |
6 |
Ботсвана |
582 |
1,5 |
4,1 |
21 |
56 |
27,6 |
32,26 |
7 |
Лесото |
30 |
2,1 |
4,3 |
12 |
80 |
3,3 |
36,94 |
8 |
Намибия |
824 |
1,6 |
5,1 |
20 |
68 |
14,6 |
42,77 |
9 |
Свазиленд |
17 |
1 |
5,2 |
10 |
72 |
5,9 |
39,47 |
10 |
Ангола |
1247 |
12,5 |
6,8 |
19 |
125 |
115,1 |
36,96 |
11 |
Камерун |
475 |
15,5 |
5,2 |
12 |
77 |
44,3 |
48,05 |
12 |
Центрально-Африканская республика |
623 |
3,4 |
5,1 |
17 |
97 |
3,4 |
41,71 |
13 |
Конго |
342 |
2,7 |
5,1 |
17 |
107 |
17 |
50,02 |
14 |
Габон |
268 |
1,2 |
5,4 |
16 |
106 |
22,4 |
57,12 |
15 |
Экваториальная Гвинея |
28 |
0,44 |
5,9 |
18 |
87 |
24,1 |
54,75 |
16 |
Сан-Томе и Принсипи |
1 |
0,16 |
6,2 |
9 |
51 |
0,31 |
66,28 |
17 |
Чад |
1284 |
7,7 |
6,6 |
18 |
110 |
15,2 |
48,51 |
18 |
Конго (Дем.Респ., Заир) |
2345 |
50,5 |
6,6 |
16 |
117 |
22,7 |
48,93 |
19 |
Бенин |
113 |
6,2 |
6,3 |
14 |
94 |
13,9 |
51,08 |
20 |
Буркина-Фасо |
274 |
11,6 |
6,7 |
18 |
94 |
20,5 |
44,46 |
21 |
Берег Слоновой Кости |
322 |
15,8 |
6,1 |
16 |
98 |
37,2 |
56,8 |
22 |
Гамбия |
11 |
1,3 |
5,6 |
19 |
130 |
2,4 |
54,38 |
23 |
Гана |
239 |
19,7 |
5,4 |
10 |
66 |
39,6 |
56,53 |
24 |
Гвинея |
246 |
7,5 |
5,7 |
18 |
134 |
10,8 |
49,54 |
25 |
Гвинея-Бисау |
36 |
1,2 |
5,9 |
21 |
136 |
1,7 |
46,97 |
26 |
Мали |
1240 |
11 |
6,7 |
16 |
123 |
16,2 |
45,43 |
27 |
Мавритания |
1026 |
2,6 |
5,5 |
13 |
92 |
6,6 |
51,93 |
28 |
Нигер |
1267 |
10 |
7,5 |
24 |
123 |
11,2 |
42,21 |
29 |
Нигерия |
924 |
113,8 |
6,2 |
13 |
73 |
377,1 |
51,01 |
30 |
Сенегал |
197 |
9,2 |
5,7 |
13 |
68 |
23,8 |
56,37 |
31 |
Сьерра-Леоне |
72 |
5,3 |
6,3 |
18 |
136 |
4,8 |
42,84 |
32 |
Того |
57 |
4,5 |
5,4 |
15 |
80 |
5,9 |
53,43 |
33 |
Бурунди |
28 |
6,7 |
6,5 |
18 |
105 |
3,4 |
43,2 |
34 |
Коморские о-ва |
2 |
0,56 |
5,1 |
10 |
77 |
0,8 |
61,18 |
35 |
Джибути |
23 |
0,63 |
5,8 |
16 |
115 |
1,9 |
43,13 |
36 |
Эритрея |
118 |
4 |
6,1 |
13 |
82 |
2,8 |
53,18 |
37 |
Эфиопия |
1104 |
59,7 |
7 |
21 |
128 |
85,7 |
41,24 |
38 |
Кения |
580 |
28,8 |
4,7 |
14 |
74 |
66,2 |
45,22 |
39 |
Мадагаскар |
587 |
14,4 |
6 |
14 |
96 |
19,9 |
56,14 |
40 |
Малави |
118 |
10 |
5,9 |
24 |
137 |
13 |
37,98 |
41 |
Мозамбик |
802 |
19,1 |
5,6 |
19 |
134 |
21,8 |
31,3 |
42 |
Уганда |
241 |
22,8 |
6,9 |
20 |
81 |
42,2 |
44,88 |
43 |
Руанда |
26 |
8,2 |
6 |
18 |
114 |
12,2 |
39,33 |
44 |
Сейшельские о-ва |
0,45 |
0,08 |
2,2 |
8 |
8 |
1,9 |
71,25 |
45 |
Танзания |
945 |
31,3 |
5,7 |
17 |
100 |
62,2 |
44,56 |
46 |
Замбия |
753 |
9,7 |
6,1 |
23 |
109 |
20 |
35,25 |
47 |
Зимбабве |
391 |
11,2 |
4 |
20 |
53 |
5,9 |
39,01 |
При помощи пакета анализа данных SPSS расcчитаны средние значения, моды, медианы, коэффициенты асимметрии и эксцесса (табл.2).
Таблица 2
Статистики
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
y | ||
N |
Valid |
47 |
47 |
47 |
47 |
47 |
47 |
47 |
Missing |
0 |
0 |
0 |
0 |
0 |
0 |
0 | |
Mean |
5,4950E2 |
14,4398 |
5,4957 |
15,5319 |
90,7660 |
6,9213E2 |
49,2266 | |
Median |
3,4200E2 |
9,2000 |
5,7000 |
16,0000 |
94,0000 |
3,4000E2 |
48,5100 | |
Mode |
28,00a |
1,20a |
5,10 |
18,00 |
52,00a |
210,00a |
31,30a | |
Skewness |
1,037 |
3,197 |
-,982 |
-,290 |
-,366 |
4,622 |
,656 | |
Std. Error of Skewness |
,347 |
,347 |
,347 |
,347 |
,347 |
,347 |
,347 | |
Kurtosis |
1,086 |
13,106 |
,946 |
-,502 |
-,265 |
24,695 |
,171 | |
Std. Error of Kurtosis |
,681 |
,681 |
,681 |
,681 |
,681 |
,681 |
,681 | |
a. Multiple modes exist. The smallest value is shown |
Мода показывает нам наиболее часто встречающееся значение, а медиана – значение признака, делящее весь ряд на две равные части. Коэффициент асимметрии показывает на какую относительную величину и в какую сторону сдвинута мода, а коэффициент эксцесса – меру остроты пика распределения. Значения коэффициентов асимметрии и эксцесса дают нам возможность сделать вывод о нормальном распределении только двух показателей – Х4 (коэффициент смертности на 1000 жителей) и Х5 (коэффициент младенческой смертности на 1000 рождений), что видно на полученных гистограммах (рис.1, преложение 1).
Рисунок 1. Гистограмма «Коэффициент младенческой смертности на 1000 рождений»
На этом рисунке наблюдается нормальный закон распределения, коэффициенты асимметрии и эксцесса не намного отличаются от нуля (по модулю не превышают 0,5). Коэффициент асимметрии оказался отрицательным , что свидетельствует о небольшой левосторонней асимметрии данного распределения. Эксцесс оказался также отрицательным . Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальным, имеет несколько более плоскую вершину.
Для проверки на аномальные наблюдения может использоваться правило трех сигм. Согласно этому правилу практически все значения нормально распределённой случайной величины лежат в интервале
При проверке по этому правилу не обгаружили аномальные наблюдения и выбросы в результативном признаке Y (ожидаемая продолжительность жизни населения при рождении) при интервале от 18,2 до 79,6; в факторнах признаках: X1 (территория) при интервале от -1319,7 до 2514,6; X2 (численность населения) при интервале от -48,1 до 78,98; X3 (коэффициент суммарной рождаемости число детей на 1 женщину) при интервале от 2,15 до 8,84; X4 (Коэффициент смертности на 1000 жителей) при интервале от 1,89 до 29,17; Х5 (Коэффициент младенческой смертности на 1000 рождений) при интервале от 0,25 до 181,28.
А по факторному признаку Х6 (ВНП на 1 жителя, рис.2) в число выбросов попали Сейшельские острова (6910) при интервале от -2905,2 до 4608,6.
рисунок 2. Графика ВНП на 1 жителя.
Таким образом к числу выбросов относим Сейшельские острова.
Другой способ обнаружить выбросы – это ящичковые диаграммы (рис.3, приложение 2).
* - значения, отстоящие от 75%-го процентиля более чем на 3 длины ящичка (экстремумы);
° - значения, отстоящие от 75%-го процентиля более чем на 1,5 длины ящичка (выбросы);
верхний «ус» - наибольшее из наблюденных значений, которое не является ни выбросом, ни экстремумом;
нижний «ус» - наименьшее из наблюденных значений, которое не является ни выбросом, ни экстремумом;
верхний край ящичка – 75% процентиль;
нижний край ящичка – 25% процентиль;
горизонтальная линия в ящичке – медиана.
рисунок 3. Ящичковый диаграмм ожидаемой продолжительности жизни населения
Таким образом, в результативном признаке Y (ожидаемая продолжительность жизни населения при рождении) нет выбросов.
4.1. Построение матрицы парных коэффициентов корреляции
Парные коэффициенты корреляции
характеризуют взаимосвязь
Таблица 3.
Матрица парных коэффициентов корреляции исследуемых показателей
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 | ||
y |
Корреляция Пирсона |
1 |
,111 |
,104 |
-,429** |
-,753** |
-,562** |
,301* |
Знч.(2-сторон) |
,457 |
,485 |
,003 |
,000 |
,000 |
,040 | ||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
x1 |
Корреляция Пирсона |
,111 |
1 |
,482** |
,013 |
-,128 |
-,070 |
,425** |
Знч.(2-сторон) |
,457 |
,001 |
,930 |
,391 |
,638 |
,003 | ||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
x2 |
Корреляция Пирсона |
,104 |
,482** |
1 |
,012 |
-,183 |
-,108 |
,732** |
Знч.(2-сторон) |
,485 |
,001 |
,935 |
,217 |
,469 |
,000 | ||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
x3 |
Корреляция Пирсона |
-,429** |
,013 |
,012 |
1 |
,454** |
,542** |
-,311* |
Знч.(2-сторон) |
,003 |
,930 |
,935 |
,001 |
,000 |
,034 | ||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
x4 |
Корреляция Пирсона |
-,753** |
-,128 |
-,183 |
,454** |
1 |
,709** |
-,420** |
Знч.(2-сторон) |
,000 |
,391 |
,217 |
,001 |
,000 |
,003 | ||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
x5 |
Корреляция Пирсона |
-,562** |
-,070 |
-,108 |
,542** |
,709** |
1 |
-,354* |
Знч.(2-сторон) |
,000 |
,638 |
,469 |
,000 |
,000 |
,015 | ||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
x6 |
Корреляция Пирсона |
,301* |
,425** |
,732** |
-,311* |
-,420** |
-,354* |
1 |
Знч.(2-сторон) |
,040 |
,003 |
,000 |
,034 |
,003 |
,015 |
||
N |
47 |
47 |
47 |
47 |
47 |
47 |
47 | |
**. Корреляция значима на уровне 0.01 (2-сторон.). | ||||||||
*. Корреляция значима на уровне 0.05 (2-сторон.). |
Информация о работе Статистический анализ средней продолжительности жизни в странах Африки