Автор работы: Пользователь скрыл имя, 13 Октября 2013 в 09:07, курсовая работа
Безработица — социально-экономическое явление, предполагающее отсутствие работы у людей, составляющих экономически активное население. Курсовая работа демонстрирует обработку реальных статистических данных уровня безработицы в России, взятых с сайта http://sophist.hse.ru/ (Единый архив экономических и социологических данных).
Введение…………………………………………………………………………………………………..3
1.Постановка задачи……………………………………………………………………………………...4
2.Предварительная обработка данных…………………………………………………………………..5
2.1.Ранжирование выборки………………………………………………………………………………6
2.2.Построение интервального ряда…………………………………………………………………….7
2.3.Гистограмма частот и эмпирическая функция распределения…………………………………….8
2.4.Описательные статистики……………………………………………………………………………9
3.Статистический анализ………………………………………………………………………………...11
3.1.Выдвижение гипотезы……………………………………………………………………………….11
3.2.Точечное оценивание параметров…………………………………………………………………..12
3.3.Интервальное оценивание параметров……………………………………………………………..14
3.4.Проверка гипотезы…………………………………………………………………………………...15
Заключение……………………………………………………………………………………………….17
Список литературы………………………………………………………………………………………18
Байкальский государственный университет экономики и права
Кафедра информатики и кибернетики
КУРСОВАЯ РАБОТА
по теме:
«Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России»
Работу выполнил: студент группы ИС-09-2
Михайлова А.М.
Руководитель: к. т. н., доцент
Ведерникова Т.И.
Иркутск
2012г.
Содержание
Введение…………………………………………………………
1.Постановка задачи……………………………
2.Предварительная обработка
2.1.Ранжирование выборки………………
2.2.Построение интервального
2.3.Гистограмма частот и
2.4.Описательные статистики………
3.Статистический анализ…………………
3.1.Выдвижение гипотезы…………………
3.2.Точечное оценивание
3.3.Интервальное оценивание
3.4.Проверка гипотезы………………………
Заключение……………………………………………………
Список литературы…………………………………
Введение
Безработица — социально-экономическое явление, предполагающее отсутствие работы у людей, составляющих экономически активное население.
Согласно определению Международной организации труда, человек в возрасте 10-72 лет (в России, по методологии Росстата, — 15-72 лет) признаётся безработным, если на критическую неделю обследования населения по проблемам занятости он одновременно:
Уровень безработицы — количественный показатель, позволяющий сравнить безработицу для разной численности населения (для разных стран или для разных периодов одной и той же страны). Уровень безработицы рассчитывается как отношение числа безработных к общему числу занятых в хозяйстве или к численности интересующей группы населения (безработица среди женщин, молодёжи, сельского населения и т. п.).
На протяжении уже многих лет значительный интерес представляет изучение тенденций изменения такого показателя, как уровень безработицы.
Курсовая работа демонстрирует обработку реальных статистических данных уровня безработицы в России, взятых с сайта http://sophist.hse.ru/ (Единый архив экономических и социологических данных).
В данной работе рассмотрена
одна из важнейших задач математической
статистики – обоснованный выбор
среди множества теоретико-
Большинство вычислений проведены с использованием программы MS Excel 2007 и STATISTICA 6.
Курсовая работа посвящена исследованию числовой выборки методами статистического анализа. В качестве исходных данных принимаются данные об уровне безработицы за 1994 – 2011 годы. Для достижения поставленной цели необходимо решить следующие задачи:
Исходные данные: уровень безработицы, %
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 | |
1994 |
6,4 |
6,8 |
7,1 |
7,4 |
7,4 |
7,4 |
7,5 |
7,7 |
7,7 |
7,7 |
7,8 |
7,8 |
1995 |
7,9 |
8,1 |
8 |
8,2 |
8,3 |
8,4 |
8,5 |
8,8 |
8,9 |
9,2 |
9,1 |
9 |
1996 |
9,1 |
9,3 |
9,2 |
9,5 |
9,6 |
9,6 |
9,7 |
9,7 |
9,8 |
9,8 |
9,9 |
10 |
1997 |
10,1 |
10,3 |
10,5 |
10,7 |
10,9 |
10,9 |
10,9 |
10,9 |
11 |
11,1 |
11,2 |
11,2 |
1998 |
11,4 |
11,6 |
11,7 |
11,7 |
11,5 |
11,3 |
11,3 |
11,6 |
11,9 |
12,3 |
12,8 |
13,2 |
1999 |
12,2 |
14,6 |
14,1 |
13,4 |
12,7 |
12,3 |
12,1 |
12 |
12,1 |
12,4 |
12,6 |
12,4 |
2000 |
12,2 |
12,1 |
11,4 |
10,8 |
10,2 |
10,1 |
10 |
9,8 |
9,8 |
9,8 |
9,8 |
9,9 |
2001 |
10,0 |
10,2 |
9,6 |
9,1 |
8,6 |
8,6 |
8,6 |
8,6 |
8,7 |
8,8 |
8,9 |
8,7 |
2002 |
8,6 |
8,4 |
8,3 |
8,3 |
8,2 |
7,5 |
7,3 |
7,1 |
7,6 |
8,1 |
8,5 |
8,8 |
2003 |
9,3 |
9,6 |
9,2 |
8,8 |
8,5 |
8,4 |
8,3 |
8,2 |
8,2 |
8,2 |
8,2 |
8,6 |
2004 |
9,1 |
9,5 |
8,9 |
8,2 |
7,6 |
7,5 |
7,4 |
7,3 |
7,7 |
8,0 |
8,4 |
8,3 |
2005 |
8,3 |
8,3 |
8,0 |
7,6 |
7,3 |
7,3 |
7,2 |
7,1 |
7,2 |
7,3 |
7,5 |
7,7 |
2006 |
7,7 |
7,9 |
7,8 |
7,6 |
7,5 |
7,2 |
6,9 |
6,5 |
6,6 |
6,7 |
6,7 |
6,9 |
2007 |
7,1 |
7,2 |
6,8 |
6,4 |
5,9 |
5,8 |
5,7 |
5,6 |
5,6 |
5,6 |
5,7 |
6,1 |
2008 |
6,6 |
7,1 |
6,5 |
6,0 |
5,4 |
5,6 |
5,7 |
5,8 |
6,2 |
6,6 |
7,0 |
7,8 |
2009 |
8,7 |
9,4 |
9,2 |
8,8 |
8,5 |
8,3 |
8,1 |
7,9 |
7,6 |
7,7 |
8,2 |
8,2 |
2010 |
9,2 |
8,6 |
8,6 |
8,2 |
7,3 |
6,8 |
7,0 |
6,9 |
6,6 |
6,8 |
6,7 |
7,2 |
2011 |
7,8 |
7,6 |
7,1 |
7,2 |
6,4 |
6,1 |
6,5 |
6,1 |
6,0 |
6,4 |
6,3 |
6,1 |
Выборка содержит 216 значений. Необходимо провести предварительную обработку данных, которая включает в себя ранжирование выборки по возрастанию, расчет описательных статистик, разбиение выборки на интервалы, построение эмпирической функции распределения и гистограммы частот.
Произведем сортировку данных по возрастанию:
№ |
% |
№ |
% |
№ |
% |
№ |
% |
№ |
% |
1 |
5,4 |
46 |
7,1 |
91 |
8 |
136 |
8,8 |
181 |
10,8 |
2 |
5,6 |
47 |
7,1 |
92 |
8 |
137 |
8,8 |
182 |
10,9 |
3 |
5,6 |
48 |
7,1 |
93 |
8 |
138 |
8,8 |
183 |
10,9 |
4 |
5,6 |
49 |
7,2 |
94 |
8,1 |
139 |
8,9 |
184 |
10,9 |
5 |
5,6 |
50 |
7,2 |
95 |
8,1 |
140 |
8,9 |
185 |
10,9 |
6 |
5,7 |
51 |
7,2 |
96 |
8,1 |
141 |
8,9 |
186 |
11 |
7 |
5,7 |
52 |
7,2 |
97 |
8,2 |
142 |
9 |
187 |
11,1 |
8 |
5,7 |
53 |
7,2 |
98 |
8,2 |
143 |
9,1 |
188 |
11,2 |
9 |
5,8 |
54 |
7,2 |
99 |
8,2 |
144 |
9,1 |
189 |
11,2 |
10 |
5,8 |
55 |
7,3 |
100 |
8,2 |
145 |
9,1 |
190 |
11,3 |
11 |
5,9 |
56 |
7,3 |
101 |
8,2 |
146 |
9,1 |
191 |
11,3 |
12 |
6 |
57 |
7,3 |
102 |
8,2 |
147 |
9,2 |
192 |
11,4 |
13 |
6 |
58 |
7,3 |
103 |
8,2 |
148 |
9,2 |
193 |
11,4 |
14 |
6,1 |
59 |
7,3 |
104 |
8,2 |
149 |
9,2 |
194 |
11,4 |
15 |
6,1 |
60 |
7,3 |
105 |
8,2 |
150 |
9,2 |
195 |
11,6 |
16 |
6,1 |
61 |
7,4 |
106 |
8,2 |
151 |
9,2 |
196 |
11,6 |
17 |
6,1 |
62 |
7,4 |
107 |
8,3 |
152 |
9,3 |
197 |
11,7 |
18 |
6,2 |
63 |
7,4 |
108 |
8,3 |
153 |
9,3 |
198 |
11,7 |
19 |
6,3 |
64 |
7,4 |
109 |
8,3 |
154 |
9,4 |
199 |
11,9 |
20 |
6,4 |
65 |
7,5 |
110 |
8,3 |
155 |
9,5 |
200 |
12 |
21 |
6,4 |
66 |
7,5 |
111 |
8,3 |
156 |
9,5 |
201 |
12,1 |
22 |
6,4 |
67 |
7,5 |
112 |
8,3 |
157 |
9,6 |
202 |
12,1 |
23 |
6,4 |
68 |
7,5 |
113 |
8,3 |
158 |
9,6 |
203 |
12,1 |
24 |
6,5 |
69 |
7,5 |
114 |
8,3 |
159 |
9,6 |
204 |
12,2 |
25 |
6,5 |
70 |
7,6 |
115 |
8,4 |
160 |
9,6 |
205 |
12,2 |
26 |
6,5 |
71 |
7,6 |
116 |
8,4 |
161 |
9,7 |
206 |
12,3 |
27 |
6,6 |
72 |
7,6 |
117 |
8,4 |
162 |
9,7 |
207 |
12,3 |
28 |
6,6 |
73 |
7,6 |
118 |
8,4 |
163 |
9,8 |
208 |
12,4 |
29 |
6,6 |
74 |
7,6 |
119 |
8,5 |
164 |
9,8 |
209 |
12,4 |
30 |
6,6 |
75 |
7,6 |
120 |
8,5 |
165 |
9,8 |
210 |
12,6 |
31 |
6,7 |
76 |
7,7 |
121 |
8,5 |
166 |
9,8 |
211 |
12,7 |
32 |
6,7 |
77 |
7,7 |
122 |
8,5 |
167 |
9,8 |
212 |
12,8 |
33 |
6,7 |
78 |
7,7 |
123 |
8,6 |
168 |
9,8 |
213 |
13,2 |
34 |
6,8 |
79 |
7,7 |
124 |
8,6 |
169 |
9,9 |
214 |
13,4 |
35 |
6,8 |
80 |
7,7 |
125 |
8,6 |
170 |
9,9 |
215 |
14,1 |
36 |
6,8 |
81 |
7,7 |
126 |
8,6 |
171 |
10 |
216 |
14,6 |
37 |
6,8 |
82 |
7,7 |
127 |
8,6 |
172 |
10 | ||
38 |
6,9 |
83 |
7,8 |
128 |
8,6 |
173 |
10 | ||
39 |
6,9 |
84 |
7,8 |
129 |
8,6 |
174 |
10,1 | ||
40 |
6,9 |
85 |
7,8 |
130 |
8,6 |
175 |
10,1 | ||
41 |
7 |
86 |
7,8 |
131 |
8,7 |
176 |
10,2 | ||
42 |
7 |
87 |
7,8 |
132 |
8,7 |
177 |
10,2 | ||
43 |
7,1 |
88 |
7,9 |
133 |
8,7 |
178 |
10,3 | ||
44 |
7,1 |
89 |
7,9 |
134 |
8,8 |
179 |
10,5 | ||
45 |
7,1 |
90 |
7,9 |
135 |
8,8 |
180 |
10,7 |
Определим длину интервала по формуле Стерджесса:
где — максимальное и минимальное значение признака, N – объём выборки, - длина интервала группировки.
Для определения количества интервалов воспользуемся формулой:
Минимум = 5,4
Максимум = 14,6
Длина интервала = 1
Количество интервалов = 8
Далее построим вариационный ряд:
|
Гистограмма строится по таблице
частот и представляет собой графическое
отображение интервального
Рис.1
По графику можно предположить, что величина подчиняется нормальному закону распределения.
Другой характеристикой распределения является эмпирическая функция распределения. Эмпирической функцией распределения, построенной по выборке X = {X1…Xn} объёма n, называется случайная функция , при каждом равная
То есть, при любом y значение F(y), равное истинной вероятности случайной величине X1 быть меньше y, оценивается долей элементов выборки, меньших y.
Можно построить эмпирическую функцию распределения по вариационному ряду:
Функция распределения выборки показывает относительную частоту значений выборки, не превышающих заданное число.
Рис.2
К основным характеристикам случайной величины (описательные статистики) относятся: среднее значение, оценка дисперсии, моды, медианы, коэффициентов вариации, ассиметрии и эксцесса.
Математическим ожиданием случайной величины X называется число вида:
Дисперсия случайной величины характеризует меру разброса случайной величины около ее математического ожидания.
Стандартное отклонение вычисляется по формуле:
Медианой случайной величины X c распределением называется такое значение аргумента m, для которого выполняются неравенства:
Медиана характеризует серединное значение в выборке.
Модой распределения непрерывной случайной величины с плотностью pX(x) называют то значение аргумента, при котором плотность достигает максимума:
Мода характеризует наиболее часто встречающееся значение распределения.
Коэффициент асимметрии показывает отклонение распределения от симметричного и вычисляется по формуле:
, где n - число наблюдений,
Коэффициент эксцесса измеряет
«пикообразность» распределения. Если
эксцесс значимо отличен от 0,
то функция плотности либо имеет
более закругленный, либо более острый
пик, чем пик плотности нормального
распределения. Функция плотности
нормального распределения
, где n – число наблюдений,
Описательная статистика:
Статистика | |
Среднее |
8,612037037 |
Стандартная ошибка |
0,129493207 |
Медиана |
8,3 |
Мода |
8,2 |
Стандартное отклонение |
1,903153691 |
Дисперсия выборки |
3,621993971 |
Эксцесс |
0,027663565 |
Асимметричность |
0,70812249 |
Интервал |
9,2 |
Минимум |
5,4 |
Максимум |
14,6 |
Сумма |
1860,2 |
Счет |
216 |
Информация о работе Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России