Автор работы: Пользователь скрыл имя, 13 Октября 2013 в 09:07, курсовая работа
Безработица — социально-экономическое явление, предполагающее отсутствие работы у людей, составляющих экономически активное население. Курсовая работа демонстрирует обработку реальных статистических данных уровня безработицы в России, взятых с сайта http://sophist.hse.ru/ (Единый архив экономических и социологических данных).
Введение…………………………………………………………………………………………………..3
1.Постановка задачи……………………………………………………………………………………...4
2.Предварительная обработка данных…………………………………………………………………..5
2.1.Ранжирование выборки………………………………………………………………………………6
2.2.Построение интервального ряда…………………………………………………………………….7
2.3.Гистограмма частот и эмпирическая функция распределения…………………………………….8
2.4.Описательные статистики……………………………………………………………………………9
3.Статистический анализ………………………………………………………………………………...11
3.1.Выдвижение гипотезы……………………………………………………………………………….11
3.2.Точечное оценивание параметров…………………………………………………………………..12
3.3.Интервальное оценивание параметров……………………………………………………………..14
3.4.Проверка гипотезы…………………………………………………………………………………...15
Заключение……………………………………………………………………………………………….17
Список литературы………………………………………………………………………………………18
Гипотезы о распределениях
заключаются в том, что выдвигается
предположение о том, что распределение
в генеральной совокупности подчиняется
какому-то определенному закону. Проверка
гипотезы состоит в том, чтобы
на основании сравнения
Рис.3
Гистограмма частот с наложенным графиком нормального распределения.
Так как гистограмма частот подходит под график плотности нормального распределения, мат.ожидание, медиана и мода приблизительно равны, эксцесс и асимметрия равны нулю, то выдвинем гипотезу о нормальном распределении.
Плотность нормального распределения записывается в виде:
Гипотеза Ho будет выглядеть следующим образом:
Произведем оценивание параметров μ и σ2 методом моментов и методом максимального правдоподобия.
Проведем точечное оценивание параметров двумя способами: методом моментов и методом максимального правдоподобия.
Метод моментов:
Метод моментов заключается в приравнивании
определённого количества выборочных
моментов к соответствующим
Начальный и центральный момент k-ого порядка.
Начальным моментом 1-го порядка случайной величины x называется математическое ожидание .
Центральным моментом 2-го порядка случайной величины x называется величина , определяемая формулой .
Выборочные моменты имеют вид:
Приравнивая теоретические моменты к выборочным,
получаем:
Нормальное распределение имеет 2 параметра: μ или ( ) — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия.. Т.к. согласно формуле плотности нормального распределения:
Параметр μ равен начальному моменту 1-го порядка (μ = μ 1[x]), а параметр σ2 равен центральному моменту 2-го порядка (σ2 = μ2[x]), то их можно найти, оценив соответствующие характеристики выборки. Таким образом, параметр μ будет равен характеристике g3, а параметр σ2 будет равен характеристике g6. Отсюда следует, что μ *=8,61, а σ2*=3,62.
Метод максимального правдоподобия:
Основу метода составляет
функция правдоподобия, выражающая
плотность вероятности (вероятность)
совместного появления
В качестве «наиболее правдоподобного»
значения параметра берут значение,
максимизирующее вероятность
Оценкой максимального правдоподобия неизвестного параметра q называют значение q, при котором достигает максимума (как функция от q при фиксированных Х1,…,Хn):
Согласно методу максимального правдоподобия в качестве оценки неизвестного параметра θ принимается такое значение , которое максимизирует функцию L.
Нахождение оценки упрощается, если максимизировать не саму функцию L, а ln(L), поскольку максимум обеих функций достигается при одном и том же значении θ. Поэтому для отыскания оценок параметров надо решить систему уравнений правдоподобия, получаемых приравниванием частных производных нулю по параметрам, а затем отобрать то решение, которое обращает функцию ln(L) в максимум.
Плотность вероятности нормально распределенной случайной величины
Тогда функция правдоподобия имеет вид:
Логарифмируя, получим:
Для нахождения параметров μ и σ2 необходимо продифференцировать уравнение по μ и σ2 и приравнять нулю частные производные, т.е. решить систему уравнений правдоподобия:
отсюда оценки максимального правдоподобия равны:
Отсюда следует, μ *=8,61, а σ2*=3,62
Построим доверительные интервалы для параметров распределения. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.
Доверительные интервалы примут вид:
и .
Сначала найдем доверительный интервал для параметра μ, он будет равен
, где .
С помощью функции СТЬЮДРАСПОБР пакета Microsoft Excel определим δγ с уровнем надежности γ = 0,95 и n – 1 степенями свободы. Получим значение, равное: δγ = 1,971059073.
Теперь определим
,
.
Т.е. интервал [8,35; 8,86] покрывает истинное значение математического ожидания с уровнем значимости 0,05.
Теперь определим
,
.
Т.е. интервал [3.609; 3.653] покрывает истинное значение дисперсии с уровнем значимости 0,05.
Для проверки статистических гипотез о законе распределения используются специальные критерии согласия.
Критерий Колмогорова
Практическое использование критерия согласия Колмогорова осуществляется следующим образом.
Пусть – гипотетическая (непрерывная и полностью определенная) функция распределения. По результатам наблюдений строится эмпирическая функция распределения и находится величина
Затем задается уровень значимости и по таблицам распределения находится такое , что . Тогда, если найденная величина такова, что , то расхождение между и признается обусловленным случайностью наблюденных значений и гипотеза считается согласующейся с экспериментом (с определенным коэффициентом доверия). В противном случае гипотеза отвергается (с соответствующими сомнениями).
5,4÷ 6,4 |
6,4÷ 7,4 |
7,4÷ 8,4 |
8,4÷ 9,4 |
9,4÷ 10,4 |
10,4÷ 11,4 |
11,4÷ 12,4 |
12,4÷ 14,6 | |
ni |
23 |
41 |
54 |
36 |
24 |
16 |
15 |
7 |
(ui-1 +ui)/2 |
5,9 |
6,9 |
7,9 |
8,9 |
9,9 |
10,9 |
11,9 |
13,5 |
-2,71 |
-1,71 |
-0,71 |
0,29 |
1,29 |
2,29 |
3,26 |
4,89 | |
(((ui-1 +ui)/2)-g3)² |
7,34 |
2,92 |
0,5 |
0,08 |
1,66 |
5,24 |
10,62 |
23,91 |
|
-1.7÷ -1.2 |
-1.2÷ -0.6 |
-0.6÷ -0.1 |
-0.1 ÷0,4 |
0,4÷ 0,9 |
0,9÷ 1,5 |
1,5÷ 2.0 |
1,9÷ 3.0 |
G |
0.106 |
0.29 |
0.54 |
0.71 |
0.82 |
0.89 |
0.96 |
1 |
F |
0,123 |
0,26435 |
0,4562 |
0,6591 |
0,8264 |
0,9278 |
0,9766 |
0,9939 |
|G-F| |
0.017 |
0.025 |
0.083 |
0.05 |
0.006 |
0.04 |
0.02 |
0.006 |
Dn |
g3=8,61
g6=3,62
G=niнак/n
F=0.5+0.5*((ui+1-g3)/√g6) (функция Лапласа)
Критическое значение критерия Колмогорова равно λ0,05=1,36
Так как λ<λ0.05 , то гипотеза H0 о нормальном законе распределения принимается с уровнем значимости 0,05.
Заключение
В ходе работы были достигнуты поставленные цели, т.е. решены основные задачи математической статистики: проверка гипотезы о типе распределения, точечные и интервальные оценки параметров распределения.
Выдвинутая на основании графика гипотеза о нормальном распределении была подтверждена с соответствующим уровнем значимости. Для проверки гипотезы был использован критерий Колмогорова.
Список литературы
Информация о работе Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России