Автор работы: Пользователь скрыл имя, 27 Февраля 2014 в 10:58, курсовая работа
В качестве курсовой работы по дисциплине «Статистика» нам было предложено провести статистическое наблюдение. Оно заключается в сборе информации по различным признакам. Я выбрала направление наблюдения, которое включает изучение условий проживания в студенческом общежитии. Данная тема для меня является актуальной, так как я проживаю в общежитии второй год. Поэтому мне интересно более подробно изучить проблемы, которые возникают в процессе проживания и узнать, что по этому поводу думают другие жильцы, чем они заняты в свободное от учебы время, довольны ли состоянием ремонта и многие другие проблемы.
Задание на курсовую работу……………………………………………………..3
Введение…………………………………………………………………………...5
Проект статистического наблюдения……………………………………………6
Статистическая сводка данных…………………………………………………..8
Группировка, анализ и обработка полученных данных………………………14
Заключение……………………………………………………………………….34
Список используемой литературы……………………………………………...36
= (лет).
2)Мода
Мода (М0) – это такая величина изучаемого признака, которая встречается в данной совокупности более часто, т.е. один из вариантов признака повторяется чаще, чем все остальные.
Прежде, чем определить конкретное значение моды, необходимо рассчитать модальный интервал.
Модальным интервалом считается интервал, имеющий наибольшую частоту появления признака.
В интервальном ряде мода определяется по следующей формуле:
Где - нижняя граница модального интервала,
- величина модального интервала,
- частота модального интервала,
- частота интервала, следующего за модальным,
- частота интервала, предшествующего модальному.
Мода (М0) = (лет)
Большее количество опрошенных студентов имеет возраст 18 лет .
3) Медиана
Медиана( Ме )- это значение признака, приходящийся на середину ранжированной совокупности.
Для определения медианы рассчитывают ее порядковый номер по следующей формуле:
При определении медианы в дискретном ряду распределяется рассчитывается накопленные частоты.
Медианой будет являться значение ряда, которому соответствует накопленная частота впервые превысившая 50% от объема совокупности.
В интервальном ряде для расчета используется следующая формула:
где - нижняя граница медианного интервала,
- величина медианного интервала,
- частота медианного интервала,
- полусумма частот ряда,
- накопленная частота интервала, предшествующего медианному.
Медиана ( Ме) (лет)
Половина опрошенных студентов имеет возраст более 18,5 лет, а другая половина - меньше 18,5 лет.
Показатели вариации
Вариация- изменчивость значения признака в рамках совокупности под влиянием комплексного действия различных факторов.
Для объективной оценки вариации используется абсолютные и относительные показатели.
Абсолютные показатели вариации:
1.Размах или амплитуда
где - наибольшее значение признака,
- наименьшее значение признака.
R=Xmax - Xmin = 23-15=8 (года)
2.Среднее линейное отклонение ( ) – этот показатель представляет собой средние арифметическое из абсолютных значений отклонений отдельных вариантов признака от их среднего значения.
Если данные сгруппированы, то используется следующая формула:
где - i-ое значение признака,
- частота повтора варианта
- средняя величина
(лет)
3. Дисперсия (D)- характеризует разброс рассеивания определенной величины относительного среднего значения, представляет собой среднюю арифметическую квадратов отклонений конкретных значений варьирующего признака от его средней.
где - i-ое значение признака,
- частота повтора варианта
- средняя величина.
(лет)
4. Среднее квадратическое
Совокупность считается однородной, если среднее квадратическое отклонение не превышает 1/3 .
(лет)
Относительные показатели
. Для целей сравнения колебания различных признаков в одной и той же совокупности или же при сравнении колебания одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации , но и дают характеристику однородности совокупности. Совокупность считается однородной , если коэффициент вариации не превышает 33% . Различают следующие относительные показатели вариации:
Так как коэффициент вариации не превышает 33%, то совокупность является однородной.
Расчет коэффициентов оценки связи качественных признаков, представляемых несколькими градациями.
Ряд распределения количества студентов проживающих в комнатах и оценка состояния мебели
количество человек проживающих в комнате |
вариант ответа |
всего | |||||||||
1 |
2 |
3 |
4 |
5 | |||||||
кол-во |
уд. вес |
кол-во |
уд. вес |
кол-во |
уд. вес |
кол-во |
уд. вес |
кол-во |
уд. вес | ||
1 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
20 |
2 |
12 |
4 |
2 |
2 |
67 |
3 |
30 |
2 |
18 |
4 |
40 |
3 |
19 |
14 |
3 |
1 |
33 |
7 |
70 |
7 |
64 |
3 |
30 |
6 |
38 |
24 |
4 |
0 |
0 |
0 |
0 |
2 |
18 |
1 |
10 |
5 |
31 |
8 |
итого |
3 |
100 |
10 |
100 |
11 |
100 |
10 |
100 |
16 |
100 |
50 |
Из таблицы видно, что большинство мебели в комнатах находится в среднем состоянии, 3 человека (6 %) оценили состояние мебели в 1 балл, 16 человек (32 %) оценили состояние мебели в 5 баллов. Также можно отметить, что в большинстве случаев в комнатах проживает по три человека (48 %) и только в четырёх комнатах проживает по одному студенту(8 %).
Когда каждый из качественных
признаков состоит более чем
из двух групп, то для определения
тесноты связи возможно
; ,
где - показатель взаимной сопряженности;
- определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки. Вычитая из этой суммы 1, получаем величину .
- число значений (групп) первого признака;
- число значений (групп) второго признака.
Чем ближе величины Кч и Кп к 1, тем связь теснее.
.
В данном случае так как =0,47 и =0,152, то связь будет умеренная и прямая.
Ряд распределения возраста студентов и провождение свободного времени в общежитии
провождение свободного времени в общежитии |
возраст |
Итого | |||||||
менее 17 лет |
17-19 |
19-21 |
21 и старше | ||||||
кол-во |
уд. вес |
кол-во |
уд. вес |
кол-во |
уд. вес |
кол-во |
уд. вес | ||
играю в компьютерные игры |
2 |
18 |
5 |
28 |
2 |
15 |
4 |
50 |
13 |
читаю |
3 |
27 |
2 |
11 |
3 |
23 |
1 |
13 |
9 |
другое |
6 |
55 |
11 |
61 |
8 |
62 |
3 |
37 |
28 |
итого |
11 |
100 |
18 |
100 |
13 |
100 |
8 |
100 |
50 |
Расчет коэффициента корреляции
Корреляция – статистическая зависимость между случайными величинами, не имеющая строго-функционального характера и предполагающая, что изменения одной из величин приводит к изменению математического ожидания других величин.
Виды корреляции:
№, п/п |
количество месяцев |
оплата за общежитие |
ХУ |
Х2 |
(Хi – Х)2 |
(Уi – У)2 |
1 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
2 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
3 |
8 |
50 |
400 |
64 |
4,33 |
615,04 |
4 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
5 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
6 |
4 |
70 |
280 |
16 |
36,97 |
23,04 |
7 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
8 |
10 |
100 |
1000 |
100 |
0,01 |
635,04 |
9 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
10 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
11 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
12 |
10 |
100 |
1000 |
100 |
0,01 |
635,04 |
13 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
14 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
15 |
4 |
50 |
200 |
16 |
36,97 |
615,04 |
16 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
17 |
10 |
35 |
350 |
100 |
0,01 |
1584,04 |
18 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
19 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
20 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
21 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
22 |
12 |
70 |
840 |
144 |
3,69 |
23,04 |
23 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
24 |
12 |
35 |
420 |
144 |
3,69 |
1584,04 |
25 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
26 |
10 |
50 |
500 |
100 |
0,01 |
615,04 |
27 |
4 |
50 |
200 |
16 |
36,97 |
615,04 |
28 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
29 |
10 |
100 |
1000 |
100 |
0,01 |
635,04 |
30 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
31 |
12 |
35 |
420 |
144 |
3,69 |
1584,04 |
32 |
12 |
70 |
840 |
144 |
3,69 |
23,04 |
33 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
34 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
35 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
36 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
37 |
8 |
50 |
400 |
64 |
4,33 |
615,04 |
38 |
10 |
100 |
1000 |
100 |
0,01 |
635,04 |
39 |
4 |
35 |
140 |
16 |
36,97 |
1584,04 |
40 |
10 |
35 |
350 |
100 |
0,01 |
1584,04 |
41 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
42 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
43 |
8 |
50 |
400 |
64 |
3,69 |
615,04 |
44 |
12 |
100 |
1200 |
144 |
3,69 |
635,04 |
45 |
10 |
100 |
1000 |
100 |
0,01 |
635,04 |
46 |
10 |
35 |
350 |
100 |
0,01 |
1584,04 |
47 |
10 |
70 |
700 |
100 |
0,01 |
4199,04 |
48 |
10 |
100 |
1000 |
100 |
0,01 |
635,04 |
49 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
50 |
10 |
70 |
700 |
100 |
0,01 |
23,04 |
итого |
504 |
3740 |
38890 |
5304 |
223,04 |
29874,00 |
Х=504/50= 10,08
У=3740/50=74,8
Х У=38890/50=777,8
√223,04/50=2,11
√29874/50=24,4
777,8-10,08*74,8)/(2,11*24,4)=
0,3≤0,46<0,5 – связь слабая.
Регрессионный анализ заключается в определении аналитического выражения связи ,в котором изменения одной величины обусловлено влиянием одного или нескольких других признаков. Регрессионный анализ используется для оценки формы связи и дополняет корреляционный анализ.
Для нахождения параметров уравнения регрессии используется метод наименьших квадратов, суть которого заключается в том, что сумма квадратов отклонений фактических значений признака от значений полученных по уравнению регрессий должна быть минимальна.
Нахождение параметров aᵢ предполагает решений специальных систем уравнений.
постоянная величина, показывающая усредненное воздействие на результат тех факторов ,которые не учтены в модели.
коэффициент регрессии ,показывающий на сколько в среднем будет меняться результат при изменении значений фактора Х на единицу.
50+504=3740
504+5304=38890
+10,087482
+10,52=77,16
20,77
5,36
Ух=20,77+5,36х – уравнение прямой (линия тренда).
Построим график:
Непараметрические показатели связи
Непараметрические показатели связи – рассчитываются не по исходным данным, а на основе рангов, знаков, либо количество значений признака.
Ранг – порядковый номер значений признака, при условии, что все данные располагаются по возрастанию или по убыванию.
Ранжирование – процедура упорядочения значений признака по возрастанию или убыванию.
Если встречаются одинаковые значения признака, им присваиваются связные (связанные) значения рангов. Связные ранги рассчитывают по формуле средней арифметической на основе порядковых номеров одинаковых значений.
Построим ряд распределения, характеризующий ремонт при заселении и оценку состояния мебели в комнатах.
Ряд распределения по ремонту при заселении и оценка состояния мебели в комнатах
ремонт при заселении |
оценка состояния мебели |
итого | |
1- 3 |
3- 5 | ||
да |
11 |
4 |
15 |
нет |
8 |
27 |
35 |
итого |
19 |
31 |
50 |
Информация о работе Статистическое наблюдение условий проживания в студенческом общежитии