Статистическое наблюдение условий проживания в студенческом общежитии

Автор работы: Пользователь скрыл имя, 27 Февраля 2014 в 10:58, курсовая работа

Краткое описание

В качестве курсовой работы по дисциплине «Статистика» нам было предложено провести статистическое наблюдение. Оно заключается в сборе информации по различным признакам. Я выбрала направление наблюдения, которое включает изучение условий проживания в студенческом общежитии. Данная тема для меня является актуальной, так как я проживаю в общежитии второй год. Поэтому мне интересно более подробно изучить проблемы, которые возникают в процессе проживания и узнать, что по этому поводу думают другие жильцы, чем они заняты в свободное от учебы время, довольны ли состоянием ремонта и многие другие проблемы.

Содержание

Задание на курсовую работу……………………………………………………..3
Введение…………………………………………………………………………...5

Проект статистического наблюдения……………………………………………6

Статистическая сводка данных…………………………………………………..8

Группировка, анализ и обработка полученных данных………………………14

Заключение……………………………………………………………………….34

Список используемой литературы……………………………………………...36

Вложенные файлы: 1 файл

статистика))))на сдачу малинки.docx

— 181.38 Кб (Скачать файл)

= (лет).

2)Мода

 Мода (М0) – это такая величина изучаемого признака, которая встречается в данной совокупности более часто, т.е. один из вариантов признака повторяется чаще, чем все остальные.

Прежде, чем определить конкретное значение моды, необходимо рассчитать модальный интервал.

Модальным интервалом считается интервал, имеющий наибольшую частоту появления признака.

 

В интервальном ряде мода определяется по следующей формуле:

,

 

Где - нижняя граница модального интервала,

        - величина модального интервала,

       - частота модального интервала,

       - частота интервала, следующего за модальным,

        - частота интервала, предшествующего модальному.

 Мода (М0) = (лет)

          Большее количество опрошенных студентов имеет возраст 18 лет .

 

3) Медиана

 Медиана( Ме )- это значение признака, приходящийся на середину ранжированной совокупности.

Для определения медианы рассчитывают ее порядковый номер по следующей формуле:

При определении медианы в дискретном ряду распределяется рассчитывается накопленные частоты.

Медианой будет являться значение ряда, которому соответствует накопленная частота впервые превысившая 50% от объема совокупности.

В интервальном ряде для расчета используется следующая формула:

,

где - нижняя граница медианного интервала,

       - величина медианного интервала,

      - частота медианного интервала,

    - полусумма частот ряда,

     - накопленная частота интервала, предшествующего медианному.

           Медиана  ( Ме) (лет)

Половина опрошенных студентов имеет возраст более 18,5 лет, а другая половина - меньше 18,5 лет.

 

 

            Показатели вариации

         

           Вариация- изменчивость значения признака в рамках совокупности под влиянием комплексного действия различных факторов.

Для объективной оценки вариации используется абсолютные и относительные  показатели.

Абсолютные показатели вариации:

1.Размах или амплитуда вариации (R)- абсолютная разность между максимальным минимальным значением признака из имеющихся в изучаемой совокупности значений. Таким образом, размах вариации вычисляется по формуле:

,

где - наибольшее значение признака,

       - наименьшее значение признака.

 

R=Xmax - Xmin = 23-15=8 (года)

 

2.Среднее линейное отклонение  ( )  – этот показатель представляет собой средние арифметическое из абсолютных значений отклонений отдельных вариантов признака от их среднего значения.

Если данные сгруппированы, то используется следующая формула:

 

,

где - i-ое значение признака,

       - частота повтора варианта

       - средняя величина

 

  (лет)

 

3. Дисперсия (D)- характеризует разброс рассеивания определенной величины относительного среднего значения, представляет собой среднюю арифметическую квадратов отклонений конкретных значений варьирующего признака от его средней.

,

где - i-ое значение признака,

      - частота повтора варианта

     - средняя величина.

 

    (лет)

 

4.  Среднее квадратическое отклонение (σ) - показывает, насколько в среднем  отклоняется конкретные варианты  признаков от среднего значения. Оно равно корню квадратному  из дисперсии, т. е:

;

Совокупность считается однородной, если среднее квадратическое отклонение не превышает 1/3 .

     

 

         

             (лет)

 

 

         Относительные показатели

          . Для целей сравнения колебания различных признаков в одной и той же совокупности или же при сравнении колебания одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации , но и дают характеристику однородности совокупности. Совокупность считается однородной , если коэффициент вариации не превышает 33% . Различают следующие относительные показатели вариации:

 

 

 

 

    1. Коэффициент осцилляции:  

 

    1. Линейный коэффициент вариации: 

 

    1. Нелинейный коэффициент вариации:

 

Так как коэффициент вариации не превышает 33%, то совокупность является однородной.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Расчет коэффициентов оценки связи качественных признаков, представляемых несколькими градациями.

 

Ряд распределения количества студентов проживающих в комнатах и оценка состояния мебели

количество человек проживающих в комнате

вариант ответа

всего

1

2

3

4

5

кол-во

уд.

вес

кол-во

уд.

вес

кол-во

уд.

вес

кол-во

уд.

вес

кол-во

уд.

вес

1

0

0

0

0

0

0

2

20

2

12

4

2

2

67

3

30

2

18

4

40

3

19

14

3

1

33

7

70

7

64

3

30

6

38

24

4

0

0

0

0

2

18

1

10

5

31

8

итого

3

100

10

100

11

100

10

100

16

100

50


 

         Из таблицы  видно, что большинство мебели  в  комнатах находится в среднем  состоянии, 3 человека (6 %) оценили состояние  мебели в 1 балл, 16 человек (32 %) оценили  состояние мебели в 5 баллов. Также можно отметить, что в большинстве случаев в комнатах проживает по три человека (48 %) и только в четырёх комнатах проживает по одному студенту(8 %).

 

   Когда каждый из качественных  признаков состоит более чем  из двух групп, то для определения  тесноты связи возможно применение коэффициента взаимной сопряженности Пирсона – Чупрова

 

                ;       ,

где - показатель взаимной сопряженности;

       - определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки. Вычитая из этой суммы 1, получаем величину .

 

                                ;

- число значений (групп) первого признака;

- число  значений (групп) второго признака.

Чем ближе величины  Кч и Кп к 1, тем связь теснее.

 

                            .

 

         

В данном случае так как  =0,47 и =0,152, то связь будет умеренная и прямая.

 

Ряд распределения возраста студентов и провождение свободного времени в общежитии

 

 

провождение свободного времени в общежитии

возраст

Итого

менее 17 лет

17-19

19-21

21 и  старше

кол-во

уд. вес

кол-во

уд. вес

кол-во

уд. вес

кол-во

уд. вес

играю в компьютерные игры

2

18

5

28

2

15

4

50

13

читаю

3

27

2

11

3

23

1

13

9

другое

6

55

11

61

8

62

3

37

28

итого

11

100

18

100

13

100

8

100

50


 

 

Расчет коэффициента корреляции

Корреляция – статистическая зависимость между случайными величинами, не имеющая строго-функционального характера и предполагающая, что изменения одной из величин приводит к изменению математического ожидания других величин.

Виды корреляции:

  1. Парная – связь между двумя факторными признаками или между факторным признаком и результатом.
  2. Частная – зависимость результативного признака от одного из факторных признаков при фиксированном значении остальных факторов.

№, п/п

количество месяцев

оплата за общежитие

ХУ

Х2

(Хi – Х)2

(Уi – У)2

1

12

100

1200

144

3,69

635,04

2

10

70

700

100

0,01

23,04

3

8

50

400

64

4,33

615,04

4

10

70

700

100

0,01

23,04

5

12

100

1200

144

3,69

635,04

6

4

70

280

16

36,97

23,04

7

10

70

700

100

0,01

23,04

8

10

100

1000

100

0,01

635,04

9

10

70

700

100

0,01

23,04

10

10

70

700

100

0,01

23,04

11

12

100

1200

144

3,69

635,04

12

10

100

1000

100

0,01

635,04

13

12

100

1200

144

3,69

635,04

14

10

70

700

100

0,01

23,04

15

4

50

200

16

36,97

615,04

16

10

70

700

100

0,01

23,04

17

10

35

350

100

0,01

1584,04

18

12

100

1200

144

3,69

635,04

19

10

70

700

100

0,01

23,04

20

12

100

1200

144

3,69

635,04

21

12

100

1200

144

3,69

635,04

22

12

70

840

144

3,69

23,04

23

10

70

700

100

0,01

23,04

24

12

35

420

144

3,69

1584,04

25

10

70

700

100

0,01

23,04

26

10

50

500

100

0,01

615,04

27

4

50

200

16

36,97

615,04

28

10

70

700

100

0,01

23,04

29

10

100

1000

100

0,01

635,04

30

12

100

1200

144

3,69

635,04

31

12

35

420

144

3,69

1584,04

32

12

70

840

144

3,69

23,04

33

12

100

1200

144

3,69

635,04

34

12

100

1200

144

3,69

635,04

35

12

100

1200

144

3,69

635,04

36

10

70

700

100

0,01

23,04

37

8

50

400

64

4,33

615,04

38

10

100

1000

100

0,01

635,04

39

4

35

140

16

36,97

1584,04

40

10

35

350

100

0,01

1584,04

41

10

70

700

100

0,01

23,04

42

12

100

1200

144

3,69

635,04

43

8

50

400

64

3,69

615,04

44

12

100

1200

144

3,69

635,04

45

10

100

1000

100

0,01

635,04

46

10

35

350

100

0,01

1584,04

47

10

70

700

100

0,01

4199,04

48

10

100

1000

100

0,01

635,04

49

10

70

700

100

0,01

23,04

50

10

70

700

100

0,01

23,04

итого

504

3740

38890

5304

223,04

29874,00


 

 

 

Х=504/50= 10,08


У=3740/50=74,8


 

Х У=38890/50=777,8


√223,04/50=2,11

√29874/50=24,4

777,8-10,08*74,8)/(2,11*24,4)=0,46

0,3≤0,46<0,5 – связь слабая.

 

Регрессионный анализ заключается в определении аналитического выражения связи ,в котором изменения одной величины обусловлено влиянием одного или нескольких других признаков. Регрессионный анализ используется для оценки формы связи и дополняет корреляционный анализ.

Для нахождения параметров уравнения регрессии используется метод наименьших квадратов, суть которого заключается в том, что сумма квадратов отклонений фактических значений признака от значений полученных  по уравнению регрессий должна быть минимальна.

Нахождение параметров aᵢ предполагает решений специальных систем уравнений.

 

 

постоянная величина, показывающая усредненное воздействие на результат тех факторов ,которые не учтены в модели.

коэффициент регрессии ,показывающий на сколько в среднем будет меняться результат при изменении  значений фактора Х на единицу.

50+504=3740


504+5304=38890

+10,087482


+10,52=77,16

20,77


5,36

Ух=20,77+5,36х – уравнение прямой (линия тренда).

Построим график:

 

 

 

 

 

 

 

 

 

Непараметрические показатели связи

 

Непараметрические показатели связи – рассчитываются не по исходным данным, а на основе рангов, знаков, либо количество значений признака.

Ранг – порядковый номер значений признака, при условии, что все данные располагаются по возрастанию или по убыванию.

Ранжирование – процедура упорядочения значений признака по возрастанию или убыванию.

Если встречаются одинаковые значения признака, им присваиваются связные (связанные) значения рангов. Связные ранги рассчитывают по формуле средней арифметической на основе порядковых номеров одинаковых значений.

Построим ряд распределения, характеризующий ремонт при заселении и оценку состояния мебели в комнатах.

 

Ряд распределения по ремонту при заселении и оценка состояния мебели в комнатах

ремонт при заселении

оценка состояния мебели

итого

1- 3

3- 5

да

11

4

15

нет

8

27

35

итого

19

31

50

Информация о работе Статистическое наблюдение условий проживания в студенческом общежитии