Вариационные ряды. Квантили

Автор работы: Пользователь скрыл имя, 03 Июня 2012 в 08:57, контрольная работа

Краткое описание

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Вложенные файлы: 1 файл

Контрольная работа.docx

— 39.79 Кб (Скачать файл)
  1. Вариационные ряды.

Важнейшей частью статистического  анализа является построение рядов  распределения (структурной группировки) с целью выделения характерных  свойств и закономерностей изучаемой  совокупности. В зависимости от того, какой признак (количественный или  качественный) взят за основу группировки  данных, различают соответственно типы рядов распределения.

Если за основу группировки взят качественный признак, то такой ряд  распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой  ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют следующие формы вариационного ряда:

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного  ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают  дискретные (прерывные) и непрерывные  признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается  конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное  изменение (размер дохода, стаж работы, стоимость основных фондовпредприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.

Групповая таблица здесь также  имеет две графы. В первой указывается  значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Если в интервальном вариационном ряде в двух последовательных интервалах верхнее предельное значение признака одного интервала равняется нижнему предельному значению второго, условно будем считать, что это число принадлежит второму интервалу. Разность между верхней и нижней границами интервала называют шириной этого интервала.

    Рассматриваются  еще так называемые кумулятивные вариационные ряды. В таких рядах вместо частот или относительных частот определенных  вариант  (или  интервалов)  записаны  накопленные

частоты или относительные  частоты. Для анализа статистических данных, содержащихся в вариационном ряде, целесообразно ввести такую числовую характеристику, как плотность распределения.

    Если в интервальном  вариационном ряде ширина интервала отлична  от  единицы,  то  определяют  абсолютную  и  относительную плотности распределения.

  Отношение частоты ni  интервала ширине hi  этого интервала называют абсолютной плотностью распределения для  і-ого интервала. Обозначатся символом рi: рi=. Абсолютная плотность распределения — это частота, приходящаяся на единицу ширины интервала.

  Относительной плотностью распределения  πi для і-о интервала называют отношение относительной частоты интервала его ширине: πi = .

2. Квантили

В статистике рассматривают  показатели,  делящие  совокупность  данных  в  произвольном отношении. Такие показатели называют квантилями.

    Пусть 0 < р < 1 и статистические данные размещены по возрастанию: х1 х2 ... ≤ хn . Если nр не является целым числом, то квантилем уровня р (обозначим его через zp ) называют варианту xk + 1, где k = [np] означает наибольшее целое число, не превышающее np. Если пр является целым числом, то квантиль zp считают равным полусумме вариант xпр и xпр + 1 .

    Медиана является квантилем уровня 0,5. Если объем совокупности является нечетным числом и равен 2п + 1, то медиана z0,5 равна xn+1, если объем совокупности — четное число, равное 2n, то Me = z0,5 = .

    Квантили z0,25 , z0,5 , z0,75 делят совокупность данных на 4 равные части (кварты). Их называют  квартилями. Четвертая часть

наблюдений лежит ниже z0,25 , половина наблюдений — ниже z0,5 ,

три четверти наблюдений —  ниже z0,75. Таrим образом, три квартили делят совокупность наблюдений на четыре равные части.

    Квантили z0,1, z0,2, ..., z0,9 делят совокупность наблюдений на

10 равных частей. Их называют децилями.

    99 квантилей z0,01, z0,02, ..., z0,99 делят совокупность наблюдений на 100 частей с равным количеством наблюдений в каждой. Их называют перцентилями.

    Если  по  результатам   тестирования  упорядочить  учащихся  по убыванию их успеваемости, то квартили z0,25 , z0,5 , z0,75 делят их

на четыре равные части: в  первую входят лучшие по успеваемости

25% учащихся, во вторую  — следующие 25% по успеваемости учащихся и т. д.

    Квантили являются  удобным показателем для обобщения данных. Даже простая информация о том, что  z0,05 = 15,  z0,15 = 24, говорит, что 5% наблюдений меньше 15, а 10% размещены между 15 и 24.

    Та же как медиану интервального ряда вычисляли по формуле

Me =  xn +  h,  так  и квантиль zp  уровня р  вычисляют по формуле z p = xzp + , где  xzp  — нижняя граница интервала, содержащего квантиль  zp; Szp  – 1 — частота, накопленная  к  интервалу,  содержащему квантиль zp;  nzp       — частота интервала, содержащего квантиль zp ; h —ширина интервала, содержащего квантиль zp .

3. Средняя температура  июня в Москве в течении 40 лет была такой (в 0С):

12,0 13,8 14,0 14,9 15,9 16,9 18,0 20,0 12,0 13,1

14.0 15.0 16,0 17,0 18,1 20,2 12,0 13,0 13,9 15,0

16,9 16,8 18,4 14,0 12,0 13,9 15,0 15,9 17,2 16,0

17,5 19,2 14,0 12,8 14,2 14,9 16,9 18,0 19,3 15,8

а) Определите, к каким  видам относятся данные, приведенные  в условии: одномерные, двумерные  или многомерные, качественные или  количественные, временной ряд или  один временной срез.

б) Упорядочьте эти данные по возрастанию, подсчитайте частоты, относительные частоты значений.

в) Сгруппируйте данные.

Решение:

а)  Данные в условии: одномерные, количественные и один временной срез.

     б)

Xi

12.0

12.8

13.0

13,10

13,80

13,90

14,00

14,20

14,90

15,00

Ni

4

1

1

1

1

2

4

1

2

3

Vi

0.100

0.025

0.025

0.025

0.025

0.050

0.100

0.025

0.050

0.075

Xi

15,80

15,90

16,00

16,80

16,90

17,00

17,20

17,50

18,00

18,10

Ni

1

2

2

1

3

1

1

1

2

1

Vi

0.025

0.050

0.050

0.025

0.075

0.025

0.025

0.025

0.050

0.025

Xi

18,40

19,20

19,30

20,00

20,20

         

Ni

1

1

1

1

1

         

Vi

0.025

0.025

0.025

0.025

0.025

         

 

 

     Xi - значение температуры ,

Ni - частота значений,

Vi - относительная частота значений.

в) 1) Пусть  k = 12, где k – количество интервалов.

2) Тогда, длина каждого интервала h= ===0.745, где Хmax и Хmin- соответственно наибольшее и наименьшее  из наблюдаемых значений.

3) Левую и правую границы  статистических данных Хmax и Хmin раздвигаем на величину и получаем соответственно Х'max= Хmax + =20.573 и Х'min= Хmin  -=11.627

4) Группируем данные по  интервалам, определяем количество  значений  ni,  попавших  в каждый  интервал  (значения,  которые совпадают с границами і-о и (і + 1)-о интервалов, считаем принадлежащими в одинаковой мере  обоим интервалам, т. е.  частотам ni и ni + 1 прибавляем по )

5) Определяем границы интервалов по формуле Х'I = Х'min + ih, где i=0,1,…k, X'0= Х'min

X'0 =11.627, X'1 = 12.37, X'2 =13.12, X'3 = 13.86. X'4 = 14.6, X'5 = 15.35, X'6= 16.09, X'7 = 16.84, X'8 = 17.59, X'9 = 18.33, X'10 =19.07, X'11 =19.82, X'12=20.57.

6) Сгруппированные данные представляем в виде таблицы 1.

Таблица 1

Х'I

11,627 – 12,37

12,37 -13,12

13,12 – 13,86

13,86 – 14,6

14,6 – 15,35

15,35 – 16,09

ni

1

3

1

3

2

3

Vi

0,025

0,075

0,025

0,075

0,05

0,075

Х'I

16,09 – 16,84

16,84 – 17,59

17,59 – 18,33

18,33 – 19,07

19,17 – 19,82

19,82 – 20,57

ni

1

4

2

1

2

2

Vi

0,025

0,1

0,05

0,025

0,05

0,05


 

 

 

 

 

4. Получены данные о  прочности 50 образцов стального  троса ( в условных единицах):

1800 1700 1740 1640 1780 1860 1600 1840 1880 1980

1540 1620 1860 1660 1840 1820 1840 1740 1780 1960

1840 1880 1740 1560 1740 1640 1740 1640 1660 1840

1940 1740 1800 1680 1800 1700 1640 1560 1740 1840

1740 1860 1740 1620 1740 1560 1600 1720 1840 1800

  1. Постройте дискретный вариационный ряд

б) Постройте интервальный вариационный ряд.

в) Для интервального вариационного  ряда вычислите абсолютные и относительные  плотности распределения.

Решение:

а) Объем совокупности равен 50. Выпишем все различные значения о прочности стального троса  и вычислим их частоты и относительные  частоты, накопленные частоты и  относительно накопленные частоты. Результат представим в таблице 2.

 

Таблица 2.

Хi

1540

1560

1600

1620

1640

1660

Ni

1

3

2

2

4

2

Накопительная частота

1

4

6

8

12

14

Vi

0,02

0,06

0,04

0,04

0,08

0,04

Накопительная относительная  частота

0,02

0,08

0,12

0,16

0,24

0,28

Хi

1680

1700

1720

1740

1780

1800

Ni

1

2

1

10

2

4

Накопительная частота

15

17

18

28

30

34

Vi

0,02

0,04

0,02

0,2

0,02

0,08

Накопительная относительная  частота

0,3

0,34

0,36

0,56

0,6

0,68

Хi

1820

1840

1860

1880

1940

1960

Ni

1

7

3

2

1

1

Накопительная частота

35

42

45

47

48

49

Vi

0,02

0,14

0,06

0,04

0,02

0,02

Накопительная относительная  частота

0,7

0,84

0,9

0,94

0,96

0,98

Хi

1980

         

Ni

1

         

Накопительная частота

50

         

Vi

0,02

         

Накопительная относительная  частота

1

         

 

     б) 1) Пусть k = 12, где k – количество интервалов. 

2) Тогда,  длина каждого  интервала  h= ===40, где Хmax и Хmin- соответственно наибольшее и наименьшее  из наблюдаемых значений.

3) Левую и правую границы  статистических данных Хmax и Хmin раздвигаем на величину и получаем соответственно Х'max= Хmax + =2000  и Х'min= Хmin  -=1520

4) Группируем данные по  интервалам, определяем количество  значений  ni,  попавших  в каждый  интервал  (значения,  которые совпадают с границами і-о и (і + 1)-о интервалов, считаем принадлежащими в одинаковой мере  обоим интервалам, т. е.  частотам ni и ni + 1 прибавляем по )

Информация о работе Вариационные ряды. Квантили