Автор работы: Пользователь скрыл имя, 03 Июня 2012 в 08:57, контрольная работа
Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Важнейшей частью статистического
анализа является построение рядов
распределения (структурной группировки)
с целью выделения характерных
свойств и закономерностей
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения
Выделяют следующие формы вариационного ряда:
Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.
Если признак имеет
Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).
Если в интервальном вариационном ряде в двух последовательных интервалах верхнее предельное значение признака одного интервала равняется нижнему предельному значению второго, условно будем считать, что это число принадлежит второму интервалу. Разность между верхней и нижней границами интервала называют шириной этого интервала.
Рассматриваются еще так называемые кумулятивные вариационные ряды. В таких рядах вместо частот или относительных частот определенных вариант (или интервалов) записаны накопленные
частоты или относительные частоты. Для анализа статистических данных, содержащихся в вариационном ряде, целесообразно ввести такую числовую характеристику, как плотность распределения.
Если в интервальном вариационном ряде ширина интервала отлична от единицы, то определяют абсолютную и относительную плотности распределения.
Отношение частоты ni интервала ширине hi этого интервала называют абсолютной плотностью распределения для і-ого интервала. Обозначатся символом рi: рi=. Абсолютная плотность распределения — это частота, приходящаяся на единицу ширины интервала.
Относительной плотностью распределения πi для і-о интервала называют отношение относительной частоты интервала его ширине: πi = .
2. Квантили
В статистике рассматривают показатели, делящие совокупность данных в произвольном отношении. Такие показатели называют квантилями.
Пусть 0 < р < 1 и статистические данные размещены по возрастанию: х1 ≤ х2 ≤ ... ≤ хn . Если nр не является целым числом, то квантилем уровня р (обозначим его через zp ) называют варианту xk + 1, где k = [np] означает наибольшее целое число, не превышающее np. Если пр является целым числом, то квантиль zp считают равным полусумме вариант xпр и xпр + 1 .
Медиана является квантилем уровня 0,5. Если объем совокупности является нечетным числом и равен 2п + 1, то медиана z0,5 равна xn+1, если объем совокупности — четное число, равное 2n, то Me = z0,5 = .
Квантили z0,25 , z0,5 , z0,75 делят совокупность данных на 4 равные части (кварты). Их называют квартилями. Четвертая часть
наблюдений лежит ниже z0,25 , половина наблюдений — ниже z0,5 ,
три четверти наблюдений — ниже z0,75. Таrим образом, три квартили делят совокупность наблюдений на четыре равные части.
Квантили z0,1, z0,2, ..., z0,9 делят совокупность наблюдений на
10 равных частей. Их называют децилями.
99 квантилей z0,01, z0,02, ..., z0,99 делят совокупность наблюдений на 100 частей с равным количеством наблюдений в каждой. Их называют перцентилями.
Если по результатам тестирования упорядочить учащихся по убыванию их успеваемости, то квартили z0,25 , z0,5 , z0,75 делят их
на четыре равные части: в первую входят лучшие по успеваемости
25% учащихся, во вторую — следующие 25% по успеваемости учащихся и т. д.
Квантили являются удобным показателем для обобщения данных. Даже простая информация о том, что z0,05 = 15, z0,15 = 24, говорит, что 5% наблюдений меньше 15, а 10% размещены между 15 и 24.
Та же как медиану интервального ряда вычисляли по формуле
Me = xn + h, так и квантиль zp уровня р вычисляют по формуле z p = xzp + , где xzp — нижняя граница интервала, содержащего квантиль zp; Szp – 1 — частота, накопленная к интервалу, содержащему квантиль zp; nzp — частота интервала, содержащего квантиль zp ; h —ширина интервала, содержащего квантиль zp .
3. Средняя температура июня в Москве в течении 40 лет была такой (в 0С):
12,0 13,8 14,0 14,9 15,9 16,9 18,0 20,0 12,0 13,1
14.0 15.0 16,0 17,0 18,1 20,2 12,0 13,0 13,9 15,0
16,9 16,8 18,4 14,0 12,0 13,9 15,0 15,9 17,2 16,0
17,5 19,2 14,0 12,8 14,2 14,9 16,9 18,0 19,3 15,8
а) Определите, к каким видам относятся данные, приведенные в условии: одномерные, двумерные или многомерные, качественные или количественные, временной ряд или один временной срез.
б) Упорядочьте эти данные
по возрастанию, подсчитайте частоты,
относительные частоты
в) Сгруппируйте данные.
Решение:
а) Данные в условии: одномерные, количественные и один временной срез.
б)
Xi |
12.0 |
12.8 |
13.0 |
13,10 |
13,80 |
13,90 |
14,00 |
14,20 |
14,90 |
15,00 |
Ni |
4 |
1 |
1 |
1 |
1 |
2 |
4 |
1 |
2 |
3 |
Vi |
0.100 |
0.025 |
0.025 |
0.025 |
0.025 |
0.050 |
0.100 |
0.025 |
0.050 |
0.075 |
Xi |
15,80 |
15,90 |
16,00 |
16,80 |
16,90 |
17,00 |
17,20 |
17,50 |
18,00 |
18,10 |
Ni |
1 |
2 |
2 |
1 |
3 |
1 |
1 |
1 |
2 |
1 |
Vi |
0.025 |
0.050 |
0.050 |
0.025 |
0.075 |
0.025 |
0.025 |
0.025 |
0.050 |
0.025 |
Xi |
18,40 |
19,20 |
19,30 |
20,00 |
20,20 |
|||||
Ni |
1 |
1 |
1 |
1 |
1 |
|||||
Vi |
0.025 |
0.025 |
0.025 |
0.025 |
0.025 |
Xi - значение температуры ,
Ni - частота значений,
Vi - относительная частота значений.
в) 1) Пусть k = 12, где k – количество интервалов.
2) Тогда, длина каждого интервала h= ===0.745, где Хmax и Хmin- соответственно наибольшее и наименьшее из наблюдаемых значений.
3) Левую и правую границы статистических данных Хmax и Хmin раздвигаем на величину и получаем соответственно Х'max= Хmax + =20.573 и Х'min= Хmin -=11.627
4) Группируем данные по интервалам, определяем количество значений ni, попавших в каждый интервал (значения, которые совпадают с границами і-о и (і + 1)-о интервалов, считаем принадлежащими в одинаковой мере обоим интервалам, т. е. частотам ni и ni + 1 прибавляем по )
5) Определяем границы интервалов по формуле Х'I = Х'min + ih, где i=0,1,…k, X'0= Х'min
X'0 =11.627, X'1 = 12.37, X'2 =13.12, X'3 = 13.86. X'4 = 14.6, X'5 = 15.35, X'6= 16.09, X'7 = 16.84, X'8 = 17.59, X'9 = 18.33, X'10 =19.07, X'11 =19.82, X'12=20.57.
6) Сгруппированные данные представляем в виде таблицы 1.
Таблица 1
Х'I |
11,627 – 12,37 |
12,37 -13,12 |
13,12 – 13,86 |
13,86 – 14,6 |
14,6 – 15,35 |
15,35 – 16,09 |
ni |
1 |
3 |
1 |
3 |
2 |
3 |
Vi |
0,025 |
0,075 |
0,025 |
0,075 |
0,05 |
0,075 |
Х'I |
16,09 – 16,84 |
16,84 – 17,59 |
17,59 – 18,33 |
18,33 – 19,07 |
19,17 – 19,82 |
19,82 – 20,57 |
ni |
1 |
4 |
2 |
1 |
2 |
2 |
Vi |
0,025 |
0,1 |
0,05 |
0,025 |
0,05 |
0,05 |
4. Получены данные о прочности 50 образцов стального троса ( в условных единицах):
1800 1700 1740 1640 1780 1860 1600 1840 1880 1980
1540 1620 1860 1660 1840 1820 1840 1740 1780 1960
1840 1880 1740 1560 1740 1640 1740 1640 1660 1840
1940 1740 1800 1680 1800 1700 1640 1560 1740 1840
1740 1860 1740 1620 1740 1560 1600 1720 1840 1800
б) Постройте интервальный вариационный ряд.
в) Для интервального
Решение:
а) Объем совокупности равен 50. Выпишем все различные значения о прочности стального троса и вычислим их частоты и относительные частоты, накопленные частоты и относительно накопленные частоты. Результат представим в таблице 2.
Таблица 2.
Хi |
1540 |
1560 |
1600 |
1620 |
1640 |
1660 |
Ni |
1 |
3 |
2 |
2 |
4 |
2 |
Накопительная частота |
1 |
4 |
6 |
8 |
12 |
14 |
Vi |
0,02 |
0,06 |
0,04 |
0,04 |
0,08 |
0,04 |
Накопительная относительная частота |
0,02 |
0,08 |
0,12 |
0,16 |
0,24 |
0,28 |
Хi |
1680 |
1700 |
1720 |
1740 |
1780 |
1800 |
Ni |
1 |
2 |
1 |
10 |
2 |
4 |
Накопительная частота |
15 |
17 |
18 |
28 |
30 |
34 |
Vi |
0,02 |
0,04 |
0,02 |
0,2 |
0,02 |
0,08 |
Накопительная относительная частота |
0,3 |
0,34 |
0,36 |
0,56 |
0,6 |
0,68 |
Хi |
1820 |
1840 |
1860 |
1880 |
1940 |
1960 |
Ni |
1 |
7 |
3 |
2 |
1 |
1 |
Накопительная частота |
35 |
42 |
45 |
47 |
48 |
49 |
Vi |
0,02 |
0,14 |
0,06 |
0,04 |
0,02 |
0,02 |
Накопительная относительная частота |
0,7 |
0,84 |
0,9 |
0,94 |
0,96 |
0,98 |
Хi |
1980 |
|||||
Ni |
1 |
|||||
Накопительная частота |
50 |
|||||
Vi |
0,02 |
|||||
Накопительная относительная частота |
1 |
б) 1) Пусть k = 12, где k – количество интервалов.
2) Тогда, длина каждого интервала h= ===40, где Хmax и Хmin- соответственно наибольшее и наименьшее из наблюдаемых значений.
3) Левую и правую границы статистических данных Хmax и Хmin раздвигаем на величину и получаем соответственно Х'max= Хmax + =2000 и Х'min= Хmin -=1520
4) Группируем данные по интервалам, определяем количество значений ni, попавших в каждый интервал (значения, которые совпадают с границами і-о и (і + 1)-о интервалов, считаем принадлежащими в одинаковой мере обоим интервалам, т. е. частотам ni и ni + 1 прибавляем по )