Закономерности распределения статистических величин и показатели

Автор работы: Пользователь скрыл имя, 17 Октября 2012 в 20:37, курсовая работа

Краткое описание

Цель работы: раскрыть теоретические основы закономерностей распределения статистических величин, рассмотреть ряды распределения статистических величин и показатели, характеризующие вариационный ряд.

Вложенные файлы: 1 файл

Курсовая по статистике - Таня.doc

— 420.50 Кб (Скачать файл)

 

 Представленный ряд  распределения является интервальным, в основания образования групп  которого лежит непрерывный признак  – уровень дохода.

 

 

2. 2 Графическое  представление статистических рядов  распределения

 

Анализ рядов распределения  можно наглядно проводить на основе

их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения

 

2. 2. 1 Полигон

 

Полигон распределения используют для изображения дискретных (прерывных) вариационных рядов. При графическом изображении распределения используют прямоугольные координаты. Для этого на оси абсцисс в линейном масштабе откладывают ранжированные значения варьирующего признака, а на оси ординат наносят шкалу частот. В результате получаем ломанную линию - полигон частот.

Таблица 3.1 Распределение  рабочих по уровню заработной платы.

Месячная заработная плата, руб. (интервал от - до)

4000 (3500-4000)

4500 (4000-4500)

5000 (4500-5000)

5500 (5000-5500)

6000 (5500-6000)

6500 (6000-6500)

7000 (6500-7000)

7500 (7000-7500)

Итого:

Число рабочих, %

10,0

16,2

18,8

18,1

15,2

9,5

6,4

5,8

100

 

65

105

122

117

99

62

42

38

650

"/",   чел

 

 

 

 

 

 

 

 

 


 

Полигон распределения  рабочих по уровню заработной платы (таблица 3.1) представлен на рисунке 3.1.

 

Рисунок 1 – Полигон  распределения рабочих по уровню заработной платы

 

2. 2. 2 Гистограмма.

 

Гистограмма наглядно представляет интервальный ряд в форме ступенчатой фигуры, состоящей из прямоугольников, основаниями которых служат выделенные интервалы, а высоты равны отношению суммы частот вариант к длине интервала.

Рисунок 2. - гистограмма распределения 650 рабочих по уровню заработной платы, где на горизонтальной оси даны отрезки, соответствующие интервалам таблицы 3.1 (размер заработной платы в рублях). Над каждым отрезком строят прямоугольник с высотой (частота каждого интервала), равной численности рабочих. Гистограмма имеет следующие характерные особенности:

l. Все отрезки на горизонтальной оси (оси абсцисс) имеют одинаковую длину, что наглядно представляет частости заработной платы соответствующих размеров.

2.Чтобы характер распределения  на рисунке (чертеже) не менялся  в зависимости от объединения  или дробления групп, следует учитывать размер интервала группирования.

З.Для устранения влияния  величины интервала следует использовать число единиц (абсолютным или относительным), приходящихся в каждом интервале на одну единицу его ширины, или плотность распределения. Это правило учитывает то, что при прочих равных условиях число единиц в группе тем больше, чем шире её интервал.

4.Высота ступеней гистограммы должна отвечать плотности распределения в соответствующих интервалах.

Это означает, что частотам на гистограмме  соответствует не высота ступеней, а их площади. Умножив ширину их основания (ширину интервала) на их высоту (плотность распределения), мы вернемся к числу единиц (абсолютному или относительному), попавших в данный интервал при группировке.

Указанное правило необходимо иметь  в виду не только при объединении интервалов, но и при их дроблении.

Гистограмму можно преобразовать в полигон распределения, найдя середины сторон прямоугольников и соединив эти точки прямыми или пунктирными линиями.

При построении гистограммы распределения вариационного ряда с неравными интервалами на ось ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это делают, как правило, для получения возможности сравнения частоты.

Рисунок 2 – Гистограмма  распределения рабочих по уровню заработной платы

Плотность распределения - это отношение частоты или частости к величине интервала, то есть, сколько единиц в каждой группе приходится на единицу длины (ширины) интервала.

В качестве примера рассчитаем плотности  распределения по данным таблицы 3.1, в которой даны результаты группировки  рабочих по уровню заработной платы (первые две строчки). Ширина интервала при равных её значениях в каждой группе - 500, при этом плотность распределения первого интервала равна 0,13 (65:500), второго - 0,21 (105:500), третьего - 0,24 и т.д.

 

   2. 2. 3 Кумулята и огива.

 

Кумулята – ряд распределения, где по оси абсцисс откладывают варианты признака, а по оси ординат – накопленные частости. Полученные точки соединяются прямыми, которые и образуют кумуляту. В кумуляте нижней границе первого интервала соответствует частость равная нулю, а верхней – вся накопленная частость данного интервала. Вариационный ряд с накопленными частостями на графике изображаются кривой, называемой кумулятой распределения.

При построении кумуляты интервального ряда на оси ординат – накопленные частоты.

 Рисунок 3 – Кривая  накопленных частот – кумулята

 

Огива – графическое изображение статистической совокупности в виде ранжированного ряда распределения, показывающее интенсивность изменения изучаемого признака.

Строят огиву нанесением:

- на ось абсцисс  – накопленных областей;

- на ось ординат  – ранжированных по возрастанию  значений вариант признака.

 

Рисунок 4 – Огива распределения  рабочих по уровню заработной платы

 

Графическое изображение рядов распределения позволяет более наглядно представить распределение данных статистического наблюдения.

 

 

 

 

 

 

 

 

 

 

3. Показатели, характеризующие вариационный ряд

 

Вариация – это различия в значениях изучаемого признака у разных единиц данной совокупности в один и тот же период или момент времени. Причина вариации – различные условия существования разных единиц совокупности.

Вариация присуща всем без исключения явлениям природы и общества, кроме законодательно закрепительных нормативов значений отдельных социальных признаков.

Вариационный  ряд – это упорядоченное распределение единиц совокупности по возрастающим (убывающим), то есть ранжированным, значениям признака и подсчет числа единиц с тем или иным его значением.

При достаточно большом  числе единиц совокупности ранжированный ряд становится громоздким, а его построение занимает длительное время. В этом случае вариационный ряд строят группировкой единиц совокупности по значениям изучаемого признака.

 

3. 1 Показатели  центра распределения и структурные характеристики вариационного ряда.

Для характеристики среднего значения признака в вариационном ряду используются так называемые показатели центра распределения. К ним относятся средняя величина признака, мода и медиана.

Расчет средней величины признака в вариационном ряду осуществляется по формуле средней арифметической взвешенной:

,

где х - варианты признака; f - частоты или частости.

При расчете средней  величины в интервальном ряду в качестве вариантов признака используются значения середины интервалов. Для нахождения середины открытых интервалов (в нашем примере это первая и последняя группы) необходимо их предварительно условно закрыть, то есть определить недостающую верхнюю и нижнюю границы. Принято считать, что в первой группе величина интервала равна интервалу второй группы, а в последней — интервалу предыдущей.

Мода — значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретном ряду модой является вариант с наибольшей частотой

В интервальном вариационном ряду мода рассчитывается по формуле:

где хMo — нижняя граница модального интервала; iMo— величина модального интервала; fMo, fMo-1, fMo+1 - частоты (частости) соответственно модального, домодального и послемодального интервалов.

Модальный интервал — это интервал, имеющий наибольшую частоту (частость).

Приближенно модальное  значение признака можно определить  графически по гистограмме. Для этого нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в верхний угол последующего столбца, а из правого угла - в верхний правый угол предыдущего. Абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. 

Медиана — вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина — больше, чем медиана.

В интервальном ряду медиана  определяется по формуле:

где хMe— начало медианного интервала;   iMe  - величина медианного интервала; - общая сумма частот вариационного ряда; fMe— частота (частость) медианного интервала; SMe-1 — сумма накопленных частот (частостей) в домедианном интервале.

Медианный интервал - это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот (частостей) до числа, превышающего половину объема совокупности.

По соотношению характеристик  центра распределения (средней величины, моды и медианы) можно судить о симметричности эмпирического ряда распределения. Симметричным является распределение, в котором частоты двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В симметричном распределении средняя величина, медиана и мода равны между собой: = Ме = Мо.

Если  > Me > Mo, то имеет место правосторонняя асимметрия, то есть большая часть единиц совокупности имеет значения изучаемого признака, превышающие модальное значение. На графике распределения правая ветвь относительно максимальной ординаты вытянута больше, чем левая.

Соотношение < Me < Mo характерно для левосторонней асимметрии, при которой большая часть единиц совокупности имеет значения признака ниже модального значения. На графике распределения левая ветвь вытянута больше, чем правая.

При анализе вариационного ряда важно знать не только направление асимметрии (правосторонняя или левосторонняя), но и ее степень, которая измеряется с помощью коэффициентов асимметрии.

Моду и медиану называют еще структурными средними, поскольку они дают количественную характеристику структуры строения вариационных рядов. К структурным характеристикам относятся и другие порядковые статистики: квартили — делящие ряд на 4 равные части, децили — делящие ряд на 10 частей, перцинтили - на  100 частей и др.

Рассмотрим расчет показателей  децилей, нашедших широкое применение в анализе дифференциации различных  социально-экономических явлений.

Общая схема вычислений децилей следующая:

1) поскольку децили  отсекают десятые части совокупности, по накопленным частостям определяем интервалы, куда попадают порядковые номера децилей: для первого дециля — интервал, где находится вариант, отсекающий 10% единиц совокупности с наименьшими значениями признака; для второго — 20% единиц с наименьшими значениями и т. д.; для девятого дециля — интервал, содержащий вариант, отсекающий 90% единиц с наименьшими значениями, или, что то же самое, 10% единиц совокупности с наибольшими значениями признака;

2) рассчитываем величину  децилей по формулам, аналогичным  формуле для нахождения медианы.  Например, первый и девятый децили  находятся по формулам:

 

где x0D1 , xOD9 — начала интервалов, где находятся первый и девятый децили; iDl, iD9 — величины интервалов, где находятся первый и девятый децили; — общая сумма частот (частостей); SD1-1, SD9-1 - суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых находятся первый и  девятый  децили;  fD1,  fD9   — частоты   (частости)   интервалов, содержащих первый и девятый децили. 

        Соотношение девятого и первого децилей называется коэффициентом децильной дифференциации (Kd):

Информация о работе Закономерности распределения статистических величин и показатели