- Средняя геометрическая
Средняя геометрическая
используется для анализа динамики явлений
и позволяет определить средний коэффициент
роста. При расчете средней геометрической
индивидуальные значения признака представляют
собой относительные показатели динамики,
построенные в виде цепных величин, как
отношения каждого уровня к предыдущему.
7
Средняя геометрическая простая рассчитывается
по формуле:
,
где
– знак произведения,
N – число осредняемых величин.
Пример. Количество зарегистрированных преступлений за 4 года возросло в 1,57 раза,
в т. ч. за 1-й – в 1,08 раза, за 2-й – в 1,1 раза,
за 3-й – в 1,18 и за 4-й – в 1,12 раза. Тогда
среднегодовой темп роста количества преступлений составляет:
, т.е. число зарегистрированных преступлений
ежегодно росло в среднем на 12%.
Средняя геометрическая взвешенная используется,
когда временные интервалы неодинаковы:
,
где
– временной интервал.
2.4. Средняя квадратическая
величина
Если
при замене индивидуальных величин признака
на среднюю величину необходимо сохранить
неизменной сумму квадратов исходных
величин, то средняя будет являться квадратической
средней величиной.
, для простой.
, для взвешенной.
Например, имеются три участка земельной
площади со сторонами квадрата: х1 = 100 м; х2 = 200 м; х3 = 300 м. Заменяя
разные значения длины сторон на среднюю,
мы очевидно, должны исходить из сохранения
общей площади всех участков. Арифметическая
средняя величина (100 + 200 + 300):3 = 200 м не удовлетворяет
этому условию, так как общая площадь трех
участков со стороной 200 м была бы равна:
3*(200 м)2 =120 000 м2. В то же время
площадь исходных трех участков равна:
(100 м)2 + (200 м)2 + ( 300 м)2 = 140 000 м2. Правильный
ответ дает квадратическая средняя:
8
Формула средней
квадратической используется для измерения
степени колеблемости индивидуальных
значений признака вокруг средней арифметической
в рядах распределения. Так, при расчете показателей
вариации среднюю вычисляют из квадратов
отклонений индивидуальных значений признака
от средней арифметической величины.
2.5. Средняя
кубическая величина
Если по условиям задачи необходимо сохранить
неизменной сумму кубов индивидуальных
значений признака при их замене на среднюю
величину, мы приходим к средней кубической, имеющей вид:
, для простой.
, для взвешенной.
Средняя кубическая
имеет ограниченное применение в практике
статистики. Ею пользуются для исчисления
средних диаметров труб, стволов и т.п.,
необходимых для разного рода расчетов,
как, например, для определения запасов
древесины на складах и на лесных участках.
Все рассмотренные выше средние
величины могут быть представлены в виде
общей формулы:
где – средняя величина; – индивидуальное
значение; n – число единиц изучаемой совокупности; k –
показатель степени, определяющий вид
средней.
При использовании одних и тех
же исходных данных, чем больше k в общей
формуле степенной средней, тем больше
средняя величина. Из этого следует, что
между величинами степенных средних существует
закономерное соотношение:
Средние величины, описанные
выше, дают обобщенное представление об
изучаемой совокупности и с этой точки
зрения их теоретическое, прикладное и
познавательное значение бесспорно. Но
бывает, что величина средней не совпадает
ни с одним из реально существующих вариантов,
поэтому кроме рассмотренных средних
в статистическом анализе целесообразно
использовать величины конкретных вариантов,
занимающие в упорядоченном (ранжированном)
ряду значений признака вполне определенное
положение. Среди таких величин наиболее
употребительными являются структурные, или описательные,
средние– мода (Мо) и медиана (Ме).
9
2.6. Медиана
Медиана (Ме) — величина варьирующего
признака, делящая совокупность на две
равные части — со значениями признака
меньше медианы и со значениями признака
больше медианы.
В ранжированном вариационном
ряду с нечетным числом единиц совокупности
медианой является значение признака
у средней в ряду единицы. Медиана не зависит
от значений признака, стоящих на краях
вариационного ряда.
В интервальном вариационном
ряду для нахождения медианы применяется формула:
,
где XMe - нижняя
граница интервала, в котором находится
медиана;
f´Me - число наблюдений
(или объем взвешивающего признака), накопленное до
начала медианного интервала;
fMe - число наблюдений
или объем взвешивающего признака в медианном
интервале (в абсолютном или относительном
выражении);
i - величина медианного
интервала;
- половина от общего
числа наблюдений или половина объема
того показателя, который используется
в качестве взвешивающего в формулах расчета
средней величины (в абсолютном или относительном
выражении).
Примером такого ряда
может служить месячная заработная плата
рабочих завода.
Порядковый номер рабочего |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
итого |
Месячная заработная плата,
руб. (x) |
90 |
105 |
148 |
160 |
175 |
220 |
250 |
1148 |
В этом ряду среднее
место по размеру заработной платы занимает
рабочий с номером 4, получивший 160 руб.
Эта величина и есть медиана. Меньше и
больше медианы одинаковое число вариантов.
При нечетном числе вариантов (п) порядковый
номер, которому соответствует медиана,
определяется по формуле :
.
10
Когда количество вариантов
в ряду четное число, медианой считают
один из тех вариантов, который по своей
величине мог бы находиться посередине
между вариантами с номером
и
. Так, если бы в цехе
был еще и восьмой рабочий с заработной
платой в 276 руб., то медиана находилась
бы посередине между четвертым и пятым
порядковыми номерами. В таких случаях
принято считать, что в промежутке между
номерами
и
идет равномерное нарастание
или убывание вариантов. Поэтому за медиану
принимают среднюю арифметическую из
вариантов с номерами
и
. В данном примере
Смысл полученного
результата такой: одна половина рабочих
получила за месяц меньше, а другая — больше
167,5 руб.
Следовательно, медиана — обобщающий
показатель распределения совокупности,
уровень признака, который делит совокупность
на две равные части, и представляет обычно
интерес в анализе, как это видно из приведенного
примера.
Медиана, в отличие
от средней, не является абстрактной величиной.
Она находится точно в середине ряда, представляет
собой реальное значение признака, соответствует
определенному варианту и при этом наиболее
точна в случае нечетного числа членов
совокупности. Медиана как обобщающая
характеристика совокупности не может,
однако, заменить среднюю.
Медиана — это
центр распределения численности единиц
совокупности, а средняя — центр распределения
отклонений значений признака от равнодействующей.
Величина медианы определяется лишь одним
или двумя серединными значениями признака.
Изменения всех остальных величин, если
они не меняют последовательности членов
в центре ряда, не находят отражения в
медиане.
Так, если месячную заработную плату наименее
оплачиваемых двух рабочих поднять на
40 руб., это не скажется на медиане, несмотря
на то, что тем самым значительно повышаются
доходы двух рабочих цеха и существенно
выравнивается заработная плата членов
коллектива. Поэтому медиана, представляющая
определенный интерес в анализе, не может
заменить среднюю, которая при замене
реального коллектива абстрактным коллективом
с уравненными значениями признака оставляет
неизменным определяющий показатель совокупности.
Медианой целесообразно
пользоваться, когда не известны границы
открытых крайних интервалов вариационного
ряда, на которые приходится значительная
часть единиц всей совокупности, так как
средняя в этих случаях страдает значительной
неточностью. При исчислении же медианы
отсутствие сведений об этих границах
не влияет на точность расчета.
11
2.7. Мода
Мода (Мо) - это вариант признака, который
при данном сочетании причин разного порядка
чаще всего встречается в вариационном
ряду. Например, цена, по
которой чаще всего реализуется данный
товар на рынке, является модой или модальной
ценой.
13
Месячная заработная плата, которая чаще
всего встречается в данном коллективе,
является для него модальной заработной
платой.
Мода
- типичная величина, в том смысле, что
она встречается в совокупности или объективно может встретиться
чаще других. Она имеет важное значение
для решения некоторых задач, например какой
высоты должны быть предназначенные для
массового потребления станки, столы и
т. п., какое количество детей чаще всего
встречается в семье, какое время дня является
«пиковым» для работы предприятий общественного
питания, электростанций, городского транспорта
и др., какой уровень выполнения плана
наиболее часто встречается в том или
ином коллективе рабочих или предприятий
и т. п.
Мода соответствует
определенному значению признака. На практике
моду находят, как правило, по сгруппированным
данным.
В дискретном
ряду мода определяется без вычисления
как значение признака с наибольшей частотой.
В интервальном
вариационном ряду, тем более при непрерывной
вариации признака, строго говоря, каждое
значение признака встречается только
один раз. Модальным интервалом
является интервал с наибольшей частотой.
Внутри этого интервала находят условное
значение признака, вблизи которого плотность
распределения, то есть число единиц совокупности,
приходящееся на единицу измерения варьирующего
признака, достигает максимума. Это условное
значение и считается точечной модой.
Логично предположить, что такая точечная
мода располагается ближе к той из границ
интервала, за которой частота в соседнем
интервале больше частоты в интервале
за другой границей модального интервала.
Отсюда имеем обычно
применяемую формулу:
,
XMo - нижнее значение признака X в модальном
интервале;
i - величина интервала;
fMo - частота (частость)
повторения признака X в модальном
интервале;
fMo-1 ,fMo+1 - соответственно частоты
(частости) признака для интервала, предшествующего
модальному и следующего за ним.
12
Пример:
Удойность в среднем от одной
коровы за год, кг |
Процент хозяйств |
До 1000 |
7,6 |
1000-1649 |
9,7 |
1650-1999 |
16,1 |
2000-2499 |
37,5 |
2500-2999 |
20,6 |
3000-3999 |
8,2 |
4000 и выше |
0,3 |
|
100 |
14
По табл. модальный
интервал составляет 2000 - 2499шт, так как
ему соответствует наибольшая частота
37,5%, нижняя его граница хо = 2000, а величина
интервала h = 500. Следовательно,
Это значит, что чаще всего встречаются
хозяйства, у которых надой в среднем от
одной коровы составляет 2280 кг.
Для решения практических
задач наибольший интерес представляет
обычно мода, выраженная в виде интервала,
а не дискретным числом. Объясняется это
назначением моды, которая должна выявить
наиболее распространенные размеры явления.
Выраженная в виде дискретного числа мода
часто не отвечает этому требованию. Так,
в нашем примере процент хозяйств, у которых
годовой надой в среднем на одну корову
составляет 2280 кг, хотя и больше, чем
хозяйств с любым другим уровнем надоя,
но сам по себе он может быть небольшим.
Хозяйств же с удойностью в пределах интервала
2000 - 2499 кг - 37,5%, а 2000 - 3000 кг - 58,1, - т. е. весьма значительный
процент.
13
3. Основные методологические
требования расчета средних величин.
Первый этап.
- Если форма выбрана неправильно,
то средняя будет завышена либо занижена.
- Каждая средняя имеет свой особый
смысл и область применения.
-
Решающим в выборе формы средней
является социально-экономическое содержание
явления, сущность которого должна найти
свое количественное выражение в средней.
- Средняя должна, на основе обобщения количественной стороны массовых общественных явлений в неразрывной связи с их качественной стороной, дать ответ на конкретные вопросы, выдвигаемые жизнью.
- Учесть сущность объекта, законы
его развития, его специфику, определить
задачу, которая должна решаться при помощи
средней, и исходя из всего этого установить
определяющий показатель, который должен
найти отражение в средней.
Второй этап.
Выбор формы
средней заключается в определении характера связи между
определяющим свойством и осредняемым
признаком. Если, например,
связь прямо пропорциональна, то для расчета
средней надо воспользоваться формулой
средней арифметической, а при обратной
пропорциональности — формулой средней
гармонической. В случаях, когда связь
выражается в форме геометрической прогрессии,
средняя должна исчисляться по формуле
средней геометрической и т. п.