Автор работы: Пользователь скрыл имя, 18 Февраля 2013 в 15:31, лабораторная работа
Цель работы: Привить навыки первичной обработки эмпирических данных с помощью методов математической статистики.
( , )
Замечание 1: Так как все числовые характеристики выражаются через , то удобнее вначале вычислить числовые значения , а затем значения числовых характеристик.
Замечание 2: Для упрощения расчетов, если они выполняются “вручную” удобнее перейти от данных значений вариант к условиям по формуле
где h – длина интервала группировки,
С – ложный нуль.
Чаще всего в качестве ложного нуля принимается либо варианта, находящаяся в середине вариационного ряда, либо мода (варианта , имеющая наибольшую частоту), либо любое другое число, упрощающее расчеты.
Если за принять какое - либо значение , то соответствующая ему условная варианта будет равна нулю, а слева и справа от нуля будут располагаться соответственно значения 1, 2, 3, 4 и т.д.
Если, например, , то вариационный ряд в условных вариантах примет вид
|
… |
-2 |
-1 |
0 |
1 |
2 |
… |
|
… |
|
|
|
|
|
… |
Числовые характеристики в условных вариантах , , , вычисляют с той лишь разницей, что вместо используется .
Однако после вычисления числовых характеристик в условных вариантах необходимо перейти к первоначальным значениям вариант. Это осуществляется по формулам:
Промежуточные расчеты при вычислении числовых характеристик удобнее оформлять в виде таблицы.
Этап IV. Определение границ истинных значений числовых характеристик изучаемой величины с заданной надежностью.
Числовые характеристики, вычисленные по случайной выборке из генеральной совокупности, лишь приближенно характеризуют истинные значения аналогичных характеристик изучаемой генеральной совокупности. Поэтому возникает вопрос о надежности, с которой можно принять вычисленные значения и о границах допустимых значений. Частично эти вопросы решаются путем нахождения доверительных (надежностных) интервалов для основных числовых характеристик.
Надежностный интервал для генеральной средней имеет вид:
или ,
где
- среднее выборочное
n – объем выборки
, если большая выборка ( ),
t – значение аргумента функции Лапласа, при котором она равна ,
t – находится по таблицам значений функции Лапласа из условия
- вероятность суждений, называемая
надежностью. Она выбирается
Замечание. Если выборка мала (n<30), то надежностный интервал для генеральной средней имеет вид:
где S – исправленное выборочное среднеквадратическое отклонение,
- число, взятое из таблицы значений по объему выборки n и надежности .
При больших n результаты нахождения надежноcтного интервала двумя указанными способами практически неразличимы.
Надежностный интервал для среднеквадратического отклонения имеет вид
т.е. определяется выражением ∙q или, если левая часть отрицательна, то ее отбрасывают и интервал примет вид
где S - исправленное выборочное среднее квадратическое отклонение,
q – табличное значение критических точек , оно зависит от объема выборки n и заданной надежности .
Этап V. Содержательная интерпретация результатов
первичной обработки
Итогом первичной обработки данных служит содержательная интерпретация результатов произведенных вычислений.
Арифметическое среднее, вычисленное по выборочным данным, представляет собой обобщенную характеристику всей совокупности значений в целом. Значение - являясь как бы точкой сгущения значений, характеризует центральное положение возможных значений случайной величины.
Доверительный интервал указывает на то, что с вероятностью , генеральная средняя изучаемой случайной величины заключена в найденном интервале, или, что данный интервал с надежностью содержит в себе истинное среднее значение генеральной совокупности .
Среднее квадратическое отклонение служит показателем, который дает представление о наиболее вероятной средней ошибке отдельного, единичного наблюдения, взятого из данной совокупности.
Основные значения, ядро вариационного ряда содержится в интервале
Отклонение от , превосходящее по модулю возможны, но вероятность их уменьшается по мере удаления от , .
Надежностный интервал с вероятностью содержит в себе значение генерального среднего квадратического отклонения.
Коэффициент асимметрии - указывает на нарушение симметрии, наличие скоса.
Если , то скос наблюдается справа, если , то слева, если , то распределение симметричное.
Коэффициент эксцесса - указывает на характер вершины распределения.
Если , то распределение островершинное, это говорит о том, что значения признака не значительно разбросаны вокруг среднего значения. Если , то распределение пологое, это говорит о том, что значения признака значительно разбросаны вокруг среднего значения. Если , то распределение совпадает со стандартным нормальным.
Коэффициент вариации V – стандартное отклонение, выраженное в процентах к средней арифметической данной совокупности. Он является относительным показателем изменчивости. Если V<10%, то изменчивость считают незначительной, если 10%< V <20% то изменчивость считают средней, если V>20%, то изменчивость значительная.
Использование коэффициента вариации V как показателя колеблемости (вариации) имеет смысл только при положительных значениях вариант и совершенно не применимо, если варианты принимают как положительные так и отрицательные значения.
Рассмотренные числовые характеристики необходимо сопоставлять с вариационным рядом, его графическим изображением и интерпретировать с учетом единиц измерения и содержания, указанных в условиях задачи.
§ 1.2. Алгоритм выполнения работы.
1 Этап. Группировка данных в вариационный ряд и представление его в виде эмпирической функции распределения.
1.
2.
3. s- число групп.
4. - шаг, или разность между двумя соседними вариантами.
5. , .
6. Сгруппируем данные в виде интервального вариационного рядя
… |
||||
|
… |
7. Перейдем от интервального вариационного ряда к дискретному и найдем относительные частоты .
… |
||||
|
… |
|||
|
… |
8. Найдем эмпирическую функцию распределения
F*(x) =
………………………
II Этап. Графическое изображение ряда и эмпирической функции распределения.
Ввиду большой наглядности описание в общем виде опускается (пункты 9,10,11).
III Этап. Вычисление числовых характеристик.
12.
13.
14.
15.
16. .
17. или
18
19. или
20.
21. или
22.
23. или
24.
25. или
IV Этап. Определение границ истинных значений числовых
характеристик.
27.
28.
29. q по таблице q = q(n, )
30.
V Этап. Содержательная интерпретация.
Значения случайной величины изменяются в пределах от до . Значение является обобщённой характеристикой, средним значением, около которого группируется все другие возможные значения изучаемой случайной величины.
Надежностный интервал с вероятностью утверждает, что значения средней (заработной платы) для выборки данного объема n колеблется в пределах от до .
3. Интерпретация .
Отклонение средней величины от отдельно взятого значения cоставляет в среднем .
4. Интерпретация .
Надежностный интервал для указывает с вероятностью на то, что эти отклонения могут принимать значения находящиеся в пределах от до .
5. Интерпретация .
Если 0, то значения случайной величины по отношению к распределяются несимметрично, если =0, то симметрично.
Если >0, то имеет место левосторонний скос, то есть более вероятными будут те значения признака, которые расположены правее среднего. Если <0, то наоборот, наблюдается правосторонний скос и более вероятными будут те значения признака, которые расположены левее среднего.
6. Интерпретация .
Если ≠0, то отклонение от среднего значения происходит не плавно, наблюдается отклонение от нормы.
Если >0, то отклонения небольшие, меньше нормы, среднее значение не резко отличается от других значений.
Если <0, то отклонения большие, больше нормы, среднее значение резко отличается от других возможных значений случайной величины.
Если =0, то отклонения совпадают с нормой.
7. Интерпретация V.
Чем больше значение коэффициента вариации V, тем больше изменчивость случайной величины.
Если V 10%, то изменчивость незначительна;
Если 10<V 20%, то изменчивость средняя;
Если V>20%, то изменчивость значительная.
§ 1.3 Образец выполнения задания
Вариант №0
Дана средняя заработная плата в рублях
120 |
480 |
175 |
490 |
410 |
425 |
430 |
385 |
335 |
315 |
545 |
475 |
480 |
225 |
445 |
255 |
425 |
375 |
325 |
320 |
160 |
245 |
255 |
265 |
445 |
425 |
265 |
410 |
305 |
330 |
335 |
455 |
220 |
265 |
275 |
435 |
275 |
415 |
310 |
340 |
245 |
215 |
215 |
275 |
355 |
415 |
285 |
265 |
315 |
345 |
345 |
230 |
225 |
285 |
365 |
325 |
335 |
295 |
275 |
330 |
315 |
340 |
345 |
215 |
295 |
375 |
225 |
255 |
370 |
385 |
355 |
360 |
285 |
345 |
305 |
310 |
235 |
265 |
390 |
395 |
360 |
370 |
340 |
340 |
320 |
315 |
255 |
275 |
395 |
390 |
370 |
380 |
325 |
330 |
340 |
335 |
345 |
325 |
325 |
325 |
Информация о работе Первичная обработка результатов наблюдения методом математической статистики