Первичная обработка результатов наблюдения методом математической статистики

Автор работы: Пользователь скрыл имя, 18 Февраля 2013 в 15:31, лабораторная работа

Краткое описание

Цель работы: Привить навыки первичной обработки эмпирических данных с помощью методов математической статистики.

Вложенные файлы: 1 файл

labor1_new.doc

— 4.93 Мб (Скачать файл)

                  

                    ( ,        )

Замечание 1: Так как все числовые характеристики выражаются через , то удобнее вначале вычислить числовые значения  , а затем значения числовых характеристик.

Замечание 2: Для упрощения расчетов, если они выполняются “вручную” удобнее перейти от данных значений вариант к условиям  по формуле

,

   где   h – длина интервала группировки,

           С – ложный нуль.

Чаще всего в качестве ложного  нуля принимается либо варианта, находящаяся в середине вариационного ряда, либо мода (варианта , имеющая наибольшую частоту), либо любое другое число, упрощающее расчеты.

Если за принять какое - либо значение , то соответствующая ему условная варианта будет равна нулю, а слева и справа от нуля будут располагаться соответственно значения 1, 2, 3, 4 и т.д.

Если, например, , то вариационный ряд в условных вариантах примет вид

 

   

   …

     -2

     -1

     0

     1

     2

   …

    

   …

  

  

 

   

   …


 

Числовые характеристики в условных вариантах  , , , вычисляют с той лишь разницей, что вместо используется .

Однако после вычисления числовых характеристик в условных вариантах необходимо перейти к  первоначальным значениям вариант.  Это осуществляется по формулам:

   

Промежуточные расчеты  при вычислении числовых характеристик удобнее оформлять в виде таблицы.

Этап IV.      Определение границ истинных значений числовых характеристик изучаемой величины с заданной  надежностью.

 

Числовые характеристики, вычисленные по случайной выборке из генеральной совокупности, лишь приближенно характеризуют истинные значения аналогичных характеристик изучаемой генеральной совокупности. Поэтому возникает вопрос о надежности, с которой можно принять вычисленные значения и о границах допустимых значений. Частично эти вопросы решаются путем нахождения доверительных (надежностных) интервалов для основных числовых характеристик.

 

 Надежностный интервал  для генеральной средней имеет  вид:

 

              или   ,

где

 

- среднее выборочное

n – объем выборки

, если большая выборка ( ),

t – значение аргумента функции Лапласа, при котором она равна ,

t – находится по таблицам значений функции Лапласа из условия

                                            

- вероятность суждений, называемая  надежностью. Она выбирается самим  исследователем. Значения =0.95, как правило, считается достаточным для большинства исследований. Надежностный интервал с вероятностью содержит в себе генеральную среднюю.

Замечание.  Если выборка мала (n<30), то надежностный интервал для генеральной средней имеет вид:

 

где S – исправленное выборочное среднеквадратическое отклонение,

- число, взятое из таблицы  значений  по объему выборки n и надежности .

При больших  n результаты нахождения надежноcтного интервала двумя указанными способами практически неразличимы.

Надежностный интервал для среднеквадратического  отклонения имеет вид

,

т.е. определяется выражением  ∙q или, если левая часть отрицательна, то ее отбрасывают и интервал примет вид

,

 где S - исправленное выборочное среднее квадратическое отклонение,

      q – табличное значение критических точек , оно зависит от объема выборки n и заданной надежности .

 

Этап V.   Содержательная интерпретация результатов первичной обработки                                                                                                                                                                                                                     данных по условию задачи.

 

Итогом первичной обработки  данных служит содержательная интерпретация результатов произведенных вычислений.

Арифметическое среднее, вычисленное по выборочным данным, представляет собой обобщенную характеристику всей совокупности значений в целом. Значение - являясь как бы точкой сгущения значений, характеризует центральное положение возможных значений случайной величины.

Доверительный интервал   указывает на то, что с вероятностью , генеральная средняя изучаемой случайной величины заключена в найденном интервале, или, что данный интервал с надежностью содержит в себе истинное среднее значение генеральной совокупности .

Среднее квадратическое отклонение служит показателем, который дает представление о наиболее  вероятной средней ошибке отдельного, единичного наблюдения, взятого из данной совокупности.

Основные значения, ядро вариационного ряда содержится в  интервале

,     или  
.

Отклонение от , превосходящее по модулю возможны, но вероятность их уменьшается по мере удаления от   , .

Надежностный интервал с вероятностью содержит в себе значение генерального среднего квадратического отклонения.

Коэффициент асимметрии - указывает на нарушение симметрии, наличие скоса.

Если  , то скос наблюдается справа, если , то слева, если , то распределение симметричное.

Коэффициент эксцесса - указывает на характер вершины распределения.

Если  , то распределение островершинное, это говорит о том, что значения признака не значительно разбросаны вокруг среднего значения. Если  , то распределение пологое, это говорит о том, что значения признака значительно разбросаны вокруг среднего значения. Если , то распределение совпадает со стандартным нормальным.

Коэффициент вариации V – стандартное отклонение, выраженное в процентах к средней арифметической данной совокупности. Он является относительным показателем изменчивости. Если V<10%, то изменчивость считают незначительной, если 10%< V <20% то изменчивость считают средней, если V>20%, то изменчивость значительная.

Использование коэффициента вариации V как показателя колеблемости (вариации) имеет смысл только при положительных значениях вариант и совершенно не применимо, если варианты принимают как положительные так и отрицательные значения.

Рассмотренные числовые характеристики необходимо сопоставлять с вариационным рядом, его графическим изображением и интерпретировать с учетом единиц измерения  и содержания, указанных  в условиях задачи.

 

 

 

 

 

§ 1.2. Алгоритм выполнения работы.

 

1 Этап.  Группировка данных в вариационный ряд и представление его в виде эмпирической функции распределения.

 

1.

2.

3. s- число групп.

4. - шаг, или разность между двумя соседними вариантами.

5. ,   .

6. Сгруппируем данные в виде интервального вариационного рядя

 


 

7. Перейдем от интервального вариационного ряда к дискретному и найдем относительные частоты .

            


 

8. Найдем эмпирическую функцию распределения

           


                         

 

                          

 

 F*(x) =

                          

                           ………………………

                          

 

II Этап. Графическое изображение ряда и эмпирической функции                      распределения.

 

Ввиду большой наглядности  описание в общем виде опускается (пункты 9,10,11).

 

III Этап.   Вычисление числовых характеристик.

 

 

12.

 

 

13.

 

14.

 

15.

 

16. .

 

17.                       или           

18

 

19.                            или           

 

20.

 

21.     или           

 

22.

 

23. или 

 

 

24.

 

 

25.   или   

 

 

IV Этап.  Определение границ истинных значений числовых

характеристик.

 

    1. t по таблице Ф(t)=

 

27.

 

28.

29. q по таблице q = q(n, )

30.

 

 

V Этап. Содержательная интерпретация.

 

    1. Интерпретация .

Значения случайной величины изменяются в пределах от до . Значение является обобщённой характеристикой, средним значением, около которого группируется все другие возможные значения изучаемой случайной величины.

 

  1. Интерпретация  .

 Надежностный интервал с  вероятностью  утверждает, что значения средней (заработной платы) для выборки данного объема  n  колеблется        в пределах от      до   .

 

3.  Интерпретация   .

Отклонение средней величины   от отдельно взятого значения cоставляет в среднем     .

  4.   Интерпретация   .

 Надежностный интервал для указывает с вероятностью на то, что эти отклонения могут принимать значения находящиеся в пределах от   до .

5. Интерпретация .

   Если  0, то значения случайной величины по отношению к распределяются несимметрично, если   =0, то симметрично.

   Если >0, то имеет место левосторонний скос, то есть более вероятными будут те значения признака, которые расположены правее среднего. Если <0, то наоборот, наблюдается правосторонний скос и более вероятными будут те значения признака, которые расположены левее среднего.

6.    Интерпретация .

Если ≠0, то отклонение от среднего значения происходит не плавно, наблюдается отклонение от нормы.

Если  >0, то отклонения небольшие, меньше нормы, среднее значение не резко отличается от других значений.

Если  <0, то отклонения большие, больше нормы, среднее значение резко отличается от других возможных значений случайной величины.

Если =0, то отклонения совпадают с нормой.

7.     Интерпретация   V.

       Чем больше значение коэффициента вариации    V,   тем больше изменчивость случайной величины.

Если      V 10%,   то изменчивость незначительна;

Если     10<V 20%,  то изменчивость средняя;

Если     V>20%, то изменчивость значительная.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

§ 1.3   Образец выполнения задания

 

Вариант №0

 

Дана средняя заработная плата  в рублях

 

120

480

175

490

410

425

430

385

335

315

545

475

480

225

445

255

425

375

325

320

160

245

255

265

445

425

265

410

305

330

335

455

220

265

275

435

275

415

310

340

245

215

215

275

355

415

285

265

315

345

345

230

225

285

365

325

335

295

275

330

315

340

345

215

295

375

225

255

370

385

355

360

285

345

305

310

235

265

390

395

360

370

340

340

320

315

255

275

395

390

370

380

325

330

340

335

345

325

325

325

                   

Информация о работе Первичная обработка результатов наблюдения методом математической статистики