Обработка данных натурных наблюдений методами математической статистики

Автор работы: Пользователь скрыл имя, 06 Ноября 2014 в 19:20, практическая работа

Краткое описание

Цель работы: выработка навыков по обработке экспериментальных данных методами математической статистики, оценке полученных результатов, использование их при принятии управленческих решений в области природоохраны и природопользования. На основе теории вероятности и математической статистики необходимо получить основные характеристики расчётных параметров, отработать методику расчёта и найти пути практического применения получаемых результатов.

Содержание

ВВЕДЕНИЕ…...…………………………………………………………………………
2
РАСЧЕТНО–ГРАФИЧЕСКАЯ ЧАСТЬ...……………………………………………..
4
1. ПОСТРОЕНИЕ ВАРИАЦИОННОГО РЯДА (Xmax-Xmin)………………………….
5
2. ГРУППИРОВКА ВАРИАЦИОННОГО РЯДА– ДЕЛЕНИЕ ВАРИАЦИОННОГО РЯДА НА ЧАСТИ…………………………………………………………………..

6
2.1 Определение количества классов(интервалов)………………………………..
6
2.2 Определение длины каждого класса…………………………………………...
6
2.3 Определение границ каждого интервала………………………………………
6
2.4 Определение эмпирической частоты…………………………………………..
7
3. ОПРЕДЕЛЕНИЕ РАСЧЁТНЫХ СТАТИЧЕСКИХ ХАРАКТЕРИСТИК (МЕР ПОЛОЖЕНИЯ, РАССЕИВАНИЯ И ХАРАКТЕРИСТИКИ ФОРМЫ КРИВОЙ РАСПРЕДЕЛЕНИЯ)……………………………………………………………………


8
Определение мер положения…………………………………………………….
8
3.2 Меры рассеивания……………………………………………………………….
9
3.3 Характеристики формы кривой распределения………………………………..
9
3.4 Изучение формы распределения………………………………………………..
10
4. ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ ВАРИАЦИОННЫХ РЯДОВ.....……………..
11
5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ…………………………………….
14
5.1 Критерий однородности…………………………………………………………
14
5.2 Критерий согласия………………………………………………………………
16
6. ОПРЕДЕЛЕНИЕ ОБЪЁМА ВЫБОРКИ…………...………………………………..
19
ЗАКЛЮЧЕНИЕ……...…………………………

Вложенные файлы: 1 файл

ekologia_dianov.doc

— 439.50 Кб (Скачать файл)

 

 

 3. ОПРЕДЕЛЕНИЕ РАСЧЁТНЫХ СТАТИЧЕСКИХ ХАРАКТЕРИСТИК

     3.1 Определение мер положения

 

Целью исследования является определение центра распределения:

Среднее арифметическое значение (основной показатель, входящий в характеристику большинства законов распределения) является первым начальным моментом и вычисляется по следующей формуле:

                                                                       (4)

где Xср – среднее арифметическое значение выборки (мг/л);

      Xi – элементы выборки (мг/л),

Если учитывать, что ряд натурных наблюдений вариационный и сгруппированный, то среднее арифметическое значение можно рассчитать по следующей зависимости:

(мг/л),                                                           (5)

                                                                

где Xi*- среднее арифметическое значение каждого интервала (мг/л),

                  ni – частота каждого интервала.

(мг/л)

 

 

Мода-значение, имеющее максимальную частоту, т.е. наиболее часто встречаемое значение случайной величины в выборке. Оно определяется по формуле:

(мг/л),                                          (6) 

где X0 – начало модального интервала (мг/л),

      ni – начало модального интервала,

      ni-1 и ni+1 – частоты предыдущего и последующего за модальным интервалом.

Модальным называется интервал с наибольшей частотой.

мг/л),       

 

(мг/л)       

                            

Медиана (определение серединного элемента выборки):

(мг/л),                                                         (7)

 

где X0 – начало медианного интервала,

      Ti-1 – сумма частот, предшествовавших медианному интервалу,

      ni – частота медианного интервала.

 

Медианный интервал определяется по серединному элементу вариационного ряда. Если в вариационном ряду чётное количество значений ,то нет серединного элемента. Необходимо определить два центральных элемента, найти среднее арифметическое, как полу сумма их. Полученное значение подставляется в границы интервалов.

 

(мг/л),                                                        

 

3.2 Меры рассеивания

Характеристикой рассеивания или отклонения случайной величины от центра распределения выступает дисперсия – второй центральный момент.

Согласно методу моментов дисперсия определяется по формуле:

(мг/л)2                                                     (8)

 

Для определения стандартного отклонения из дисперсии извлекается квадратный корень, полученная величина называется средним квадратичным отклонением и называется δ(мг/л). δ=

Нормированное отклонение определяется коэффициентом вариации

                                                                        (9)

 

3.3 Характеристики формы кривой распределения

Характеристиками формы кривых распределения выступают третий и четвёртый центральные моменты.

Третий центральный момент характеризует асимметричность ряда, т.е. неравномерность распределения случайной величины относительно центра и определяется по формуле:

(мг/л)3                                                          (10)

 

Безразмерный коэффициент асимметрии (СS) определяется отношением третьего центрального момента к кубу среднего квадратичного отклонения.

Четвёртый центральный момент характеризует форму симметричной кривой распределения:

(мг/л)4                                                        (11)                    

Показателем остро- или плосковершинности выступает коэффициент эксцесса (Сe), который определяется отношением четвёртого центрального момента к среднему квадратичному отклонению в четвёртой степени, за вычетом коэффициента три.

Общая формула для расчёта центральных моментов

,                                                        (12)

                                                     ,

                                                       L=2,3,4.

Таблицы 2

 

Определение центральных выборочных моментов

 

К

 ni

Zi4

  

  

  

1

2

-4,085

16,687

-68,167

278,463

33,374

-136,335

556,927

2

13

 -1,895

3,591

-6,805

12,895

46,683

-88,465

167,641

2

7

  0,295

0,087

0,026

0,008

0,609

0,180

0,053

2

4

   2,485

6,175

15,345

38,133

24,701

61,382

152,534

2

3

   4,675

21,856

102,175

477,668

65,567

306,525

1433,005

6

1

   6,87

47,197

324,243

2227,547

47,197

324,243

2227,547

30

218,108

467,5272

4537,5395


 

1) Zi1 = 18,405 – 22,49= -4,085                                                                                   

2) Zi2 = 20,595 – 22,49= -1,895                                                                                               3) Zi3 = 22,785 – 22,49= 0,295                                                                                                              4) Zi4 = 24,975 – 22,49= 2,485                                                                                                       5) Zi5 = 27,165 – 22,49= 4,675

6) Zi6 = 29,36 – 22,49= 6,87

 

(мг/л)2 ,        δ= (мг/л),    

 

(мг/л)3 ,      

 

(мг/л)4 ,   

3.4 Изучение формы распределения

˂33% - ряд однородный

            ;  ;     21,01<21,69<22,49

 

4. ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ ВАРИАЦИОННЫХ РЯДОВ

 

Для графического изображения рядов распределения применяют гистограмму (кривая распределения плотности вероятностей, дифференциальная кривая распределения).

С помощью гистограммы (кривая распределения плотности вероятностей, дифференциальная кривая распределения) эмпирического распределения можно предугадать вид генеральной совокупности (случайной величины, подчиняющейся определённой функциональной зависимости).

 

Таблица 3

Определение ординат эмпирических кривых распределения

 

 

Границы

интервалов, мг/л

Частота,

ni

Относительная

частота, nотн

Приведённая

 частота, nпр

1

2

3

4

5

1.

[17,31 ; 19,5]

2

0,06

0,027

2.

[19,5 ; 21,69]

13

0,43

0,196

3.

[21,69 ; 23,88]

7

0,23

0,105

4.

[23,88 ; 26,07]

4

0,13

0,059

5.

[26,07 ; 28,26]

3

0,1

0,045

6.

[28,26 ; 30,46]

1

0,03

0,014


 

,

 

1) nотн1 = 2/ 30 = 0,06                                        nпр1 = 0,06/ 2,19 = 0,027                                                                                           2)nотн2 = 13/ 30 = 0,43                                    nпр2 = 0,43/ 2,19 = 0,196                                                                                               3) nотн3 = 7 / 30 = 0,23                                      nпр3 = 0,23/ 2,19 = 0,105                                                                                             4) nотн4 = 4 / 30 = 0,13                                     nпр4 = 0,13/ 2,19 = 0,059                                                                                5) nотн5 =  3 / 30 = 0,1                                     nпр5 = 0,1 / 2,19 = 0,045                                                                                                      6) nотн6  = 1 / 30 = 0,03                                    nпр6 = 0,03 / 2,19 = 0,014

 

nотн – относительная частота определяется отношением эмпирической частоты к объёму выборки и характеризует вероятность появления случайной величины в каждом интервале.

nпр – приведённая частота или плотность распределения случайной величины в заданном интервале.

 

 

 

 

 

 

Гистограмма 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Определение существенности асимметрии:  
 
   

                                                                  
=0.41   
 
=
=1.92    1.92<3

 
Вывод: асимметрия несущественна для выборки, при подборе генеральной совокупности можно воспользоваться симметричными кривыми

 

 

 

 

 

 

 

 

 

 

 

 

 

 5. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ    

 5.1 Критерий однородности

Вопросы удлинения данных натурных рядов преследует цель корректировки статистических параметров. Для проверки выборок в сходстве формирования случайных величин используют статистические критерии однородности. Результатом статистического анализа на однородность является объединение двух в одну или отрицание однородности между сравниваемыми совокупностями. Для расчётов используют критерии однородности параметрический – критерий Фишера; непараметрический – критерий Вилкоксона.

Критерий Фишера основан на равенстве дисперсий выборок, распределённых приближённо нормально. Расчётное значение критерия Фишера определяется по следующей формуле:

                                                                              (13)

причём необходимо выполнение условия Dx ˃Dy ,где

Dx – дисперсия выборки X,

Dy – дисперсия выборки Y.

Для определения области допустимых значений необходимо задаться уровнем значимости и числом степеней свободы (для практических расчётов уровень значимости принимаем равным 0,05, число степеней свободы рассчитываем по следующей зависимости: mx=Nx-1,my=Ny-1).

Используя таблицы F-распределения (Приложение 2),определяется критическое значение критерия в зависимости от выбранного уровня значимости и числа степеней свободы. Если выполняется условие, при котором расчётное значение не превосходит критическое, то можно предположить, что ряды однородны и сравниваемые выборки можно объединить в один ряд.

Из непараметрических критериев однородности можно выделить статистический критерий однородности Вилкоксона. Расчёты проводим в следующем виде и последовательности: значения обеих выборок (X и Y) упорядочиваются вместе по величине, с учётом выборки из которого взято значение. Сумма инверсий определяется следующим образом: по построенному вариационному ряду из двух сравниваемых выборок проводят подсчёт инверсий (инверсией считается величина, характеризующаяся следующим неравенством xi˃ yi ) т.е. определяют, сколько значений Y - выборки находится перед каждым значением X – выборки. Расчётное значение критерия Вилкоксона определяется по формуле:

                                                                     (14)

 

Критическое значение статистического критерия Вилкоксона определяется по таблицам или с помощью формулы:

,                                                         (15)

где коэффициент Za определяется по формуле:

                                                                        (16)

где Ф0 – функция нормированного и центрированного закона нормального распределения (Приложение 1).

Допустим, необходимо сравнить две выборки на принадлежность их генеральной совокупности.

 

    №

1

2

3

4

5

6

7

8

9

    10

 

17,31

19,18

19,68

19,76

19,95

20,63

20,71

20,78

20,79

21,01

    №

    11

    12

    13

    14

    15

    16

    17

    18

    19

   20

 

21,15

21,15

21,18

21,21

21,31

21,81

22,05

22,73

22,83

23,33

    №

    21

    22

    23

    24

    25

    26

    27

    28

    29

    30

 

23,65

23,69

24,09

24,66

25,53

25,79

26,36

26,82

27,05

30,46

Информация о работе Обработка данных натурных наблюдений методами математической статистики