Задача по "Математической статистике"

Автор работы: Пользователь скрыл имя, 14 Сентября 2013 в 20:54, лабораторная работа

Краткое описание

Пусть дана последовательность значений случайной величины Х, полученных в результате проведения в одних и тех же условиях п взаимно независимых опытов.
Значения случайной величины Х называются выборкой объема п из генеральной совокупности объема N.

Содержание

1. Постановка задачи 3
2. Данные наблюдений и их наглядное представление. 3
3. Используемые формулы. 4
4. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.). 5
5. Выводы. 9

Вложенные файлы: 1 файл

лабораторная.docx

— 54.10 Кб (Скачать файл)

Оглавление

 

1. Постановка задачи 3

2. Данные наблюдений и их наглядное представление. 3

3. Используемые формулы. 4

4. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.). 5

5. Выводы. 9

 

 

 

  1. Постановка  задачи

Пусть дана последовательность значений случайной величины Х, полученных в результате проведения в одних и тех же условиях п взаимно независимых опытов.

Значения  случайной величины Х называются выборкой объема п из генеральной совокупности объема N.

Задача обработки результатов  наблюдений случайной величины состоит  в следующем:

  • Построение вариационного ряда или ряда распределения и гистограммы для него.
  • Определение выборочных оценок числовых характеристик случайной величины.
  • Определение точности выборки.
  • Определение теоретической функции распределения.  Выравнивание статистического ряда.
  • Проверка согласованности теоретического и статистического распределений, используя критерий .
  1. Данные  наблюдений и их наглядное представление.

В данной лабораторной работе необходимо обработать результаты наблюдений за численностью специалистов с высшим и средним образованием по ста совхозам одной из республик. Х - человек,  ∆X= 20 чел., k = 7, Р0 = 0,9960.

20

55

88

72

65

85

74

88

69

72

125

99

92

85

97

91

98

100

120

119

50

47

45

88

29

95

30

145

25

40

118

76

105

62

99

75

99

68

79

78

120

116

109

125

131

120

122

120

117

125

69

110

98

99

98

138

125

135

98

60

75

62

108

58

105

99

81

70

80

155

77

80

115

85

89

160

115

97

95

90

120

121

128

77

138

155

139

47

147

52

100

37

131

60

160

38

155

98

96

124


  1. Используемые  формулы.

 

  1. Чтобы рассчитать размах вариации, используем формулу  
  2. Величина интервала находится по формуле
  3. Выборочная средняя рассчитывается как
  4. Выборочная дисперсия определяется по формуле
  5. Среднее квадратическое отклонение находим по формуле
  6. Для нахождения моды используем формулу
  7. Для нахождения медианы:
  8. Случайный момент порядка k:
  9. Параметр q:
  10. Коэффициент асимметрии:
  11. Коэффициент эксцесса:
  12. Для нахождения параметра t используем формулу:
  13. Точность выборки:
  14. Определяем теоретическую частоту по формуле:

 

  1. Хи-квадрат:
  2. Хи-квадрат критическое определяем на основании данных таблицы. При этом число "степеней свободы" распределения находим по формуле , где k - число интервалов, а S - число связей, накладываемых на частоты . При гипотезе о нормальном распределении число связей равно 3.
  1. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.).

 

Изначально  с помощью функций (МИН) и (МАКС) определили минимальное и максимальное значения величины: xmin = 20, xmax = 160. Размах выборки : 160 – 20 = 140. По формуле находим d:

d=140/7=20.

Следующие значения рассчитываем с помощью соответствующих  статистических функций в MS Excel.

 

Таблица 1 Вычисление выборочных оценок числовых характеристик случайной величины

x min =

20

x max=

160

R =

140

d =

20

x̅ =

94,21

D =

1050,94

σ =

32,4181

Mo =

99

Me =

97

As =

-0,1161

Ex =

-0,4238


 

Чтобы рассчитать точность выборки ε, нужно сначала определить параметр t. С помощью функции (НОРМСТОБР) с учетом P0=0,996 получили значение t = 2,65207.

.

Таблица 2 Параметры t

t =

 

Ф-1=

2,65207

Po =

0,996

ε =

8,59751


 

 

Теперь можно  рассчитать интервальную оценку:

x̅ - ε ≤  E(x) ≤ x̅ + ε

85,6125 ≤   E(x) ≤ 102,8100

 

Таблица 3  Вариационный ряд распределения

Вариационный ряд распределения

Итого

Интервалы

20-40

40-60

60-80

80-100

100-120

120-140

140-160

 

Левая граница

20

40

60

80

100

120

140

 

Число наблюдений в интервале mi

7

9

19

28

16

14

7

100

qi

-2,289

-1,672

-1,055

-0,438

0,179

0,796

1,412

 

Частота интервала

0,07

0,09

0,19

0,28

0,16

0,14

0,07

 

Значение Ф

0,011

0,047

0,146

0,331

0,571

0,787

0,921

 

pi

0,036

0,098

0,185

0,240

0,216

0,134

0,079

 

npi

3,621

9,841

18,492

24,030

21,598

13,424

7,890

 

 

Вариационный ряд распределения содержит 7 интервалов (по условию k = 7) с величиной интервала d = 20. С помощью функции «Условное форматирование» определили число наблюдений в каждом из интервалов.

Параметр qi находим по формуле .

Поскольку n = 100, частота интервала определяется следующим образом: .

С помощью  функции (НОРМСТРАСП) нашли значения функции Лапласа (Ф) для параметра qi.

Параметр pi рассчитывается по формуле . Значение p7 = 1 – 0,921 = 0,079

И, наконец, значение npi определяется как произведение соответствующих значений pi на 100 (т.к. n=100).

 

 

Таблица 4

Хи-квадрат

0,4849

Хи-квадрат критическое 

(вероятность 0,05;

степень свободы 7 – 3 = 4)

9,4877


 

Чтобы рассчитать значение Хи-квадрат используем функцию  (ХИ2ТЕСТ), а значение Хи-квадрат критическое – функцию (ХИ2ОБР) с уровнем значимости 0,05 и степенью свободы 4.

 

Чтобы наглядно представить информацию о числе  наблюдений, мною была построена гистограмма. Например, наименьшее число наблюдений – 7 – было осуществлено в интервалах: №1 «20-40» и №7 «140-160»; а наибольшее число наблюдений - 28 - в интервале №4 «80-100».

 

Рисунок 1 Число наблюдений в каждом интервале

 

 

 

 

 

 

Таблица 5

Нормальное распределение по Гауссу

0,000896

0,00304

0,0071

0,0112

0,0121

0,009

0,0045


 

Данные значения были рассчитаны с помощью функции (НОРМРАСП). На основе этих данных я построила график «Нормальное распределение случайной величины по Гауссу».

 

Рисунок 2 Нормальное распределение случайной величины

 

 

  1. Выводы.

     Данная лабораторная работа была направлена на обработку результатов наблюдений за численностью специалистов с высшим и средним образованием по ста совхозам одной из республик. С помощью программы MS Excel были рассчитаны все необходимые числовые характеристики выборки:

  • размах выборки
  • мода
  • медиана
  • среднее значение выборки
  • выборочная дисперсия
  • среднее квадратическое отклонение
  • асимметрия
  • эксцесс
  • точность выборки
  • интервальная оценка.

     Что касается распределения случайной величины, то вывод такой. При достаточно большом числе испытаний п можно считать закон распределения нормальным. Для нормального распределения Mo (X) = Мe (X) = Е (Х). Мною были получены данные Mo = 99; Mе = 97; 85,6125 ≤ E(x) ≤ 102,8100, которые практически совпадают. Поэтому можно сказать, что распределение нормальное.

     Коэффициент асимметрии As =  - 0,1161. Он отрицателен, значит, либо большая часть значений случайной величины, либо мода находятся левее математического ожидания. Можно неформально заметить, если коэффициент асимметрии отрицателен, то «левый хвост» распределения длиннее правого.

     Также было определено значение критерия хи-квадрат (Критерий согласия Пирсона) χ2 =0,4849. Хи-квадрат критическое χ2крит. (0,05; 4) оказалось равно 9,4877.

     Критерий согласия Пирсона (χ2) применяют для проверки гипотезы H0 о соответствии эмпирического распределения наблюдаемой величины предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). В нашем случае как раз n = 100. Если χ≤ χ2крит., то гипотеза принимается.

0,4849 9,4877, таким образом, делаем вывод, что генеральная совокупность распределена по нормальному закону.

 

 

 


Информация о работе Задача по "Математической статистике"