Задача по "Математической статистике"
Автор работы: Пользователь скрыл имя, 14 Сентября 2013 в 20:54, лабораторная работа
Краткое описание
Пусть дана последовательность значений случайной величины Х, полученных в результате проведения в одних и тех же условиях п взаимно независимых опытов.
Значения случайной величины Х называются выборкой объема п из генеральной совокупности объема N.
Содержание
1. Постановка задачи 3
2. Данные наблюдений и их наглядное представление. 3
3. Используемые формулы. 4
4. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.). 5
5. Выводы. 9
Вложенные файлы: 1 файл
лабораторная.docx
— 54.10 Кб (Скачать файл)Оглавление
1. Постановка задачи 3
2. Данные наблюдений и их наглядное представление. 3
3. Используемые формулы. 4
4. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.). 5
5. Выводы. 9
Постановка задачи
Пусть дана последовательность значений случайной величины Х, полученных в результате проведения в одних и тех же условиях п взаимно независимых опытов.
Значения случайной величины Х называются выборкой объема п из генеральной совокупности объема N.
Задача обработки результатов наблюдений случайной величины состоит в следующем:
- Построение вариационного ряда или ряда распределения и гистограммы для него.
- Определение выборочных оценок числовых характеристик случайной величины.
- Определение точности выборки.
- Определение теоретической функции распределения. Выравнивание статистического ряда.
- Проверка согласованности теоретического и статистического распределений, используя критерий .
Данные наблюдений и их наглядное представление.
В данной лабораторной работе необходимо обработать результаты наблюдений за численностью специалистов с высшим и средним образованием по ста совхозам одной из республик. Х - человек, ∆X= 20 чел., k = 7, Р0 = 0,9960.
20 |
55 |
88 |
72 |
65 |
85 |
74 |
88 |
69 |
72 |
125 |
99 |
92 |
85 |
97 |
91 |
98 |
100 |
120 |
119 |
50 |
47 |
45 |
88 |
29 |
95 |
30 |
145 |
25 |
40 |
118 |
76 |
105 |
62 |
99 |
75 |
99 |
68 |
79 |
78 |
120 |
116 |
109 |
125 |
131 |
120 |
122 |
120 |
117 |
125 |
69 |
110 |
98 |
99 |
98 |
138 |
125 |
135 |
98 |
60 |
75 |
62 |
108 |
58 |
105 |
99 |
81 |
70 |
80 |
155 |
77 |
80 |
115 |
85 |
89 |
160 |
115 |
97 |
95 |
90 |
120 |
121 |
128 |
77 |
138 |
155 |
139 |
47 |
147 |
52 |
100 |
37 |
131 |
60 |
160 |
38 |
155 |
98 |
96 |
124 |
Используемые формулы.
- Чтобы рассчитать размах вариации, используем формулу
- Величина интервала находится по формуле
- Выборочная средняя рассчитывается как
- Выборочная дисперсия определяется по формуле
- Среднее квадратическое отклонение находим по формуле
- Для нахождения моды используем формулу
- Для нахождения медианы:
- Случайный момент порядка k:
- Параметр q:
- Коэффициент асимметрии:
- Коэффициент эксцесса:
- Для нахождения параметра t используем формулу:
- Точность выборки:
- Определяем теоретическую частоту по формуле:
- Хи-квадрат:
- Хи-квадрат критическое определяем на основании данных таблицы. При этом число "степеней свободы" распределения находим по формуле , где k - число интервалов, а S - число связей, накладываемых на частоты . При гипотезе о нормальном распределении число связей равно 3.
Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.).
Изначально с помощью функций (МИН) и (МАКС) определили минимальное и максимальное значения величины: xmin = 20, xmax = 160. Размах выборки : 160 – 20 = 140. По формуле находим d:
d=140/7=20.
Следующие значения рассчитываем с помощью соответствующих статистических функций в MS Excel.
Таблица 1 Вычисление выборочных оценок числовых характеристик случайной величины
x min = |
20 |
x max= |
160 |
R = |
140 |
d = |
20 |
x̅ = |
94,21 |
D = |
1050,94 |
σ = |
32,4181 |
Mo = |
99 |
Me = |
97 |
As = |
-0,1161 |
Ex = |
-0,4238 |
Чтобы рассчитать точность выборки ε, нужно сначала определить параметр t. С помощью функции (НОРМСТОБР) с учетом P0=0,996 получили значение t = 2,65207.
.
Таблица 2 Параметры t
t = |
|
Ф-1= |
2,65207 |
Po = |
0,996 |
ε = |
8,59751 |
Теперь можно рассчитать интервальную оценку:
x̅ - ε ≤ E(x) ≤ x̅ + ε
85,6125 ≤ E(x) ≤ 102,8100
Таблица 3 Вариационный ряд распределения
Вариационный ряд распределения |
Итого | |||||||
Интервалы |
20-40 |
40-60 |
60-80 |
80-100 |
100-120 |
120-140 |
140-160 |
|
Левая граница |
20 |
40 |
60 |
80 |
100 |
120 |
140 |
|
Число наблюдений в интервале mi |
7 |
9 |
19 |
28 |
16 |
14 |
7 |
100 |
qi |
-2,289 |
-1,672 |
-1,055 |
-0,438 |
0,179 |
0,796 |
1,412 |
|
Частота интервала |
0,07 |
0,09 |
0,19 |
0,28 |
0,16 |
0,14 |
0,07 |
|
Значение Ф |
0,011 |
0,047 |
0,146 |
0,331 |
0,571 |
0,787 |
0,921 |
|
pi |
0,036 |
0,098 |
0,185 |
0,240 |
0,216 |
0,134 |
0,079 |
|
npi |
3,621 |
9,841 |
18,492 |
24,030 |
21,598 |
13,424 |
7,890 |
|
Вариационный ряд распределения содержит 7 интервалов (по условию k = 7) с величиной интервала d = 20. С помощью функции «Условное форматирование» определили число наблюдений в каждом из интервалов.
Параметр qi находим по формуле .
Поскольку n = 100, частота интервала определяется следующим образом: .
С помощью функции (НОРМСТРАСП) нашли значения функции Лапласа (Ф) для параметра qi.
Параметр pi рассчитывается по формуле . Значение p7 = 1 – 0,921 = 0,079
И, наконец, значение npi определяется как произведение соответствующих значений pi на 100 (т.к. n=100).
Таблица 4
Хи-квадрат |
0,4849 |
Хи-квадрат критическое (вероятность 0,05; степень свободы 7 – 3 = 4) |
9,4877 |
Чтобы рассчитать значение Хи-квадрат используем функцию (ХИ2ТЕСТ), а значение Хи-квадрат критическое – функцию (ХИ2ОБР) с уровнем значимости 0,05 и степенью свободы 4.
Чтобы наглядно представить информацию о числе наблюдений, мною была построена гистограмма. Например, наименьшее число наблюдений – 7 – было осуществлено в интервалах: №1 «20-40» и №7 «140-160»; а наибольшее число наблюдений - 28 - в интервале №4 «80-100».
Рисунок 1 Число наблюдений в каждом интервале
Таблица 5
Нормальное распределение по Гауссу | ||||||
0,000896 |
0,00304 |
0,0071 |
0,0112 |
0,0121 |
0,009 |
0,0045 |
Данные значения были рассчитаны с помощью функции (НОРМРАСП). На основе этих данных я построила график «Нормальное распределение случайной величины по Гауссу».
Рисунок 2 Нормальное распределение случайной величины
Выводы.
Данная лабораторная работа была направлена на обработку результатов наблюдений за численностью специалистов с высшим и средним образованием по ста совхозам одной из республик. С помощью программы MS Excel были рассчитаны все необходимые числовые характеристики выборки:
- размах выборки
- мода
- медиана
- среднее значение выборки
- выборочная дисперсия
- среднее квадратическое отклонение
- асимметрия
- эксцесс
- точность выборки
- интервальная оценка.
Что касается распределения случайной величины, то вывод такой. При достаточно большом числе испытаний п можно считать закон распределения нормальным. Для нормального распределения Mo (X) = Мe (X) = Е (Х). Мною были получены данные Mo = 99; Mе = 97; 85,6125 ≤ E(x) ≤ 102,8100, которые практически совпадают. Поэтому можно сказать, что распределение нормальное.
Коэффициент асимметрии As = - 0,1161. Он отрицателен, значит, либо большая часть значений случайной величины, либо мода находятся левее математического ожидания. Можно неформально заметить, если коэффициент асимметрии отрицателен, то «левый хвост» распределения длиннее правого.
Также было определено значение критерия хи-квадрат (Критерий согласия Пирсона) χ2 =0,4849. Хи-квадрат критическое χ2крит. (0,05; 4) оказалось равно 9,4877.
Критерий согласия Пирсона (χ2) применяют для проверки гипотезы H0 о соответствии эмпирического распределения наблюдаемой величины предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). В нашем случае как раз n = 100. Если χ2 ≤ χ2крит., то гипотеза принимается.
0,4849 9,4877, таким образом, делаем вывод, что генеральная совокупность распределена по нормальному закону.