Задача по "Математической статистике"

Автор работы: Пользователь скрыл имя, 14 Сентября 2013 в 20:54, лабораторная работа

Краткое описание

Пусть дана последовательность значений случайной величины Х, полученных в результате проведения в одних и тех же условиях п взаимно независимых опытов.
Значения случайной величины Х называются выборкой объема п из генеральной совокупности объема N.

Содержание

1. Постановка задачи 3
2. Данные наблюдений и их наглядное представление. 3
3. Используемые формулы. 4
4. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.). 5
5. Выводы. 9

Скачать в ZIP архиве (49.29 Кб) Сколько стоит заказать работу?

Вложенные файлы: 1 файл

лабораторная.docx

— 54.10 Кб (Скачать файл)

Оглавление

1. Постановка задачи 3

2. Данные наблюдений и их наглядное представление. 3

3. Используемые формулы. 4

4. Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.). 5

5. Выводы. 9

Постановка задачи

Пусть дана последовательность значений случайной величины Х, полученных в результате проведения в одних и тех же условиях п взаимно независимых опытов.

Значения случайной величины Х называются выборкой объема п из генеральной совокупности объема N.

Задача обработки результатов наблюдений случайной величины состоит в следующем:

Построение вариационного ряда или ряда распределения и гистограммы для него.
Определение выборочных оценок числовых характеристик случайной величины.
Определение точности выборки.
Определение теоретической функции распределения. Выравнивание статистического ряда.
Проверка согласованности теоретического и статистического распределений, используя критерий .

Данные наблюдений и их наглядное представление.

В данной лабораторной работе необходимо обработать результаты наблюдений за численностью специалистов с высшим и средним образованием по ста совхозам одной из республик. Х - человек, ∆X= 20 чел., k = 7, Р₀ = 0,9960.

20	55	88	72	65	85	74	88	69	72
125	99	92	85	97	91	98	100	120	119
50	47	45	88	29	95	30	145	25	40
118	76	105	62	99	75	99	68	79	78
120	116	109	125	131	120	122	120	117	125
69	110	98	99	98	138	125	135	98	60
75	62	108	58	105	99	81	70	80	155
77	80	115	85	89	160	115	97	95	90
120	121	128	77	138	155	139	47	147	52
100	37	131	60	160	38	155	98	96	124

Используемые формулы.

Чтобы рассчитать размах вариации, используем формулу
Величина интервала находится по формуле
Выборочная средняя рассчитывается как
Выборочная дисперсия определяется по формуле
Среднее квадратическое отклонение находим по формуле
Для нахождения моды используем формулу
Для нахождения медианы:
Случайный момент порядка k:
Параметр q:
Коэффициент асимметрии:
Коэффициент эксцесса:
Для нахождения параметра t используем формулу:
Точность выборки:
Определяем теоретическую частоту по формуле:

Хи-квадрат:
Хи-квадрат критическое определяем на основании данных таблицы. При этом число "степеней свободы" распределения находим по формуле , где k - число интервалов, а S - число связей, накладываемых на частоты . При гипотезе о нормальном распределении число связей равно 3.

Вычисления (таблицы вычислений в Excel) и представление результатов (диаграммы, графики и др.).

Изначально с помощью функций (МИН) и (МАКС) определили минимальное и максимальное значения величины: x_min = 20, x_max = 160. Размах выборки : 160 – 20 = 140. По формуле находим d:

d=140/7=20.

Следующие значения рассчитываем с помощью соответствующих статистических функций в MS Excel.

Таблица 1 Вычисление выборочных оценок числовых характеристик случайной величины

x _min =	20
x _max=	160
R =	140
d =	20
x̅ =	94,21
D =	1050,94
σ =	32,4181
M_o =	99
M_e =	97
As =	-0,1161
Ex =	-0,4238

Чтобы рассчитать точность выборки ε, нужно сначала определить параметр t. С помощью функции (НОРМСТОБР) с учетом P₀=0,996 получили значение t = 2,65207.

Таблица 2 Параметры t

t =
Ф^-1=	2,65207
P_o =	0,996
ε =	8,59751

Теперь можно рассчитать интервальную оценку:

x̅ - ε ≤ E(x) ≤ x̅ + ε

85,6125 ≤ E(x) ≤ 102,8100

Таблица 3 Вариационный ряд распределения

Вариационный ряд распределения								Итого
Интервалы	20-40	40-60	60-80	80-100	100-120	120-140	140-160
Левая граница	20	40	60	80	100	120	140
Число наблюдений в интервале m_i	7	9	19	28	16	14	7	100
q_i	-2,289	-1,672	-1,055	-0,438	0,179	0,796	1,412
Частота интервала	0,07	0,09	0,19	0,28	0,16	0,14	0,07
Значение Ф	0,011	0,047	0,146	0,331	0,571	0,787	0,921
p_i	0,036	0,098	0,185	0,240	0,216	0,134	0,079
np_i	3,621	9,841	18,492	24,030	21,598	13,424	7,890

Вариационный ряд распределения содержит 7 интервалов (по условию k = 7) с величиной интервала d = 20. С помощью функции «Условное форматирование» определили число наблюдений в каждом из интервалов.

Параметр q_i находим по формуле .

Поскольку n = 100, частота интервала определяется следующим образом: .

С помощью функции (НОРМСТРАСП) нашли значения функции Лапласа (Ф) для параметра q_i.

Параметр p_i рассчитывается по формуле . Значение p₇ = 1 – 0,921 = 0,079

И, наконец, значение np_i определяется как произведение соответствующих значений p_i на 100 (т.к. n=100).

Таблица 4

Хи-квадрат

0,4849

Хи-квадрат критическое

(вероятность 0,05;

степень свободы 7 – 3 = 4)

9,4877

Чтобы рассчитать значение Хи-квадрат используем функцию (ХИ2ТЕСТ), а значение Хи-квадрат критическое – функцию (ХИ2ОБР) с уровнем значимости 0,05 и степенью свободы 4.

Чтобы наглядно представить информацию о числе наблюдений, мною была построена гистограмма. Например, наименьшее число наблюдений – 7 – было осуществлено в интервалах: №1 «20-40» и №7 «140-160»; а наибольшее число наблюдений - 28 - в интервале №4 «80-100».

Рисунок 1 Число наблюдений в каждом интервале

Таблица 5

Нормальное распределение по Гауссу
0,000896	0,00304	0,0071	0,0112	0,0121	0,009	0,0045

Данные значения были рассчитаны с помощью функции (НОРМРАСП). На основе этих данных я построила график «Нормальное распределение случайной величины по Гауссу».

Рисунок 2 Нормальное распределение случайной величины

Выводы.

Данная лабораторная работа была направлена на обработку результатов наблюдений за численностью специалистов с высшим и средним образованием по ста совхозам одной из республик. С помощью программы MS Excel были рассчитаны все необходимые числовые характеристики выборки:

размах выборки
мода
медиана
среднее значение выборки
выборочная дисперсия
среднее квадратическое отклонение
асимметрия
эксцесс
точность выборки
интервальная оценка.

Что касается распределения случайной величины, то вывод такой. При достаточно большом числе испытаний п можно считать закон распределения нормальным. Для нормального распределения M_o(X) = М_e (X) = Е (Х). Мною были получены данные M_o = 99; M_е = 97; 85,6125 ≤ E(x) ≤ 102,8100, которые практически совпадают. Поэтому можно сказать, что распределение нормальное.

Коэффициент асимметрии As = - 0,1161. Он отрицателен, значит, либо большая часть значений случайной величины, либо мода находятся левее математического ожидания. Можно неформально заметить, если коэффициент асимметрии отрицателен, то «левый хвост» распределения длиннее правого.

Также было определено значение критерия хи-квадрат (Критерий согласия Пирсона) χ² =0,4849. Хи-квадрат критическое χ²_крит. (0,05; 4) оказалось равно 9,4877.

Критерий согласия Пирсона (χ²) применяют для проверки гипотезы H₀о соответствии эмпирического распределения наблюдаемой величины предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). В нашем случае как раз n = 100. Если χ²≤ χ²_крит., то гипотеза принимается.

0,4849 9,4877, таким образом, делаем вывод, что генеральная совокупность распределена по нормальному закону.

Информация о работе Задача по "Математической статистике"

20	55	88	72	65	85	74	88	69	72
125	99	92	85	97	91	98	100	120	119
50	47	45	88	29	95	30	145	25	40
118	76	105	62	99	75	99	68	79	78
120	116	109	125	131	120	122	120	117	125
69	110	98	99	98	138	125	135	98	60
75	62	108	58	105	99	81	70	80	155
77	80	115	85	89	160	115	97	95	90
120	121	128	77	138	155	139	47	147	52
100	37	131	60	160	38	155	98	96	124

20	55	88	72	65	85	74	88	69	72
125	99	92	85	97	91	98	100	120	119
50	47	45	88	29	95	30	145	25	40
118	76	105	62	99	75	99	68	79	78
120	116	109	125	131	120	122	120	117	125
69	110	98	99	98	138	125	135	98	60
75	62	108	58	105	99	81	70	80	155
77	80	115	85	89	160	115	97	95	90
120	121	128	77	138	155	139	47	147	52
100	37	131	60	160	38	155	98	96	124

20	55	88	72	65	85	74	88	69	72
125	99	92	85	97	91	98	100	120	119
50	47	45	88	29	95	30	145	25	40
118	76	105	62	99	75	99	68	79	78
120	116	109	125	131	120	122	120	117	125
69	110	98	99	98	138	125	135	98	60
75	62	108	58	105	99	81	70	80	155
77	80	115	85	89	160	115	97	95	90
120	121	128	77	138	155	139	47	147	52
100	37	131	60	160	38	155	98	96	124