Автор работы: Пользователь скрыл имя, 12 Апреля 2014 в 16:58, курсовая работа
Параметрические критерии считаются несколько более мощными, чем не-параметрические, при условии, что признак измеренная с интервальной шкале и нормально распределенная Однако с интервальной шкале могут возникнуть определенные проблемы и, если данные, представлены не в стандартизированных оценках К тому же проверка распределения ("на нормальность)" требует достаточно сложных расчетов, результат которых заранее неизвестен .Чаще распределения признаков отличаются от нормального, тогда приходится обращаться к непараметрическим критериям.
ВВЕДЕНИЕ…………………………………………………………………..........5
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Проверка гипотезы о равенстве средних и равных дисперсий ………….... 8
1.2.Проверка гипотезы о равенстве средних неизвестных равных
дисперсий ...…………………………………………………………………….11
1.3. Основные законы распределения …..…………………………………..…13
2. ПРАКТИЧЕСКАЯ ЧАСТЬ
2.1. Использование средств ms excel для проверки гипотезы о равенстве средних равных дисперсий …………………………………………………….19
2.2. Использование средств ms excel для проверки гипотезы о равенстве средних неизвестных равных дисперсий……...……………………….………22
2.3. Построение выборочной функции распределения……………….………26
ЗАКЛЮЧЕНИЕ………………………………………………..……….……….30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………
Курсовая работа
Тема :Параметрические критерии при проверке гипотез о средних и дисперсиях.
Пенза, 2013
РЕФЕРАТ
Пояснительная записка к курсовой работе на тему «Параметрические критерии при проверке гипотез о средних и дисперсиях.» объемом 31 листа содержит 33 формулы, 19 рисунков, 4 использованных источников. Работа выполнена в системе MS Excel.
MICROSOFT EXCEL, ПАКЕТ АНАЛИЗА, ОБРАБОТКА ДАННЫХ,ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ ПРИ РАВНЫХ ДИСПЕРСИЯХ, ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ ПРИ СВЯЗАННЫХ ВЫБОРКАХ, ПОСТРОЕНИЕ ГРАФИКОВ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ.
Объектом исследования является параметрические критерии при проверке гипотез о средних и дисперсиях.
Целью курсовой работы является исследование вычислительных возможностей, предоставляемых встроенными в систему MS Excel элементарными математическими функциями.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ…………………………………………………………
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Проверка гипотезы о равенстве средних и равных дисперсий ………….... 8
1.2.Проверка гипотезы о равенстве средних неизвестных равных
дисперсий ...…………………………………………………………………….
1.3. Основные законы распределения …..…………………………………..…13
2. ПРАКТИЧЕСКАЯ ЧАСТЬ
2.1. Использование средств ms excel для проверки гипотезы о равенстве средних равных дисперсий …………………………………………………….19
2.2. Использование средств ms excel для проверки гипотезы о равенстве средних неизвестных равных дисперсий……...……………………….………22
2.3. Построение выборочной функции распределения……………….………26
ЗАКЛЮЧЕНИЕ………………………………………………..
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………….………..………31
ЗАДАНИЕ НА КУРСОВУЮ РАБОТУ
по теме: «Параметрические критерии при проверке гипотез о средних и дисперсиях».
Исследовать основные возможности пакета анализа для обработки данных методом проверки связи между переменными.
ВВЕДЕНИЕ
Параметрические критерии позволяют прямо оценить уровень основных параметров генеральных совокупностей, разности средних и различия в дисперсиях Критерии способны выявить тенденции изменения признака при переходе от условия к ум языка, оценить взаимодействие двух и более факторов в воздействии на изменения признака.
Параметрические критерии считаются несколько более мощными, чем не-параметрические, при условии, что признак измеренная с интервальной шкале и нормально распределенная Однако с интервальной шкале могут возникнуть определенные проблемы и, если данные, представлены не в стандартизированных оценках К тому же проверка распределения ("на нормальность)" требует достаточно сложных расчетов, результат которых заранее неизвестен .Чаще распределения признаков отличаются от нормального, тогда приходится обращаться к непараметрическим критериям.
Параметрические критерии
Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).
t-критерий Стьюдента
t-критерий Стьюдента — общее название
для класса методов статистической проверк
t-статистика строится обычно по следующему общему принципу: в числителе случайная величина с нулевым математическим ожиданием (при выполнении нулевой гипотезы), а в знаменателе — выборочное стандартное отклонение этой случайной величины, получаемое как квадратный корень из несмещенной оценки дисперсии.
Критерий Фишера
F-тестом или критерием Фишера — называют любой статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).
Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.
Критерий отношения правдоподобия
Метод максимального правдоподобия или метод наибольшего правдоподобия в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что вся информация о статистической выборке содержится в функции правдоподобия.
Для фиксированного набора данных и базовой вероятностной модели, используя метод максимального правдоподобия, мы получим значения параметров модели, которые делают данные «более близкими» к реальным. Оценка максимального правдоподобия дает уникальный и простой способ определить решения в случае нормального распределения.
Метод оценки максимального правдоподобия применяется для широкого круга статистических моделей, в том числе:
линейные модели и обобщенные линейные модели;
факторный анализ;
моделирование структурных уравнений;
многие ситуации, в рамках проверки гипотезы и доверительного интервала формирования;
дискретные модели выбора.
Критерий Романовского
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
Показатель, построенный на квадратах отклонений вариант от их средних, называется дисперсией и выражается формулами:
или
Где знак суммирования произведений отклонений от их средней на веса или частоты этих отклонений в пределах от первого до k –го класса; n-общее число наблюдений.Индекс х у символа дисперсии обозначает, что этот показатель характеризует варьирование числовых значений признака вокруг их средней величины.
Наиболее просто задача сравнения генеральных
средних
и
решается в том случае, если дисперсии
генеральных совокупностей, из которых
извлечены выборки
,
,
,
известны и равны
и
, соответственно. Тогда можно принять,
что выборочные средние
и
подчинены нормальным распределениям
и
– распределениям с плотностью
,
. (2)
Пусть проверяется гипотеза H0 о равенстве генеральных средних. В случае
справедливости этой гипотезы случайная
величина, равная разности
выборочных средних, подчинена нормальному
закону
распределения с математическим ожиданием
(3)
и дисперсией
. (4)
В последнем соотношении слагаемые в
правой части представляют собой ни что
иное, как квадраты соответствующих стандартных
ошибок.
Так как неслучайный множитель можно
выносить за знак дисперсии, возводя
его в квадрат:
(5)
то связанная с разностью
выборочных средних статистика
(6)
подчинена стандартному нормальному
закону
.
Пусть в качестве конкурирующей гипотезы
выбрана гипотеза H1, состоящая в том, что для генеральных
средних имеет место неравенство
. (7)
Тогда критическое событие A состоит в том, что случайная величина,
подчиненная стандартному нормальному
закону, окажется не принадлежащей интервалу
. Вероятность этого события
, (8)
где F – функция Лапласа, F* – функция стандартного нормального
распределения.
Если вероятность
оказывается меньше заранее заданного
уровня значимости, то гипотеза H0 о равенстве генеральных средних отвергается.
Пусть дисперсии генеральных совокупностей,
из которых извлечены выборки
и
неизвестны (но предполагаются равными).
Решение задачи сравнения генеральных
средних начинается с вычисления смешанной оценки дисперсии разности выборочных
средних:
. (9)
После этого находится эмпирическое
значение статистики
Статистика подчинена распределению
Стьюдента с
степенями свободы. При альтернативе
вероятность критического события находится по формуле
,
где
–бета-функция.
Зависимость вероятности критического
события от значения модуля статистики tдля выборок объемом
приведена на рис. 1.
Рис. 1. Вероятность критического события
в задаче сравнения средних
Если вероятность
оказывается меньше заранее заданного
уровня значимости, то гипотеза H0 о равенстве генеральных средних отвергается
в пользу альтернативы
В процессе решения статистических задач
часто требуется выполнить сравнение
двух величин, одна из которых вычисляется
на основе выборочных характеристик (оценок
среднего, дисперсии и т.д.), а другая является
значением функции распределения одной
из статистик (или квантилью этой статистики
– значением функции, обратной к функции
распределения).
Наиболее распространенные статистики
являются моделями типичных задач теории
вероятностей, возникающих в практических
ситуациях.
В связи с задачей о совместном влиянии
случайных величин возникает важнейшее
распределение, называемое нормальным. Именно, если величина X является суммой большого числа независимых
случайных величин, то плотность распределения
величины X имеет вид
где m – константы, равные математическому
ожиданию и стандартному отклонению случайной
величиныsи X. Если m = 1, то распределение называют s= 0 и стандартным (или нормированны
График плотности вероятности ( 13) нормального
распределения называетсянормальной кривой (или кривой Гаусса). Выражение (13) определяет четную функцию
относительно разности
, поэтому нормальная кривая симметрична
относительно прямой
. Медиана и мода нормального распределения
совпадают с математическим ожиданием.
По мере удаления от точки
плотность быстро уменьшается и при
асимптотически приближается к нулю.
При изменении математического ожидания m кривая становится более «пологой».s кривая становится более «островершинной»,
сжимаясь вдоль оси абсцисс; при увеличении sнормальная кривая смещается вдоль оси
абсцисс, не изменяя
своей формы. При уменьшении вероятность попадания нормально распределенной случайной величины на данный интервал
где
– функция Лапласа:
Иногда функцией Лапласа называют функцию
.
Если (из таблиц) известно значение именно
этой функции, то правую часть соотношения
необходимо разделить на 2.
Известным может оказаться значение интеграла ошибок:
.
Функция Лапласа связана с ним соотношением
Начиная с t = 2 можно применять асимптотическую формулу
При t = 2 соотношение ( 17) дает абсолютную погрешность
около 0,004; при t =3 погрешность уменьшается до 10-4
.
Наиболее важную роль в математической
статистике играет распределение Пирсона, иначе называемое
-распределением. Этому распределению
подчинена сумма квадратов k независимых случайных величин:
каждая из которых, в свою очередь, распределена
по стандартному нормальному закону. Плотность
-распределения
где
– гамма-функция:
(20)
Графики плотности
-распределения приведены на рис.2
Рис. 2. Плотность
-распределения для различного числа
степеней свободы
С увеличением числа степеней свободы
плотность ( 19) приближается к плотности
нормального закона. Справедлива асимптотическая
формула
(21)
где
– функция стандартного нормального
распределения.
^ Распределением
Стьюдента с k степенями свободы называется распределение
случайной величины:
где ^ U – случайная величина, подчиненная стандартному
нормальному закону, Y – случайная величина, подчиненная
распределению с k степенями свободы.
Плотность распределения Стьюдента
Графики функции ( 23) для различного числа
степеней свободы изображены
Информация о работе Параметрические критерии при проверке гипотез о средних и дисперсиях