Параметрические критерии при проверке гипотез о средних и дисперсиях

Автор работы: Пользователь скрыл имя, 12 Апреля 2014 в 16:58, курсовая работа

Краткое описание

Параметрические критерии считаются несколько более мощными, чем не-параметрические, при условии, что признак измеренная с интервальной шкале и нормально распределенная Однако с интервальной шкале могут возникнуть определенные проблемы и, если данные, представлены не в стандартизированных оценках К тому же проверка распределения ("на нормальность)" требует достаточно сложных расчетов, результат которых заранее неизвестен .Чаще распределения признаков отличаются от нормального, тогда приходится обращаться к непараметрическим критериям.

Содержание

ВВЕДЕНИЕ…………………………………………………………………..........5
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Проверка гипотезы о равенстве средних и равных дисперсий ………….... 8
1.2.Проверка гипотезы о равенстве средних неизвестных равных
дисперсий ...…………………………………………………………………….11
1.3. Основные законы распределения …..…………………………………..…13
2. ПРАКТИЧЕСКАЯ ЧАСТЬ
2.1. Использование средств ms excel для проверки гипотезы о равенстве средних равных дисперсий …………………………………………………….19
2.2. Использование средств ms excel для проверки гипотезы о равенстве средних неизвестных равных дисперсий……...……………………….………22
2.3. Построение выборочной функции распределения……………….………26
ЗАКЛЮЧЕНИЕ………………………………………………..……….……….30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………

Вложенные файлы: 1 файл

КУРСОВАЯ ПО вероятн.doc

— 2.27 Мб (Скачать файл)

 

Курсовая работа

Тема :Параметрические критерии при проверке гипотез о средних и дисперсиях.

 

 

 

 

 

                                                

 

 

 

 

 

 

 

 

Пенза, 2013

 

РЕФЕРАТ

 

Пояснительная записка к курсовой работе на тему «Параметрические критерии при проверке гипотез о средних и дисперсиях.» объемом 31 листа содержит 33 формулы, 19 рисунков, 4 использованных источников. Работа выполнена в системе MS Excel.

 

MICROSOFT EXCEL, ПАКЕТ АНАЛИЗА, ОБРАБОТКА  ДАННЫХ,ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ ПРИ РАВНЫХ ДИСПЕРСИЯХ, ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ ПРИ СВЯЗАННЫХ ВЫБОРКАХ, ПОСТРОЕНИЕ ГРАФИКОВ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ.

 

Объектом исследования является параметрические критерии при проверке гипотез о средних и дисперсиях.

 

Целью курсовой работы является исследование вычислительных возможностей, предоставляемых встроенными в систему MS Excel элементарными математическими функциями.

 

 

 

 

 

 

 

 

 

 

 

 

СОДЕРЖАНИЕ

                                                                                             

ВВЕДЕНИЕ…………………………………………………………………..........5

1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

1.1 Проверка гипотезы о равенстве средних и равных дисперсий ………….... 8

1.2.Проверка гипотезы о равенстве средних неизвестных равных

  дисперсий ...…………………………………………………………………….11

1.3. Основные законы распределения …..…………………………………..…13

2. ПРАКТИЧЕСКАЯ ЧАСТЬ

2.1. Использование средств ms excel для проверки гипотезы о равенстве средних равных дисперсий …………………………………………………….19

2.2. Использование средств ms excel для проверки гипотезы о равенстве средних неизвестных равных дисперсий……...……………………….………22

2.3. Построение выборочной функции  распределения……………….………26

ЗАКЛЮЧЕНИЕ………………………………………………..……….……….30

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………….………..………31

 

 

 

 

 

 

 

 

 

 

 

 

 

ЗАДАНИЕ НА КУРСОВУЮ РАБОТУ

по теме: «Параметрические критерии при проверке гипотез о средних и дисперсиях».

Исследовать основные возможности пакета анализа для обработки данных методом проверки связи между переменными.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

Параметрические критерии позволяют прямо оценить уровень основных параметров генеральных совокупностей, разности средних и различия в дисперсиях Критерии способны выявить тенденции изменения признака при переходе от условия к ум языка, оценить взаимодействие двух и более факторов в воздействии на изменения признака.

Параметрические критерии считаются несколько более мощными, чем не-параметрические, при условии, что признак измеренная с интервальной шкале и нормально распределенная Однако с интервальной шкале могут возникнуть определенные проблемы и, если данные, представлены не в стандартизированных оценках К тому же проверка распределения ("на нормальность)" требует достаточно сложных расчетов, результат которых заранее неизвестен .Чаще распределения признаков отличаются от нормального, тогда приходится обращаться к непараметрическим критериям.

 

Параметрические критерии

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

               t-критерий Стьюдента

t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

 

t-статистика строится обычно по следующему общему принципу: в числителе случайная величина с нулевым математическим ожиданием (при выполнении нулевой гипотезы), а в знаменателе — выборочное стандартное отклонение этой случайной величины, получаемое как квадратный корень из несмещенной оценки дисперсии.

            Критерий Фишера

F-тестом или критерием Фишера  — называют любой статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).

Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.

           Критерий отношения правдоподобия

Метод максимального правдоподобия или метод наибольшего правдоподобия в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что вся информация о статистической выборке содержится в функции правдоподобия.

Для фиксированного набора данных и базовой вероятностной модели, используя метод максимального правдоподобия, мы получим значения параметров модели, которые делают данные «более близкими» к реальным. Оценка максимального правдоподобия дает уникальный и простой способ определить решения в случае нормального распределения.

Метод оценки максимального правдоподобия применяется для широкого круга статистических моделей, в том числе:

               линейные модели и обобщенные линейные модели;

               факторный анализ;

               моделирование структурных уравнений;

              многие ситуации, в рамках проверки гипотезы и доверительного   интервала формирования;

              дискретные модели выбора.

      Критерий Романовского

 

 

 

 

 

 

 

 

 

 

1. ТЕОРЕТИЧЕСКАЯ  ЧАСТЬ

    1. ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ И РАВНЫХ ДИСПЕРСИЙ

 

Показатель, построенный на квадратах отклонений вариант от их средних, называется дисперсией и выражается формулами:

 

 или                                           (1)

Где знак суммирования произведений отклонений от их средней на веса или частоты этих отклонений в пределах от первого до k –го класса; n-общее число наблюдений.Индекс х у символа дисперсии обозначает, что этот показатель характеризует варьирование числовых значений признака вокруг их средней величины.

 
Наиболее просто задача сравнения генеральных средних   и   решается в том случае, если дисперсии генеральных совокупностей, из которых извлечены выборки 
 
,  ,  ,   
 
известны и равны   и  , соответственно. Тогда можно принять, что выборочные средние   и   подчинены нормальным распределениям  и   – распределениям с плотностью 

 

,  . (2) 
 
Пусть проверяется гипотеза H0 о равенстве генеральных средних. В случае справедливости этой гипотезы случайная величина, равная разности  выборочных средних, подчинена нормальному закону

распределения с математическим ожиданием

(3) 

и дисперсией

 
. (4) 
В последнем соотношении слагаемые в правой части представляют собой ни что иное, как квадраты соответствующих стандартных ошибок. 
 
Так как неслучайный множитель можно выносить за знак дисперсии, возводя

его в квадрат:

     
(5) 
то связанная с разностью   выборочных средних статистика 
 
(6) 
 
подчинена стандартному нормальному закону  . 
 
Пусть в качестве конкурирующей гипотезы выбрана гипотеза H1, состоящая в том, что для генеральных средних имеет место неравенство 
 
. (7) 
 
Тогда критическое событие  A состоит в том, что случайная величина,

подчиненная стандартному нормальному закону, окажется не принадлежащей интервалу  . Вероятность этого события 
 
, (8) 
 
где F – функция Лапласа, F* – функция стандартного нормального распределения. 
 
Если вероятность   оказывается меньше заранее заданного уровня значимости, то гипотеза H0 о равенстве генеральных средних отвергается.

 

 

 

    1. ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ НЕИЗВЕСТНЫХ РАВНЫХ ДИСПЕРСИЙ

 
Пусть дисперсии генеральных совокупностей, из которых извлечены выборки   и   неизвестны (но предполагаются равными). Решение задачи сравнения генеральных средних начинается с вычисления смешанной оценки дисперсии разности выборочных средних: 
 
. (9) 
 
После этого находится эмпирическое значение статистики

                                                                                    (10) 
Статистика подчинена распределению Стьюдента с  степенями свободы. При альтернативе   вероятность критического события находится по формуле

 
,                                                          (11) 
где 
 
                                                            (12) 
 
–бета-функция. 
 
Зависимость вероятности критического события от значения модуля статистики tдля выборок объемом   приведена на рис. 1. 
 
 
 
Рис. 1. Вероятность критического события 
в задаче сравнения средних 
 
Если вероятность   оказывается меньше заранее заданного уровня значимости, то гипотеза H0 о равенстве генеральных средних отвергается в пользу альтернативы 

 

 

 

 

 

    1. ОСНОВНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ.

 
          В процессе решения статистических задач часто требуется выполнить сравнение двух величин, одна из которых вычисляется на основе выборочных характеристик (оценок среднего, дисперсии и т.д.), а другая является значением функции распределения одной из статистик (или квантилью этой статистики – значением функции, обратной к функции распределения). 
 
           Наиболее распространенные статистики являются моделями типичных задач теории вероятностей, возникающих в практических ситуациях. 
 
           В связи с задачей о совместном влиянии случайных величин возникает важнейшее распределение, называемое нормальным. Именно, если величина X является суммой большого числа независимых случайных величин, то плотность распределения величины X имеет вид

                                                      (13)

 
где m  – константы, равные математическому ожиданию и стандартному отклонению случайной величиныsи  X. Если m = 1, то распределение называют s= 0 и  стандартным (или нормированным) нормальным распределением. 
 
       График плотности вероятности ( 13) нормального распределения называетсянормальной кривой (или кривой Гаусса). Выражение (13) определяет четную функцию относительно разности  , поэтому нормальная кривая симметрична относительно прямой  . Медиана и мода нормального распределения совпадают с математическим ожиданием. По мере удаления от точки  плотность быстро уменьшается и при   асимптотически приближается к нулю. При изменении математического ожидания m  кривая становится более «пологой».s кривая становится более «островершинной», сжимаясь вдоль оси абсцисс; при увеличении sнормальная кривая смещается вдоль оси абсцисс, не изменяя

своей формы. При уменьшении вероятность попадания нормально распределенной случайной величины на данный интервал

                                                                     (14) 
где   – функция Лапласа:

                                                                                           (15) 
Иногда функцией Лапласа называют функцию 
 

Если (из таблиц) известно значение именно этой функции, то правую часть соотношения необходимо разделить на 2. 
 
Известным может оказаться значение интеграла ошибок: 
 

 
Функция Лапласа связана с ним соотношением

                                                                                    (16) 
Начиная с t = 2 можно применять асимптотическую формулу

                                                                                  (17) 
При t = 2 соотношение ( 17) дает абсолютную погрешность около 0,004; при t =3 погрешность уменьшается до 10-4           . 
 
Наиболее важную роль в математической статистике играет распределение Пирсона, иначе называемое  -распределением. Этому распределению подчинена сумма квадратов k независимых случайных величин:

                                                                                                            (18) 
каждая из которых, в свою очередь, распределена по стандартному нормальному закону. Плотность  -распределения

                                                                                      (19) 
где   – гамма-функция:

        (20) 
Графики плотности  -распределения приведены на рис.2

 
  
 
Рис. 2. Плотность  -распределения для различного числа степеней свободы 
 
С увеличением числа степеней свободы плотность ( 19) приближается к плотности нормального закона. Справедлива асимптотическая формула

                                  (21)

 
где   – функция стандартного нормального распределения. 
 
^ Распределением Стьюдента с k степенями свободы называется распределение случайной величины:

                                                                                                 (22)

 
где ^ U – случайная величина, подчиненная стандартному нормальному закону, Y – случайная величина, подчиненная   распределению с k степенями свободы. 
 
Плотность распределения Стьюдента

                                                      (23)

 
Графики функции ( 23) для различного числа степеней свободы изображены

Информация о работе Параметрические критерии при проверке гипотез о средних и дисперсиях