Автор работы: Пользователь скрыл имя, 15 Декабря 2013 в 20:43, лекция
Статистичний критерій - це вирішальне правило, що забезпечує математично обґрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні критерії будуються на основі статистики ^(х1, х2, хп) - деякої функції від результатів спостережень х1, х2, хп. Статистика ¥ є випадковою величиною з певним законом розподілу. Серед значень статистики ¥ виділяють критичну область ¥кр з властивістю: якщо емпіричне значення статистики ¥емп належать області ¥ кр, то нульову гіпотезу відхиляють (відкидають), інакше - приймають
Статистичні критерії
Статистичний критерій - це вирішальне правило, що забезпечує математично обґрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні критерії будуються на основі статистики ^(х1, х2, хп) - деякої функції від результатів спостережень х1, х2, хп. Статистика ¥ є випадковою величиною з певним законом розподілу. Серед значень статистики ¥ виділяють критичну область ¥кр з властивістю: якщо емпіричне значення статистики ¥емп належать області ¥ кр, то нульову гіпотезу відхиляють (відкидають), інакше - приймають. Статистичні критерії визначають у практичній діяльності метод розрахунку певного числа, яке позначається як емпіричне значення критерію, наприклад, ґем" для ґ-критерію Стьюдента.
Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростовування гіпотези. Наприклад, у разі застосування ґ-критерію Стьюдента, якщо ґем" > ґкр , то значення статистики належать критичній області і нульова гіпотеза Н0 відхиляється (приймається альтернативна гіпотеза Ні). Правила прийняття статистичного рішення обумовлюються для кожного критерію.
Параметричні і непараметричні критерії
Відповідно до статистичних
гіпотез статистичні критерії діляться
на параметричні йнепараметричн
Параметричні критерії використовуються в завданнях перевірки параметричних гіпотез і включають у свій розрахунок показники розподілу, наприклад, середні, дисперсії тощо. Це такі відомі класичні критерії, як г-критерій, ґ-критерій Стьюдента, ^-критерій Фішера та ін. Непараметричні критерії перевірки гіпотез засновані на операціях з іншими даними, зокрема, частотами, рангами тощо. Це А-критерій Колмогорова-Смірнова, [/-критерій Вілкок-сона-Манна-Вітні та багато інших.
Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних сукупностей, різниці середніх і відмінності в дисперсіях. Критерії спроможні виявити тенденції зміни ознаки при переході від умови до умови, оцінити взаємодію двох і більш факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, ніж не-параметричні, за умов, якщо ознака виміряна за інтервальною шкалою і нормально розподілена. Проте з інтервальною шкалою можуть виникнути певні проблеми, якщо дані, представлено не в стандартизованих оцінках. До того ж перевірка розподілу "на нормальність" вимагає досить складних розрахунків, результат яких заздалегідь невідомий. Найчастіше розподіли ознак відрізняються від нормального, тоді доводиться звертатися до непараметричних критеріїв.
Непараметричні критерії позбавлені перерахованих вище обмежень. Проте вони не дозволяють здійснити пряму оцінку рівня таких важливих параметрів, як середнє або дисперсія, з їхньою допомогою неможливо оцінити взаємодію двох і більше умов або факторів, що впливають на зміну ознаки. Непараметричні критерії дозволяють вирішити деякі важливі завдання, які супроводжують дослідження в психології і педагогіці: виявлення відмінностей у рівні досліджуваної ознаки, оцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах ознак.
Застосування критеріїв для прийняття (відхилення) статистичних гіпотез завжди здійснюються з довірчою ймовірністю, інакше кажучи, на певному рівні значущості.
Рівень статистичної значущості
Рівень статистичної значущості - це ймовірність того, що ми визнали відмінності істотними (прийняли альтернативну гіпотезу і відхилили нульову), а вони насправді випадкові. Наприклад, якщо вказується, що відмінності достовірні на 5%-му рівні значущості, то мається на увазі ймовірність 0,05 того, що вони все ж таки недостовірні. Рівень значущості - це ймовірність відхилення нульової гіпотези, тоді як вона правильна.
Історично склалося так, що в психолого-педагогічних дослідженнях прийнято вважати нижчим рівнем статистичної значущості 5%-й рівень (а<0,05), достатнім - 1%-й рівень (а<0,01) і вищим - 0,1%-й рівень (а<0,001). Тому в таблицях критичних значень звичайно приводяться значення критеріїв, відповідних рівням статистичної значущості а<0,05 і а<0,01, інколи а<0,001. Пропонуємо дотримуватися правила відхилення гіпотези про відсутність відмінностей (Н0) і прийняття гіпотези про статистичну достовірність відмінностей (ні), доки рівень статистичної значущості не досягне а=0,05.
Правила прийняття статистичних рішень
Прийняття статистичних рішень виконується на основі емпіричного критерію: якщо значення ¥емп знаходяться в критичній області | ¥емп | > | ¥кр |, нульова гіпотеза Н0відхиляється24. На рис. 5.1 - 5.3 критичні області зафарбовано. Рівень статистичної значущості і відповідні критичні значення критеріїв визначаються по-різному при перевірці спрямованих і неспрямованих статистичних гіпотез. При спрямованих гіпотезах використовується однобічний критерій (рис. 5.1 і 5.2), при неспрямованих - двобічний (рис. 5.3).
Винятки: для деяких непараметричних критеріїв, наприклад, Є-критерію знаків, Т-критерію Вілкоксона і [/-критерію Манна-Вітні встановлюються зворотні співвідношення.
Двобічний критерій строгіший, оскільки він перевіряє відмінності в обидві сторони, і для нього при певному рівні значущості а критичні зони удвічі менші, ніж для однобічного критерію. Отже, на рівні значущості а для однобічного критерію нульова гіпотеза Н0 відхиляється, коли ¥емп > ¥ а , для двобічного критерію Н0 відхиляється, коли ІРемп > ¥ а/2 . Наприклад, на рівні значущості а =0,05 критична зона для однобічного критерію складає ¥ 0і05 (рис. 5.1 або 5.2), для двобічного критерію - ¥0025 (рис. 5.3).
Рис. 5.3. Двостороння критична область
Критичні значення параметричних критеріїв, наприклад, t-критерію Стьюдента або ^-критерію Фішера, зручніше отримувати за допомогою відповідних функцій MS Excel. Критичні значення непараметричних критеріїв табульовано таким чином, що спрямованим гіпотезам відповідає однобічний, а неспрямованим - двобічний критерій. Гіпотези дослідника повинні збігалися за сенсом із гіпотезами, пропонованими в описі кожного з критеріїв.
Помилки прийняття статистичних рішень
Прийняття статистичних рішень супроводжується помилками.
Помилка 1-го роду - це помилка відхилення нульової гіпотези, тоді як вона правильна. Ймовірність такої помилки позначається як а (рівень значущості). Отже, а=р{¥є ¥ кр | H0} - це ймовірність події {¥є ¥ кр}, за умови, що нульова гіпотеза Н0 істина. Якщо ймовірність помилки - це а, то ймовірність правильного рішення (1- а). Чим менше а, тим більша достовірність прийняття правильного рішення.
Помилка 2-го роду - це помилка прийняття нульової гіпотези Н0 тоді, якщо вона неправильна. Ймовірність помилки 2-го роду позначається як Отже, Р=Р{¥<£ ¥кр | Ні} - це ймовірність події {¥<£ ¥кр}, за умови, що альтернативна гіпотеза Ні прийнята (нульова гіпотеза Н0 відхилена). Ймовірність не припуститися помилки 2-го роду дорівнює (1- Р) і називається потужністю критерію.
Помилки прийняття статистичних рішень
Прийняте рішення на основі критерію |
Реальний стан дійсності (нам невідомий) | |
Н0 істинна |
Н0 хибна | |
Н0прийнято |
Правильне рішення |
Помилка 2-го роду |
Н0 відхилено |
Помилка 1-го роду |
Правильне рішення |
Потужність критерію - це його здатність виявляти відмінності, тобто відхиляти нульову гіпотезу про відсутність відмінностей, якщо вона помилкова. Потужність критерію визначається емпіричним шляхом. Виявляється, що деякі критерії дозволяють виявити відмінності там, де інші опиняються неспроможними це зробити, тому пропонується застосовувати більш потужні критерії. Проте підставою для вибору критерію може бути не лише потужність, але й інші його характеристики, а саме: ширший діапазон застосування до даних, визначених, наприклад, за номінальною або ранговою шкалою; обмеженість обсягів вибірки або їхня неоднаковість за обсягом; велика інформативність результатів. Тоді й використовують менш потужні критерії.
Стандартні процедури прийняття (відхилення) нульової гіпотези Н0 основані на фіксації факту попадання значень емпіричного критерію ¥ем" у критичну область ¥кр, яка визначена наперед фіксованим рівнем значущості а.
Проте можна виконувати зворотну процедуру: визначити ймовірність ремп, яка відповідає емпіричному критерієві ¥емп. Нульова гіпотеза Н0 відхиляється, якщо ймовірність рем" випадкової події менше прийнятого рівня значущості а , тобто за умов: рем" < а (для однобічних гіпотез); рем"< а/2 (для двобічних гіпотез).
Приклад 5.1. Прийняти статистичне рішення щодо нульової гіпотези Н0 за статистикою z-критерію з нормальним розподілом. Емпіричне значення z-критерію zeMn = 2,19. Розглянути варіант однобічних гіпотез.
Рішення:
За допомогою, наприклад, функції MS Excel =НОРМСТРАСП() можна визначити ймовірність рем",яка відповідає емпіричному критерію zeM" з нормальним розподілом цієї статистики. Функція =HOPMCTPACn(zejv,") повертає значення 1-ремп ~ 0,9857. Значення рем" ~ 1-0,9857=0,0143 ~ 1,43%.
Висновки для однобічного варіанту гіпотез:
Оскільки _pejlI"<0,05 (0,0143<0,05), H0 відхиляється на рівні значущості 5%; проте_pejlI">0,01 (0,0143> 0,01), H0 приймається на рівні значущості 1%;
Типи статистичних гіпотез визначаються сукупністю тих завдань і методів їх розв'язання, які мають місце в психолого-педагогічних дослідженнях. За своїм прикладним змістом статистичні гіпотези можна поділити на декілька основних типів щодо :
o закону розподілу випадкових величин тих чи інших властивостей;
o чисельних показників параметрів (середніх, дисперсій, кореляцій та ін.);
o однорідності двох або декількох вибірок
o відмінностей у рівні ознак досліджуваного явища або процесу;
o відмінностей у розподілі ознак.
Загальна схема перевірки статистичних гіпотез. Незважаючи на різноманітність типів гіпотез і критеріїв, схему перевірки статистичних гіпотез можна представити у вигляді послідовності таких процедур:
1) формулювання гіпотез Н0 і Ні на основі завдань дослідження;
2) перевірка припущень щодо відповідності розподілу параметричному сімейству, параметрів вибірки та іншої додаткової інформації;
3) прийняття рівня значущості а;
4) вибір статистичного критерію;
5) розрахунки емпіричного критерію;
6) визначення області критичних значень критерію;
7) прийняття статистичного рішення;
8) формулювання статистичних висновків;
9) прийняття рішення щодо продовження (припинення) досліджень;
10) формулювання змістовних висновків.
У прикладній статистиці використовують два стилі викладу методів перевірки гіпотез. За одним формулюють і нульову, і альтернативну гіпотези (або набору гіпотез), перевірки яких відбувається за певними критеріями. При іншому стилі виклад будують як алгоритмічний опис критеріїв для перевірки нульової гіпотези, про альтернативи навіть не згадується. У посібнику пропонується перший варіант.