Биссериальный коэффициент корреляции

Автор работы: Пользователь скрыл имя, 11 Декабря 2013 в 23:57, реферат

Краткое описание

В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в шкале интервалов или отношений (переменная Y), используется бисериальный коэффициент корреляции. Мы помним, что переменная X, полученная в дихотомической шкале, принимает только два значения (кода) 0 и 1. Особо подчеркнем, что несмотря на то, что этот коэффициент изменяется в диапазоне от - 1 до + 1 его знак для интерпретации результатов не имеет значения. Это исключение из общего правила.

Вложенные файлы: 1 файл

Документ Microsoft Office Word.docx

— 50.52 Кб (Скачать файл)

 

 Бисериальный коэффициент корреляции

 

В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в шкале  интервалов или отношений (переменная Y), используется бисериальный коэффициент корреляции. Мы помним, что переменная X, полученная в дихотомической шкале, принимает только два значения (кода) 0 и 1. Особо подчеркнем, что несмотря на то, что этот коэффициент изменяется в диапазоне от - 1 до + 1 его знак для интерпретации результатов не имеет значения. Это исключение из общего правила.

Расчет этого коэффициента производится по формуле:

(формула 8)

где Х1 среднее по тем элементам переменной Y, которым соответствует код (признак) 1 в переменной X. Здесь n1 — количество единичек в переменной X.

Х0 среднее по тем элементам переменной Y, которым соответствует код (признак) 0 в переменной X. Здесь n0 — количество нулей в переменной X.

N = n1 + n0 — общее количество элементов  в переменной X.

Sy— стандартное отклонение переменной Y, вычисляемое по формуле

Значимость бисериального коэффциента корреляции оценивается по величине Тф t-критерия Стьюдента с числом степеней свободы k = n - 2.

Для применения бисериального коэффициента корреляции необходимо соблюдать следующие условия:

1. Сравниваемые переменные должны  быть измерены в разных шкалах: одна Х — в дихотомической  шкале; другая Y—в шкале интервалов  или отношений.

2. Предполагается, что переменная Y имеет нормальный закон распределения.

3. Число варьирующих признаков  в сравниваемых переменных Х  и Y должно быть одинаковым.

4. Для оценки уровня достоверности  бисериального коэффициента корреляции следует пользоваться формулой (5) и таблицей критических значений для t-критерия Стьюдента при k = n - 2.

 

 

 

 

. БИСЕРИАЛЬНЫЙ  КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ (БКК)

 
 
Данный КК вычисляется, когда одна переменная измерена в номинальной  дихотомической шкале (0 или 1), а вторая переменная в количественной шкале. Одним из способов описания связи  между такими переменными является просто вычисление КК Пирсона по исходным данным. Однако можно воспользоваться  более простой формулой для вычисления. В этом случае КК называется точечный бисериальный КК и обозначается prb. Он вычисляется по следующей формуле: 
 
rpb = (x 1 – x 0) : Sx (n1 n0 : n (n – 1) , где x 1 – среднее значение для тех лиц, у которых номинальная переменная у = 1; x 0 – среднее значение для тех лиц, у который номинальная переменная у = 0; Sx – стандартное отклонение для значений по переменной х; n1 – количество лиц, для которых переменная у = 1; n0 – количество лиц, для которых переменная у = 0; n – общее количество лиц, т.е. n = n1 + n0.  
 
Этот КК называется бисериальным, т.к. фактически имеется две серии лиц. Одна серия лиц, для которых номинальная переменная у = 1,а вторая серия лиц, для которых номинальная переменная у = 0. 
 
Пример вычисления бисериального КК. 
 
Пусть переменная х – это рост в см, а переменная у – это пол (1 – мальчики, 0 – девочки). В эксперименте участвовали 15 подростков. Были получены следующие результаты:

 
х

 
у

 
150 
 
170 
 
160 
 
165 
 
140 
 
183 
 
157 
 
152 
 
163 
 
168 
 
180 
 
155 
 
157 
 
160 
 
152

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 
0





 
n = 15 n1 = 8 n0 = 7 
 
x 1 = (150+160+…+157) : 8 = 163,25 
 
x 0 = (170+140+…+152) : 7 = 156,57 
 
x = 8,94 
 
rpb = (163,25 – 156,57) : 8,94 8 7; (15 (15 – 1)) = 0,41 
 
n = 15 = 0,05 
 
tнабл = n – 2 rpb : 1 – rpb = 15 – 2 0,41 : 1 – (0,41) = 1,62 
 
/2 = 0,05/2 = 0,025 = n – 2 = 15 – 2 = 13 tкр = 2,16 
 
 
 
 
 
Н0  
 
-2,16 1,62 2,16 
 
Так как - tкр < tнабл < tкр, то делаем вывод о том, что КК статистически = 0, т.е. корреляционной связи между полом подростков и их ростом нет. 


 

 

 

 

 

 

 

 

 

 

Корреляция бисериальная (лат. bis series — два ряда, две серии) — метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая — в интервальной шкале отношении или порядковой шкале. Название метода связано с тем, что сравниваются две альтернативные серии объектов X, имеющие условные значения 0 или 1 по Y.

Наиболее характерно применение коэффициентов  К. б. в психологической диагностике  при анализе дискримина-тивности заданий теста, а также при определении валидности критериальной путем коррелирования значений тестовых оценок с независимыми характеристиками критерия, выраженными в дихотомической шкале (см. Шкалы измерительные).

Для описания связи между перечисленными видами переменных используется точечный бисериальный коэффициент корреляции Пирсона:

где  , — среднее по X объектов со значением единицы по Y;   — среднее по X объектов со значением нуль по Y; S— стандартное отклонение всех значений по X; n— число объектов с единицей по Y: n— число объектов с нулем по Y, т. е. n = n+ n0. Уравнение для вычисления rpb представляет собой алгебраическое упрощение формулы коэффициента rpb., для случая, когда Y — дихотомическая переменная. Можно привести ряд других эквивалентных выражений, удобных для практического применения:

где х — общее среднее по X.

Значение rpb варьирует от -1 до +1. В том случае, когда переменные с единицей по Y имеют среднее по X, равное среднему переменных с нулем по Y, rpb обращается в нуль.

 

Другим распространенным методом  расчета является определение бисериального коэффициента корреляции (rbis), который применяется в тех случаях, когда есть основания полагать, что дихотомическое распределение близко к нормальному:

Элементы уравнения идентичны  используемым при вычислении rpb, за исключением величины U — ординаты нормированного нормального распределения в точке, за которой лежит   площади под кривой (см.Нормальное распределение). Из данных таблицы 1  ; ордината нормированного (единичного) нормального распределения (U), за которой лежит 61% площади под кривой, равна 0,3836.

В отличие от других коэффициентов  корреляции, rbis может принимать значения ниже -1 и выше +1. В случае попадания значения в эти области делается вывод о некорректности предположения о нормальном законе распределения X или о распределении значений X в выборке с эксцессом значительно ниже нормального. Следует обратить внимание на то обстоятельство, что при распределении переменных X с эксцессом больше нормального границы rbis будут соответственно меньше пределов -1 и +1, что приведет к переоценке степени связи. Это требует тщательной проверки свойств распределения при использовании бисериального коэффициента корреляции.

При вычислении rpb и rbis оперируют одинаковыми исходными данными, однако эти коэффициенты не тождественны. Коэффициент rpb более строг при характеристике степени связи между X и Y (rbis > rpb). Случаи, когда одна из переменных представлена в дихотомической шкале, а другая — в порядковой, требуют применения коэффициента рангово-би-сериальной корреляции:

где   — средний ранг объектов, имеющих 1 по Х;   — средний ранг объектов с 0 по X. Пример вычислений приведен в табл. 2. Коэффициент rrb тесно связан с коэффициентом τ Кендалла. Особенно четко эта связь прослеживается при анализе корреляционной связи с помощью близкого к rrb коэффициента rpb в случае использования для его определения понятия совпадения и инверсии (см. Корреляция ранговая):

где n— число объектов с нулевой дихотомией; n— число объектов с единичной дихотомией; Р — сумма совпадений; Q — сумма инверсий.

 

 

http://wiki.myword.ru/index.php/%D0%9A%D0%BE%D1%80%D1%80%D0%B5%D0%BB%D1%8F%D1%86%D0%B8%D1%8F_%D0%B1%D0%B8%D1%81%D0%B5%D1%80%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F

http://wiki.myword.ru

 

 

 

 

 

Для коррелирования переменных, измеренных в дихотомической и интервальной шкалеиспользуют точечно-бисериальный коэффициент корреляции.  
Точечно-бисериальный коэффициент корреляции - это метод корреляционного анализа отношения переменных, одна из которых измерена в шкале наименований и принимает только 2 значения (к примеру, мужчины/женщины, ответ верный/ответ неверный, признак есть/признака нет), а вторая в шкале отношений или интервальной шкале. Формула расчета коэффициента точечно-бисериальной корреляции:

Где: 
mи m- средние значения Х со значением 1 или 0 по Y. 
σ– стандартное отклонение всех значений по Х 
n,n– количество значений Х с 1 или 0 по Y. 
n – общее количество пар значений 
 
Чаще всего данный вид коэффициента корреляции применяется для расчета связи пунктов теста с суммарной шкалой. Это один из видов проверки валидности. 
 
Случаи, когда одна из переменных представлена в дихотомической шкале, а другая в ранговой (порядковой), требуют применениякоэффициента рангово-бисериальной  корреляции:

rpb=2 / n * (m- m0)

где: 
n – число объектов измерения 
mи m- средний ранг объектов с 1 или 0 по второй переменной. 
Данный коэффициент также применяется при проверке валидности тестов. 
 
Если обе переменные представляют собой дихотомическую шкалу то следует использовать коэффициент четырехклеточной сопряженности Пирсона. 
Классификация объектов по дихотомической шкале приведет к построению четырехклеточной таблицы.


Информация о работе Биссериальный коэффициент корреляции