Автор работы: Пользователь скрыл имя, 11 Декабря 2013 в 23:57, реферат
В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в шкале интервалов или отношений (переменная Y), используется бисериальный коэффициент корреляции. Мы помним, что переменная X, полученная в дихотомической шкале, принимает только два значения (кода) 0 и 1. Особо подчеркнем, что несмотря на то, что этот коэффициент изменяется в диапазоне от - 1 до + 1 его знак для интерпретации результатов не имеет значения. Это исключение из общего правила.
Бисериальный коэффициент корреляции
В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X), а другая в шкале интервалов или отношений (переменная Y), используется бисериальный коэффициент корреляции. Мы помним, что переменная X, полученная в дихотомической шкале, принимает только два значения (кода) 0 и 1. Особо подчеркнем, что несмотря на то, что этот коэффициент изменяется в диапазоне от - 1 до + 1 его знак для интерпретации результатов не имеет значения. Это исключение из общего правила.
Расчет этого коэффициента производится по формуле:
(формула 8)
где Х1 среднее по тем элементам переменной Y, которым соответствует код (признак) 1 в переменной X. Здесь n1 — количество единичек в переменной X.
Х0 среднее по тем элементам переменной Y, которым соответствует код (признак) 0 в переменной X. Здесь n0 — количество нулей в переменной X.
N = n1 + n0 — общее количество элементов в переменной X.
Sy— стандартное отклонение переменной Y, вычисляемое по формуле
Значимость бисериального коэффциента корреляции оценивается по величине Тф t-критерия Стьюдента с числом степеней свободы k = n - 2.
Для применения бисериального коэффициента корреляции необходимо соблюдать следующие условия:
1. Сравниваемые переменные
2. Предполагается, что переменная
Y имеет нормальный закон
3. Число варьирующих признаков в сравниваемых переменных Х и Y должно быть одинаковым.
4. Для оценки уровня
. БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ (БКК)
Данный КК вычисляется, когда одна
переменная измерена в номинальной
дихотомической шкале (0 или 1), а вторая
переменная в количественной шкале.
Одним из способов описания связи
между такими переменными является
просто вычисление КК Пирсона по исходным
данным. Однако можно воспользоваться
более простой формулой для вычисления.
В этом случае КК называется точечный
бисериальный КК и обозначается prb. Он
вычисляется по следующей формуле:
rpb = (x 1 – x 0) : Sx (n1 n0 : n (n – 1) , где x 1 – среднее
значение для тех лиц, у которых номинальная
переменная у = 1; x 0 – среднее значение
для тех лиц, у который номинальная переменная
у = 0; Sx – стандартное отклонение для значений
по переменной х; n1 – количество лиц, для
которых переменная у = 1; n0 – количество
лиц, для которых переменная у = 0; n – общее
количество лиц, т.е. n = n1 + n0.
Этот КК называется бисериальным, т.к.
фактически имеется две серии лиц. Одна
серия лиц, для которых номинальная переменная
у = 1,а вторая серия лиц, для которых номинальная
переменная у = 0.
Пример вычисления бисериального КК.
Пусть переменная х – это рост в см, а переменная
у – это пол (1 – мальчики, 0 – девочки).
В эксперименте участвовали 15 подростков.
Были получены следующие результаты:
|
|
|
|
n = 15 n1 = 8 n0 = 7
x 1 = (150+160+…+157) : 8 = 163,25
x 0 = (170+140+…+152) : 7 = 156,57
x = 8,94
rpb = (163,25 – 156,57) : 8,94 8 7; (15 (15 – 1)) = 0,41
n = 15 = 0,05
tнабл = n – 2 rpb : 1 – rpb = 15 – 2 0,41 : 1 – (0,41) =
1,62
/2 = 0,05/2 = 0,025 = n – 2 = 15 – 2 = 13 tкр = 2,16
Н0
-2,16 1,62 2,16
Так как - tкр < tнабл < tкр, то делаем вывод
о том, что КК статистически = 0, т.е. корреляционной
связи между полом подростков и их ростом
нет.
Корреляция бисериальная (лат. bis series — два ряда, две серии) — метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая — в интервальной шкале отношении или порядковой шкале. Название метода связано с тем, что сравниваются две альтернативные серии объектов X, имеющие условные значения 0 или 1 по Y.
Наиболее характерно применение коэффициентов
К. б. в психологической диагностике
при анализе дискримина-
Для описания связи между перечисленными видами переменных используется точечный бисериальный коэффициент корреляции Пирсона:
где , — среднее по X объектов со значением единицы по Y; — среднее по X объектов со значением нуль по Y; Sx — стандартное отклонение всех значений по X; n1 — число объектов с единицей по Y: n0 — число объектов с нулем по Y, т. е. n = n1 + n0. Уравнение для вычисления rpb представляет собой алгебраическое упрощение формулы коэффициента rpb., для случая, когда Y — дихотомическая переменная. Можно привести ряд других эквивалентных выражений, удобных для практического применения:
где х — общее среднее по X.
Значение rpb варьирует от -1 до +1. В том случае, когда переменные с единицей по Y имеют среднее по X, равное среднему переменных с нулем по Y, rpb обращается в нуль.
Другим распространенным методом расчета является определение бисериального коэффициента корреляции (rbis), который применяется в тех случаях, когда есть основания полагать, что дихотомическое распределение близко к нормальному:
Элементы уравнения идентичны используемым при вычислении rpb, за исключением величины U — ординаты нормированного нормального распределения в точке, за которой лежит площади под кривой (см.Нормальное распределение). Из данных таблицы 1 ; ордината нормированного (единичного) нормального распределения (U), за которой лежит 61% площади под кривой, равна 0,3836.
В отличие от других коэффициентов корреляции, rbis может принимать значения ниже -1 и выше +1. В случае попадания значения в эти области делается вывод о некорректности предположения о нормальном законе распределения X или о распределении значений X в выборке с эксцессом значительно ниже нормального. Следует обратить внимание на то обстоятельство, что при распределении переменных X с эксцессом больше нормального границы rbis будут соответственно меньше пределов -1 и +1, что приведет к переоценке степени связи. Это требует тщательной проверки свойств распределения при использовании бисериального коэффициента корреляции.
При вычислении rpb и rbis оперирую
где — средний ранг объектов, имеющих 1 по Х; — средний ранг объектов с 0 по X. Пример вычислений приведен в табл. 2. Коэффициент rrb тесно связан с коэффициентом τ Кендалла. Особенно четко эта связь прослеживается при анализе корреляционной связи с помощью близкого к rrb коэффициента rpb в случае использования для его определения понятия совпадения и инверсии (см. Корреляция ранговая):
где n0 — число объектов с нулевой дихотомией; n1 — число объектов с единичной дихотомией; Р — сумма совпадений; Q — сумма инверсий.
http://wiki.myword.ru/index.
http://wiki.myword.ru
Для коррелирования
переменных, измеренных в дихотомической
и интервальной шкалеиспользуют точечно-
Точечно-бисериальный коэффициент корреляции
- это метод корреляционного анализа отношения
переменных, одна из которых измерена
в шкале наименований и принимает только
2 значения (к примеру, мужчины/женщины,
ответ верный/ответ неверный, признак
есть/признака нет), а вторая в шкале отношений
или интервальной шкале. Формула расчета
коэффициента точечно-бисериальной корреляции:
Где:
m1 и m0 - средние значения
Х со значением 1 или 0 по Y.
σx – стандартное отклонение
всех значений по Х
n1 ,n0 – количество значений
Х с 1 или 0 по Y.
n – общее количество пар значений
Чаще всего данный вид коэффициента корреляции
применяется для расчета связи пунктов
теста с суммарной шкалой. Это один из
видов проверки валидности.
Случаи, когда одна из переменных представлена
в дихотомической
шкале, а другая в ранговой (порядковой), требуют применениякоэффициента рангово-бисериальной
корреляции:
rpb=2 / n * (m1 - m0)
где:
n – число объектов измерения
m1 и m0 - средний ранг объектов
с 1 или 0 по второй переменной.
Данный коэффициент также применяется
при проверке валидности тестов.
Если обе переменные представляют собой
дихотомическую шкалу то следует использовать коэффициент четырехклеточной
сопряженности Пирсона.
Классификация объектов по дихотомической
шкале приведет к построению четырехклеточной
таблицы.