Автор работы: Пользователь скрыл имя, 13 Декабря 2012 в 21:42, реферат
Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
АЛМАТИНСКИЙ ФИЛИАЛ
НЕГОСУДАРСТВЕННОГО ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ ПРОФСОЮЗОВ»
Факультет: культуры
Кафедра: психологии
Реферат
По дисциплине: «По теории вероятностей и математической статистике».
На тему: «Коэффициент корреляции Спирмена»
Выполнила студентка:
102 группы 1 курса
Психологического отделения
Попова Анна
Алматы. 2012
Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.
Корреля́ция (корреляционная зависимость) — статистическая
Впервые в научный
оборот термин «корреляция» ввёл французский палеонтолог Ж
Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. В первом случае предполагается, что мы можем определить только наличие или отсутствие связи, а во втором — также и ее направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной. Возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.
Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке, но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанес пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «бо́льшее количество пожарных приводит к бо́льшему ущербу», и тем более не имеет смысла попытка минимизировать ущерб от пожаров путем ликвидации пожарных бригад.В то же время, отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи.
Основные
статьи: Ковариация, Неравенств
Важной характеристикой
совместного распределения двух
случайных величин является ков
Заданы две выборки .
Вычисление корреляции Спирмена:
Коэффициент корреляции Спирмена вычисляется по формуле:
, где - ранг наблюдения в ряду , - ранг наблюдения в ряду .
Коэффициент принимает значения из отрезка . Равенство указывает на строгую прямую линейную зависимость, на обратную.
Случай совпадающих наблюдений:
При наличии связок коэффициент корреляции Спирмена следует вычислять следующим образом:
где .
Здесь и — количество связок в выборках и , , — их размеры. Для элементов связок вычисляется средний ранг.
Обоснование критерия Спирмена:
Статистикой критерия Спирмена служит коэффициент корреляции Пирсона ранговых наборов и . Он определяется следующей формулой:
В этой формуле .
Воспользовавшись тем, что , получим:
.
Переставив пары в порядке возрастания первой компоненты, получим набор . Тогда перепишем коэффициент корреляции Спирмена в виде:
.
Таким образом, - линейная функция от рангов . Правую часть равенства можно представить в следующем виде:[1]
который наиболее удобен для вычислений.
Нулевая гипотеза : Выборки и не коррелируют ( ).
Статистика критерия:
Критерий (при уровне значимости ):
Против альтернативы :
если больше табличного значения критерия Спирмена с уровнем значимости , то нулевая гипотеза отвергается.
Асимптотический критерий:
Критическая область критерия Спирмена.
Рассмотрим центрированную и нормированную статистику Спирмена:
, где .
Нулевая гипотеза отвергается (против альтернативы — ), если:
, где есть - квантиль стандартного нормального распределения.
Аппроксимация удовлетворительно работает, начиная с .
Поправка: В 1978 году Р. Иман и У. Коновер предложили следующую поправку, значительно повышающую точность аппроксимации. Она использует линейную комбинацию нормальной и стьюдентовской квантилей. Положим:
.
Гипотеза отвергается в пользу альтернативы , если , где обозначают соответственно квантили уровня стандартного нормального распределения и распределения Стьюдента с степенями свободы.
Ниже приведены примеры вычисления корреляций Кенделла и Спирмена. Значения коэффициентов указаны над каждым изображением в виде , где - корреляция Кенделла, - Спирмена. Заметно, что в большинстве случаев . Объяснение этого эффекта приводится ниже.
Корреляции Кенделла и Спирмена. Нормальные сгущения.
Коэффициенты корреляции реагируют на изменение направления и зашумлённость линейной зависимости между переменными.
Корреляции Кенделла где - ранг наблюдения в ряду , - ранг наблюдения в ряду .
и Спирмена. Вращающаяся полоса.
Коэффициенты корреляции реагируют на изменение направления, но не реагируют на изменение наклона тренда. На первом, четвёртом и седьмом рисунках дисперсия одной из переменных близка к нулю, поэтому не удаётся зафиксировать факт линейной зависимости.
Корреляции Кенделла и Спирмена. Нелинейная зависимость.
Корреляции Кенделла и Спирмена не отражают меры нелинейной зависимости между переменными.
На каждой из приведённых ниже иллюстраций осуществляется переход от линейной зависимости к нелинейной. Коэффициенты корреляции Кенделла и Спирмена реагируют на это одинаковым образом.
Корреляции Кенделла и Спирмена. Перекрещенные полосы.
Корреляции Кенделла и Спирмена. Расширяющаяся полоса.
Корреляции Кенделла и Спирмена. Синусоида с переменной амплитудой.
По мере смены линейной зависимости нелинейной значения коэффициентов корреляции падают.
В случае выборок из нормального распределения коэффициент корреляции Спирмена может быть использован для оценки коэффициента корреляции Пирсона по формуле:
.[1]
Выборкам и соответствуют последовательности рангов:
, где — ранг -го объекта в вариационном ряду выборки ;
, где — ранг -го объекта в вариационном ряду выборки .
Проведем операцию упорядочивания рангов.
Расположим ряд значений в порядке возрастания величины: . Тогда последовательность рангов упорядоченной выборки будет представлять собой последовательность натуральных чисел . Значения , соответствующие значениям , образуют в этом случае некоторую последовательность рангов :
.
Коэффициент корреляции Кенделла и коэффициент корреляции Спирмена выражаются через ранги следующим образом:
Заметно, что в случае инверсиям придаются дополнительные веса , таким образом сильнее реагирует на несогласие ранжировок, чем . Этот эффект проявляется в приведённых выше примерах: в большинстве из них .
Утверждение.[1] Если выборки и не коррелируют (выполняется гипотеза ), то величины и сильно закоррелированы. Коэффициент корреляции между ними можно вычислить по формуле:
.
Критерий был предложен британским психологом Чарльзом Эдвардом Спирменом в 1904 году.
Чарльз
Э́двард Спи́рмен (англ. Charle