Коэффициент корреляции Спирмена

Автор работы: Пользователь скрыл имя, 13 Декабря 2012 в 21:42, реферат

Краткое описание

Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Вложенные файлы: 1 файл

Коэффициент корреляции Спирмена.doc

— 286.00 Кб (Скачать файл)

АЛМАТИНСКИЙ ФИЛИАЛ

НЕГОСУДАРСТВЕННОГО  ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«САНКТ-ПЕТЕРБУРГСКИЙ  ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ ПРОФСОЮЗОВ»

 

 

 

 

 

Факультет: культуры 

Кафедра: психологии

 

 

 

Реферат

По  дисциплине: «По теории вероятностей и математической статистике».

На  тему: «Коэффициент корреляции Спирмена»

 

 

 

 

 

 

 

 

 

 

Выполнила студентка:

102 группы 1 курса

Психологического  отделения

Попова Анна

 

 

 

 

 

 

 

 

 

Алматы. 2012

Коэффициент корреляции Спирмена


Коэффициент корреляции Спирмена (Spearman rank correlation coefficient) — мера линейной связи между случайными величинами. Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги. Коэффициент инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Корреляция


Корреля́ция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин..Математической мерой корреляции двух случайных величин служит корреляционное отношение  , либо коэффициент корреляции   (или  ). В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической[3].

Впервые в научный  оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

Некоторые виды коэффициентов корреляции могут  быть положительными или отрицательными. В первом случае предполагается, что  мы можем определить только наличие  или отсутствие связи, а во втором — также и ее направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной. Возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.

Корреляция и взаимосвязь величин


Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке, но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанес пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «бо́льшее количество пожарных приводит к бо́льшему ущербу», и тем более не имеет смысла попытка минимизировать ущерб от пожаров путем ликвидации пожарных бригад.В то же время, отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи.

Показатели корреляции


Параметрические показатели корреляции

Ковариация

Основные  статьи: Ковариация, Неравенство Коши — Буняковского

Важной характеристикой  совместного распределения двух случайных величин является ковариация (или корреляционный момент). Ковариация является совместным центральныммоментом второго порядка. Ковариация определяется как математическое ожидание произведения отклонений случайных величин.

 

Определение


Заданы две  выборки  .

Вычисление корреляции Спирмена:

Коэффициент корреляции Спирмена вычисляется по формуле:

, где   - ранг наблюдения   в ряду  ,   - ранг наблюдения   в ряду  .

Коэффициент   принимает значения из отрезка  . Равенство   указывает на строгую прямую линейную зависимость,   на обратную.

Случай  совпадающих наблюдений:

При наличии связок коэффициент корреляции Спирмена следует вычислять следующим образом:

где  .

Здесь   и   — количество связок в выборках   и  ,  ,   — их размеры. Для элементов связок вычисляется средний ранг.

Обоснование критерия Спирмена:

Статистикой критерия Спирмена служит коэффициент корреляции Пирсона   ранговых наборов   и  . Он определяется следующей формулой:

 В этой формуле  .

Воспользовавшись  тем, что  , получим:

.

Переставив  пары   в порядке возрастания первой компоненты, получим набор  . Тогда перепишем коэффициент корреляции Спирмена в виде:

.

Таким образом,   - линейная функция от рангов  . Правую часть равенства можно представить в следующем виде:[1]

 который наиболее удобен для  вычислений.

Статистическая проверка наличия корреляции


Нулевая гипотеза  : Выборки   и   не коррелируют ( ).

Статистика критерия: 

Критерий (при уровне значимости  ):

Против альтернативы  :

если   больше табличного значения критерия Спирмена   с уровнем значимости  , то нулевая гипотеза отвергается.

Асимптотический критерий:

 

Критическая область критерия Спирмена.

Рассмотрим  центрированную и нормированную  статистику Спирмена:

, где  .

 

Нулевая гипотеза отвергается (против альтернативы   —  ), если:

, где   есть  - квантиль стандартного нормального распределения.

Аппроксимация удовлетворительно работает, начиная  с  .

Поправка: В 1978 году Р. Иман и У. Коновер предложили следующую поправку, значительно повышающую точность аппроксимации. Она использует линейную комбинацию нормальной и стьюдентовской квантилей. Положим:

.

Гипотеза   отвергается в пользу альтернативы  , если  , где   обозначают соответственно квантили уровня   стандартного нормального распределения и распределения Стьюдента с   степенями свободы.

Примеры


Ниже приведены  примеры вычисления корреляций Кенделла и Спирмена. Значения коэффициентов  указаны над каждым изображением в виде  , где   - корреляция Кенделла,   - Спирмена. Заметно, что в большинстве случаев  . Объяснение этого эффекта приводится ниже.

Направление линейной зависимости

Корреляции Кенделла и Спирмена. Нормальные сгущения.

 

Коэффициенты  корреляции реагируют на изменение  направления и зашумлённость  линейной зависимости между переменными.

Наклон линейного тренда

Корреляции Кенделла где   - ранг наблюдения   в ряду  ,   - ранг наблюдения   в ряду  .

 и Спирмена. Вращающаяся полоса.

 

Коэффициенты  корреляции реагируют на изменение  направления, но не реагируют на изменение наклона тренда. На первом, четвёртом и седьмом рисунках дисперсия одной из переменных близка к нулю, поэтому не удаётся зафиксировать факт линейной зависимости.

Нелинейная зависимость

Корреляции Кенделла и Спирмена. Нелинейная зависимость.

 

Корреляции  Кенделла и Спирмена не отражают меры нелинейной зависимости между переменными.

Линейная и нелинейная зависимости

На каждой из приведённых ниже иллюстраций осуществляется переход от линейной зависимости к нелинейной. Коэффициенты корреляции Кенделла и Спирмена реагируют на это одинаковым образом.

Корреляции Кенделла и Спирмена. Перекрещенные полосы.

 

Корреляции Кенделла и Спирмена. Расширяющаяся полоса.

 

Корреляции Кенделла и Спирмена. Синусоида с переменной амплитудой.

 

По мере смены  линейной зависимости нелинейной значения коэффициентов корреляции падают.

Связь коэффициентов корреляции Спирмена и Пирсона


В случае выборок  из нормального распределения коэффициент корреляции Спирмена   может быть использован для оценки коэффициента корреляции Пирсона   по формуле:

.[1]

Связь коэффициентов корреляции Спирмена и Кенделла


Выборкам   и   соответствуют последовательности рангов:

, где   — ранг  -го объекта в вариационном ряду выборки  ;

, где   — ранг  -го объекта в вариационном ряду выборки  .

Проведем операцию упорядочивания рангов.

Расположим  ряд значений   в порядке возрастания величины:  . Тогда последовательность рангов упорядоченной выборки   будет представлять собой последовательность натуральных чисел  . Значения  , соответствующие значениям  , образуют в этом случае некоторую последовательность рангов  :

.

Коэффициент корреляции Кенделла   и коэффициент корреляции Спирмена   выражаются через ранги   следующим образом:

Заметно, что в случае   инверсиям придаются дополнительные веса  , таким образом   сильнее реагирует на несогласие ранжировок, чем  . Этот эффект проявляется в приведённых выше примерах: в большинстве из них  .

Утверждение.[1] Если выборки   и   не коррелируют (выполняется гипотеза  ), то величины   и   сильно закоррелированы. Коэффициент корреляции между ними можно вычислить по формуле:

.

История


 

Критерий был  предложен британским психологом Чарльзом Эдвардом Спирменом в 1904 году.

Спирмен, Чарльз Эдвард


Чарльз  Э́двард Спи́рмен (англ. Charles Edward Spearman; 10 сентября 1863 — 17 сентября 1945) — английский психолог, профессорЛондонского и Честерфилдского университетов. Разработчик многочисленных методик математической статистики. Создательдвухфакторной теории интеллекта и техники факторного анализа. Кроме прочего, Спирмен открыл, что результаты даже несравнимых когнитивных тестов отражают единый фактор, который он назвал g-фактором (g factor). Широко известен коэффициент ранговой корреляции Спирмена.

Научные публикации


  • «„General intelligence“, objectively determined and measured.» (журнал «American Journal of Psychology», 1904)
  • «Proof and measurement of association between two things.» (журнал «American Journal of Psychology», 1904)
  • «Demonstration of Formulae for True Measurement of Correlation.» (журнал «American Journal of Psychology», 1907)
  • «The abilities of man, their nature and measurement.» (1927)
  • «Human abilities coauthor.» (совместно с Л. У. Джонсом, 1951)

 

 


Информация о работе Коэффициент корреляции Спирмена