Автор работы: Пользователь скрыл имя, 17 Марта 2014 в 12:40, шпаргалка
Основные понятия математической статистики (переменная, признак, уровень, показатель, эмпирические данные, измерительные шкалы).
Признаки и переменные - это измеряемые психологические явления. Такими явлениями могут быть время решения задачи, количество допущенных ошибок, уровень тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных реакций, угол поворота корпуса в беседе, показатель социометрического статуса и множество других переменных.
Понятия признака и переменной могут использоваться как взаимозаменяемые
Признаки и переменные - это измеряемые психологические явления. Такими явлениями могут быть время решения задачи, количество допущенных ошибок, уровень тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных реакций, угол поворота корпуса в беседе, показатель социометрического статуса и множество других переменных.
Понятия признака и переменной могут использоваться как взаимозаменяемые. Они являются наиболее общими. Иногда вместо них используются понятия показателя или уровня, например, уровень настойчивости, показатель вербального интеллекта и др. Понятия показателя и уровня указывают на то, что признак может быть измерен количественно, так как к ним применимы определения "высокий" или "низкий", например, высокий уровень интеллекта, низкие показатели тревожности и др.
Эмпирические данные — то есть данные полученные опытным путем, путем наблюдения или эксперимента т.п. (не теоретически).
Значения признака определяются при помощи специальных шкал измерения.
С. Стивенсом предложена классификация из 4 типов шкал измерения:
1) номинативная, или номинальная, или шкала наименований;
2) порядковая, или ординальная, шкала;
3) интервальная, или шкала равных интервалов;
4) шкала равных отношений.
Номинативная шкала – это шкала, классифицирующая по названию. Название же не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого. Номинативная шкала – это способ классификации объектов или субъектов, распределения их по ячейкам классификации.
Операции с числами для номинативной шкалы.
Порядковая шкала – это шкала, классифицирующая по принципу «больше – меньше».
Это полностью упорядоченная шкала наименований, она устанавливает отношения равенства между явлениями в каждом классе и отношения последовательности в понятиях больше, меньше между всеми без исключения классами. Упорядоченные номинальные шкалы общеупотребимы при опросах общественного мнения.
Операции с числами.
Интервалы в этой шкале не равны, поэтому числа обозначают лишь порядок следования признаков. И операции с числами – это операции с рангами, но не с количественным выражением свойств в каждом пункте.
Интервальная шкала – это шкала, классифицирующая по принципу «больше на определенное количество единиц – меньше на определенное количество единиц». Каждое из возможных значений признака отстоит от другого на равном расстоянии.
Шкала интервалов представляет собой полностью упорядоченный ряд с измеренными интервалами между пунктами, причем отсчет начинается с произвольно выбранной величины (нет абсолютного нуля).
Операции с числами в интервальной метрической шкале богаче. Чем в номинальных шкалах.
Шкала равных отношений – это шкала, классифицирующая объекты или субъектов пропорционально степени выраженности измеряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета (шкалы порогов абсолютной чувствительности).
Для анализа и интерпретации количественных данных необходимо их обобщить. Первый этап представления – это упорядочивание данных по величине от максимальной до минимальной. Такое представление называют несгруппированным рядом. В небольшом классе этого часто вполне достаточно.
Второй этап – ранжирование. Например , 15, 14, 14, 14, 14, 13, 13, 13, 13, 13, 13, 13, 13, 12, 12, 9 – это несгруппированный ряд данных.
Можно проранжировать эти данные, присваивая 1 ранг наибольшему значению. Таким образом, число 15 будет иметь 1 ранг; затем следует число 14, которое повторяется 4 раза, этому числу принадлежит 4 ранга – 2, 3, 4 и 5. Общий ранг вычисляем следующим образом: (2+3+4+5)/4=3,5, т.е. складываем все ранги и делим на число повторений. Таким же образом посчитаем ранг числа 13, он будет равен: (6+7+8+9+10+11+12+13)/8=9,5, ранг числа 12 равен 14,5 и числа 9 равен 15.
Этот список можно сократить, классифицируя оценки по распределению частот, иногда называемому просто распределением.
Для большого числа оценок может иметь смысл обобщение данных. Как правило, существует настолько широкий диапазон оценок, что целесообразнее сгруппировать их по величинам, например, в группы, объединяющие все оценки от 9 до 12 включительно, от 13 до 14 и т.д. Каждая такая группа называется разрядом оценок. В случае полного размещения по группам обычно говорят о распределении сгруппированных частот. Хотя и не существует четкого правила выбора количества разрядов, предпочтительнее образовывать не менее 12 и не более 15 разрядов. Иметь менее 12 разрядов рискованно из-за возможного искажения результатов, в то время как наличие более 15 разрядов затрудняет работу с таблицей.
Распределением признака называется закономерность встречаемости разных его значений. В психологических исследованиях чаще всего ссылаются на нормальное распределение.
Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине – достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественно-научных исследованиях и казалось "нормой" всякого массового случайного проявления признаков. График нормального распределения представляет собой колоколообразную кривую.
Нормальное распределение выражается следующей формулой:
где fотн. – относительные частоты появления каждого конкретного значения случайной величины хi. Предполагается, что переменная хi, может принимать бесконечно большие и бесконечно малые значения, количество измерений бесконечно, а интервал квантования мал.
По этой формуле при различных значениях среднего арифметического (М) и стандартного отклонения (s) получается семейство нормальных кривых.
Нормальное распределение имеет колоколообразную форму, асимптотически приближается к оси X (то есть может принимать сколь угодно малые значения по ординате при стремлении икс-значений к плюс или минус бесконечности), значения моды, медианы и среднего арифметического равны между собой.
Свойством нормальных распределений является наличие определенного количества случайной величины (случаев, испытуемых), приходящегося на интервалы между значениями s, обычно это количество измеряют в процентах от общего числа случаев, испытуемых. Нормальное распределение характеризует такие случайные величины, на которые воздействует большое количество разнообразных факторов, причем сила воздействия одного отдельно взятого фактора значительно меньше суммы воздействий остальных факторов. В результате получается, что чаще наблюдаются некоторые средние значения измеряемого параметра, реже крайние, и чем сильнее отличается какое-то значение от среднего, тем реже оно встречается. Многие биологические параметры распределены подобным образом (рост, вес и т.п.). Большинство психологических свойств, качеств (интеллект, свойства личности и т.п.) также имеет нормальное распределение.
Параметры распределения – это его числовые характеристики, указывающие, где "в среднем" располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание ( ), дисперсия (D), стандартное отклонение (s), показатели асимметрии и эксцесса.
Стандартное отклонение позволяет сказать, что большая часть исследуемой выборки располагается в пределах s от средней. При нормальном распределении большая часть результатов, располагающаяся в пределах одного стандартного отклонения по обе стороны от средней, в процентном отношении всегда одна и та же и не зависит от величины стандартного отклонения: она соответствует 68% популяции (т.е. 34% ее элементов располагается слева и 34%-справа от средней). В пределах трех стандартных отклонений умещается почти вся популяция-99,73%.
В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрицательной – более высокие. Для симметричных распределений А=0;
Асимметрия распределений а) положительная, левосторонняя, б) отрицательная, правосторонняя
В тех случаях, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное.
Эксцесс а) положительный, б) отрицательный
Меры центральной тенденции – это величины, вокруг которых группируются остальные данные. Данные величины являются как бы обобщающими всю выборку показателями, что, во-первых, позволяет судить по ним обо всей выборке, а во-вторых, дает возможность сравнивать разные выборки, разные серии между собой. К мерам центральной тенденции в обработке результатов психологических исследований относятся: выборочное среднее, медиана, мода.
Выборочное среднее (М) – это результат деления суммы всех значений (X) на их количество (N).
Медиана (Me) – это значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных. Медиана не обязательно должна совпадать с конкретным значением. Совпадение происходит в случае нечетного числа значений (ответов), несовпадение – при четном их числе. В последнем случае медиана вычисляется как среднее арифметическое двух центральных значений в упорядоченном ряду.
Мода (Мо) – это значение, наиболее часто встречающееся в выборке, т. е. значение с наибольшей частотой. Если все значения в группе встречаются одинаково часто, то считается, что моды нет. Если два соседних значения имеют одинаковую частоту и больше частоты любого другого значения, мода есть среднее этих двух значений. Если то же самое относится к двум несмежным значениям, то существует две моды, а группа оценок является бимодальной.
Обычно выборочное среднее применяется при стремлении к наибольшей точности в определении центральной тенденции. Медиана вычисляется в том случае, когда в серии есть «нетипичные» данные, резко влияющие на среднее. Мода используется в ситуациях, когда не нужна высокая точность, но важна быстрота определения меры центральной тенденции.
Вычисление всех трех показателей производится также для оценки распределения данных. При нормальном распределении значения выборочного среднего, медианы и моды одинаковы или очень близки.
При симметричном распределении точка Q2 совпадет с медианой (а следовательно, и со средним), и тогда можно вычислить коэффициент Q для характеристики разброса данных относительно середины распределения. При несимметричном распределении этого недостаточно. Тогда дополнительно вычисляют коэффициенты для левого и правого участков:
Информация о работе Шпаргалка по "Математической статистике"