Автор работы: Пользователь скрыл имя, 08 Июля 2013 в 17:21, доклад
Заключительный этап эмпирического социологического исследования предполагает обработку, анализ и интерпретацию данных, получение эмпирически обоснованных обобщений, выводов и рекомендаций.
Обработка данных включает в себя следующие компоненты:
Редактирование и кодирование информации. Основное назначение этого шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.
Заключительный этап эмпирического
социологического исследования предполагает
обработку, анализ и интерпретацию
данных, получение эмпирически
Обработка данных включает в себя следующие компоненты:
Редактирование и кодирование информации. Основное назначение этого шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.
Создание переменных. Собранная на основании анкет информация в ряде случаев прямо отвечает на те вопросы, которые необходимо решить в исследовании. Вопросы получили форму индикаторов в процессе операционализации. Сейчас же необходимо провести обратную процедуру, то есть перевести данные в форму, которая бы отвечала на вопросы исследования.
Статистический анализ. Этот шаг
является ключевым в процессе анализа
социологических данных. В ходе статистического
анализа выявляются некоторые статистические
закономерности и зависимости, которые
позволяют социологу сделать
определенные обобщения и выводы.
Для проведения статистического
анализа социологи используют большое
число различных математических
методов, позволяющих полно и
всесторонне анализировать
Статистический анализ полученной социологической информации можно обработать следующими видами математической обработки данных:
- Статистическая группировка -
это классификация или
- Ряды распределения. Результат группировки единиц наблюдения по какому-либо признаку называется статистическим рядом. По вариационному ряду количественного признака можно подсчитать, как часто каждое значение этого признака встречается в совокупности.
Статистические ряды распределения представляют собой упорядоченное распределение единиц совокупности по группам и группировкам. Ряды распределения изучают структуру совокупности, позволяют изучить ее однородность, размах и границы. Ряды распределения, образованные по качественным признакам, называютатрибутивными. При группировке по количественному признаку выделяются вариационные ряды. Вариационные ряды – ряды распределения единиц совокупности по признакам, имеющим количественное выражение, т. е. образованы численными значениями.
Вариационные ряды по строению делятся на:
Вариационные ряды имеют два элемента:
Варианта – отдельное значение варьируемого признака, которое он принимает в ряду распределения.
Частота – численность отдельных вариант или каждой группы вариационного ряда. В некоторых случаях применяется частость. Частоты, выраженные в % или долях процента, называются частостями и рссчитываются как отношение локальной частоты варианты к сумме накопленных частот.
В свою очередь, частота бывает:
Если вариационный ряд имеет
неравные интервалы, то частоты в
отдельных интервалах не сопоставимы,
т. к. зависят от ширины интервала. В
этих случаях рассчитывают плотность
распределения, которая дает правильное
представление о характере
Для характеристики рядов распределения
применяются следующие
-средняя степенная(это обобщающий показатель, в котором находят отражение действия общих условий и закономерностей изучаемого явления. )
-мода(Мода- варианта, которая наиболее часто встречается в ряду распределения (в данной совокупности).
-медиана
Представление:
- Статистические таблицы – обобщают исходные данные. В дальнейшем составляют более сложные таблицы, позволяющие сопоставлять ряды распределений, и, наконец, комбинационные таблицы, в которых три или более признака перекрещиваются, комбинируются. По таким таблицам устанавливаются, измеряются и анализируются связи между признаками исследуемой совокупности объектов.
Построение таблицы подчинено определенным правилам. Основное содержание таблицы должно быть отражено в названии. Таблицы бывают простые, групповые и комбинационные. Простые таблицы представляют собой перечень, список, отдельных единиц совокупности о количественной (или качественной) характеристикой каждой из них в отдельности. В групповых таблицах содержится группировка единиц совокупности по одному признаку, а в комбинационных — по двум и более признакам.
- Гистограмма — это графическое изображение интервального ряда. По оси абсцисс откладывают границы интервалов, на которых строят прямоугольники с высотой, пропорциональной плотностям распределения соответствующих интервалов (пропорциональной числу единиц совокупности, приходящейся на единицу длины интервала). При равных интервалах плотности распределения пропорциональны частотам, которые и откладываются по оси ординат.
- Кумулятивные кривые. Кумулята округляет индивидуальные значения признака в пределах интервала и представляет собой возрастающую ломаную линию.
- Полигоны. Для построения полигона величина признака откладывается на оси абсцисс, а частоты или относительные частоты — на оси ординат. Из точек, соответствующих значениям признака, восстанавливаются перпендикуляры, равные по высоте частотам. Вершины перпендикуляров соединяются прямыми линиями.
Средние являются обобщенной характеристикой большого количества индивидуальных значений варьирующего признака. В экономическом анализе их можно считать наиболее употребительными обобщающими показателями. Понимается в статистике под средней величиной обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени. Сущность средней заключается в том, что в ней взаимопогашаются случайные различия и отражается лишь результат влияния основных факторов и выявляется то общее, типичное, что характерно для всех единиц изучаемой совокупности, т.е. характерный уровень признака.
Вариация – различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
К показателям вариации относятся:
I группа — абсолютные показатели вариации
размах вариации
среднее линейное отклонение
дисперсия
среднее квадратическое отклонение
II группа — относительные показатели вариации
коэффициент вариации
коэффициент осцилляции
относительное линейное отклонение
Самым элементарным показателем вариации признака является размах вариации R. Размах вариации показывает лишь крайние (min, max) отклонения признака от общей средней.
Среднее линейное отклонение — средняя арифметическая абсолютных значений отклонений (модуль отклонений) отдельных вариантов от их средней арифметической:
для несгруппированных данных (простое)
для сгруппированных данных (взвешенное)
Дисперсия признака — средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий:
Простая дисперсия для несгруппированных данных
Взвешенная дисперсия для вариационного ряда
Cвойства дисперсии:
если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А- дисперсия не изменится;
если все значения признака уменьшить или увеличить в одно и то же число раз (k раз), то дисперсия уменьшится или увеличится в k2 раз.
Среднее квадратическое отклонение равно корню квадратному из дисперсии:
для несгруппированных данных (простое)
для вариационного ряда по сгруппированным данным (взвешенное)
Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются отдельные варианты от их среднего значения.
1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг общей средней.
2. Относительное линейное
отклонение характеризует долю
усредненного значения
3. Коэффициент вариации -
отношение среднего
44. Регрессионный и корреляционный анализ в социологическом исследовании. Коэффициенты корреляции признаков и специфика их применения в социологии.
Корреляционный анализ
Корреляционный анализ – это совокупность методов обнаружения так называемой корреляционной зависимости между случайными величинами.
Для двух случайных величин Х и Y корреляционный анализ состоит из следующих этапов:
- построение
корреляционного поля и
- вычисление
выборочного коэффициента
- проверка
статической гипотезы о
Рассмотрим подробнее каждый из указанных этапов.
Корреляционное поле и корреляционная таблица являются исходными данными при корреляционном анализе. Пусть , , – результаты парных наблюдений над случайными величинами Х и Y. Изображая полученные результаты в виде точек в декартовой системе координат, получим корреляционное поле. По характеру расположения точек поля можно составить предварительное представление о форме зависимости случайных величин (например, о том, что одна из них в среднем возрастает или убывает с возрастанием другой).
Регрессионный анализ
Зависимость между случайными величинами X и Y называется стохастической, если с изменением одной их них (например, Х) меняется закон распределения другой (Y). В качестве примеров такой зависимости приведем зависимость веса человека (Y) от его роста (Х), предела прочности стали (Y) от ее твердости (Х) и т.д.
В реальных экспериментах, связанных со статической обработкой опытных данных, условный закон распределения случайной величины Y при условии обычно заранее неизвестен. В таком случае, речь может идти лишь о каком либо приближении к теоретической кривой регрессии, построенном на основе выборочных данных. Другими словами, задача заключается в подборе подходящей функциональной зависимости, наилучшим образом (в некотором статистическом смысле) приближающей стохастическую зависимость.
Во многих случаях можно считать, что «независимая» переменная Х находится под контролем экспериментатора, и может бать измерена с любой заданной точностью, в то время как измеряемые значения Y как функции от Х (выборочные значения при фиксированных ) определяются с ошибкой (содержат шум измерения).
Информация о работе Программы статистической обработки данных в социологическом исследовании