Программы статистической обработки данных в социологическом исследовании

Автор работы: Пользователь скрыл имя, 08 Июля 2013 в 17:21, доклад

Краткое описание

Заключительный этап эмпирического социологического исследования предполагает обработку, анализ и интерпретацию данных, получение эмпирически обоснованных обобщений, выводов и рекомендаций.
Обработка данных включает в себя следующие компоненты:
Редактирование и кодирование информации. Основное назначение этого шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.

Вложенные файлы: 1 файл

41-45.docx

— 29.26 Кб (Скачать файл)
  1. Программы статистической обработки данных в социологическом исследовании.

Заключительный этап эмпирического  социологического исследования предполагает обработку, анализ и интерпретацию  данных, получение эмпирически обоснованных обобщений, выводов и рекомендаций.

Обработка данных включает в себя следующие компоненты:

Редактирование и кодирование  информации. Основное назначение этого  шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.

Создание переменных. Собранная  на основании анкет информация в  ряде случаев прямо отвечает на те вопросы, которые необходимо решить в исследовании. Вопросы получили форму индикаторов в процессе операционализации. Сейчас же необходимо провести обратную процедуру, то есть перевести данные в форму, которая бы отвечала на вопросы исследования.

Статистический анализ. Этот шаг  является ключевым в процессе анализа  социологических данных. В ходе статистического  анализа выявляются некоторые статистические закономерности и зависимости, которые  позволяют социологу сделать  определенные обобщения и выводы. Для проведения статистического  анализа социологи используют большое  число различных математических методов, позволяющих полно и  всесторонне анализировать собранную  информацию. В современной социологии для этой цели активно применяются  ЭВМ, дополненные программами математико-статистической обработки. При обработке и анализе данных, полученных методом опроса, широко применяются методы ранжирования, шкалирования, корреляции и др. Так, ранжирование - это процедура установления относительной значимости (предпочтительности) исследуемых объектов на основе их упорядочивания. Ранг - это показатель, характеризующий порядковое место оцениваемого объекта в группе и других объектов, обладающих существенными для оценки свойствами. Для каждого объекта вычисляют сумму рангов, полученную от всех экспертов, затем упорядочивают эту сумму. Ранг 1 присваивают объекту, получившему наименьшую сумму, самый низкий ранг - объекту с наивысшей суммой. Ранжирование дополняется, как правило, другими методами экспертных оценок. Шкалирование и основные виды шкал были рассмотрены ранее в настоящей главе. Полученные с ЭВМ социоматрицы, а затем сведенные в таблицы или отображенные при помощи графиков и рисунков результаты социологического исследования являют собой числовые величины, пригодные для выводов о характере и признаках изучаемого явления. Однако без исследователя эти выводы не могут быть сделаны. Поэтому первое условие, позволяющее должным образом использовать социологические данные, - их всестороннее и правильное объяснение, именуемое социологами интерпретацией.

 

Статистический анализ полученной социологической информации можно  обработать следующими видами математической обработки данных:

- Статистическая группировка - это классификация или упорядочение  данных по признаку подобия  или различия. Организация фактов  в систему осуществляется в  соответствии с описательной  гипотезой о ведущем признаке  группировки или классификации.  Основное назначение группировки  состоит, во-первых, в установлении  численности каждой отдельно  взятой части совокупности, расчленённой  в соответствии со значениями  определенного признака (или нескольких  признаков), и, во-вторых, в изучении  влияния причин и зависимости  явлений.

 

 

 

  1. Ряды распределения значений признака. Формы представления частотных распределений.

- Ряды распределения. Результат группировки единиц наблюдения по какому-либо признаку называется статистическим рядом. По вариационному ряду количественного признака можно подсчитать, как часто каждое значение этого признака встречается в совокупности.

 

Статистические ряды распределения представляют собой упорядоченное распределение единиц совокупности  по группам и группировкам.  Ряды распределения изучают структуру совокупности, позволяют изучить ее однородность, размах и границы. Ряды распределения, образованные по качественным признакам, называютатрибутивными. При группировке по количественному признаку выделяются вариационные ряды. Вариационные ряды – ряды распределения единиц совокупности по признакам, имеющим количественное выражение, т. е. образованы численными значениями.

Вариационные ряды по строению делятся  на:

  1. Дискретные (прерывные) – основаны на прерывных вариациях признака. Это такие ряды, где значения вариант имеют значения целых чисел (т. е. не могут принимать дробные значения). Дискретные признаки отличаются друг от друга на некоторую конкретную величину.
  2. Интервальные (непрерывные) – имеют любые, в том числе и дробные количественные выражения и представлены в виде интервалов. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину.

Вариационные ряды имеют два  элемента:

  1. варианта (x)
  2. частота (f)

Варианта – отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота – численность отдельных вариант или каждой группы вариационного ряда. В некоторых случаях применяется частость. Частоты, выраженные в % или долях процента, называются частостями и рссчитываются как отношение локальной частоты варианты к сумме накопленных частот.

В свою очередь, частота бывает:

  • локальной
  • накопленной (кумулятивная — нарастающим итогом) 

Если вариационный ряд имеет  неравные интервалы, то частоты в  отдельных интервалах не сопоставимы, т. к. зависят от ширины интервала. В  этих случаях рассчитывают плотность  распределения, которая дает правильное представление о характере распределения  вариант (единиц совокупности). Плотность  распределения, в свою очередь, бывает:

  • абсолютная плотность распределения – отношение частоты к величине (ширине) интервала

 

  

  • относительная плотность распределения — отношение частости к ширине интервала

 

  

 

 

Для характеристики рядов распределения  применяются следующие показатели:

 

-средняя степенная(это обобщающий показатель,  в котором  находят отражение действия общих условий и закономерностей изучаемого явления.  )

-мода(Мода- варианта, которая наиболее часто встречается  в ряду распределения (в данной совокупности).

-медиана

 

Представление:

- Статистические таблицы – обобщают исходные данные. В дальнейшем составляют более сложные таблицы, позволяющие сопоставлять ряды распределений, и, наконец, комбинационные таблицы, в которых три или более признака перекрещиваются, комбинируются. По таким таблицам устанавливаются, измеряются и анализируются связи между признаками исследуемой совокупности объектов.

Построение таблицы подчинено  определенным правилам. Основное содержание таблицы должно быть отражено в названии. Таблицы бывают простые, групповые  и комбинационные. Простые таблицы  представляют собой перечень, список, отдельных единиц совокупности о  количественной (или качественной) характеристикой каждой из них в  отдельности. В групповых таблицах содержится группировка единиц совокупности по одному признаку, а в комбинационных — по двум и более признакам.

- Гистограмма — это графическое изображение интервального ряда. По оси абсцисс откладывают границы интервалов, на которых строят прямоугольники с высотой, пропорциональной плотностям распределения соответствующих интервалов (пропорциональной числу единиц совокупности, приходящейся на единицу длины интервала). При равных интервалах плотности распределения пропорциональны частотам, которые и откладываются по оси ординат.

- Кумулятивные кривые. Кумулята округляет индивидуальные значения признака в пределах интервала и представляет собой возрастающую ломаную линию.

- Полигоны. Для построения полигона величина признака откладывается на оси абсцисс, а частоты или относительные частоты — на оси ординат. Из точек, соответствующих значениям признака, восстанавливаются перпендикуляры, равные по высоте частотам. Вершины перпендикуляров соединяются прямыми линиями.

 

 

  1. Средние величины и показатели рассеяния и колеблемости (вариации) значений признака.

Средние являются обобщенной характеристикой большого количества индивидуальных значений варьирующего признака. В экономическом анализе их можно считать наиболее употребительными обобщающими показателями. Понимается в статистике под средней величиной обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени. Сущность средней заключается в том, что в ней взаимопогашаются случайные различия и отражается лишь результат влияния основных факторов и выявляется то общее, типичное, что характерно для всех единиц изучаемой совокупности, т.е. характерный уровень признака.

Вариация – различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

К показателям вариации относятся:

 

 

I группа — абсолютные показатели вариации

размах вариации

среднее линейное отклонение

дисперсия

среднее квадратическое отклонение

II группа — относительные показатели вариации

коэффициент вариации

коэффициент  осцилляции

относительное линейное отклонение

Самым элементарным показателем  вариации признака является размах вариации R. Размах вариации показывает лишь крайние  (min, max) отклонения признака от общей средней.

Среднее линейное отклонение — средняя арифметическая абсолютных значений отклонений (модуль отклонений) отдельных вариантов от их средней арифметической:

для несгруппированных данных (простое)

для сгруппированных данных (взвешенное)

Дисперсия  признака — средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий:

Простая дисперсия для  несгруппированных данных

Взвешенная дисперсия  для вариационного ряда

 

Cвойства дисперсии:

 

если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А- дисперсия не изменится;

если все значения признака уменьшить или увеличить в  одно и то же число раз (k раз), то дисперсия  уменьшится или увеличится в k2  раз.

 

Среднее квадратическое отклонение равно корню квадратному из дисперсии:

для несгруппированных данных (простое)

для вариационного ряда по сгруппированным данным (взвешенное)

Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются отдельные варианты от их среднего значения.

 

1. Коэффициент  осцилляции  отражает  относительную  колеблемость крайних значений признака вокруг общей средней.

2. Относительное линейное  отклонение характеризует долю  усредненного значения абсолютных  отклонений (модуль отклонений) от средней величины.

3. Коэффициент вариации - отношение среднего квадратического отклонения к средней арифметической, применяется для сравнения вариаций различных признаков, используется как характеристика однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

 

44. Регрессионный и корреляционный анализ в социологическом исследовании. Коэффициенты корреляции признаков и специфика их применения в социологии.

Корреляционный анализ

Корреляционный анализ –  это совокупность методов обнаружения  так называемой корреляционной зависимости  между случайными величинами.

Для двух случайных величин  Х и Y корреляционный анализ состоит  из следующих этапов:

-        построение  корреляционного поля и составление  корреляционной таблицы;

-        вычисление  выборочного коэффициента корреляции;

-        проверка  статической гипотезы о значимости  корреляционной связи.

Рассмотрим подробнее  каждый из указанных этапов.

Корреляционное поле и  корреляционная таблица являются исходными  данными при корреляционном анализе. Пусть , , – результаты парных наблюдений над случайными величинами Х и Y. Изображая полученные результаты в виде точек в декартовой системе координат, получим корреляционное поле. По характеру расположения точек поля можно составить предварительное представление о форме зависимости случайных величин (например, о том, что одна из них в среднем возрастает или убывает с возрастанием другой).

Регрессионный анализ

Зависимость между случайными величинами X и Y называется стохастической, если с изменением одной их них (например, Х) меняется закон распределения другой (Y). В качестве примеров такой зависимости приведем зависимость веса человека (Y) от его роста (Х), предела прочности стали (Y) от ее твердости (Х) и т.д.

В реальных экспериментах, связанных  со статической обработкой опытных  данных, условный закон распределения  случайной величины Y при условии  обычно заранее неизвестен. В таком  случае, речь может идти лишь о каком  либо приближении к теоретической  кривой регрессии, построенном на основе выборочных данных. Другими словами, задача заключается в подборе  подходящей функциональной зависимости, наилучшим образом (в некотором  статистическом смысле) приближающей стохастическую зависимость.

Во многих случаях можно  считать, что «независимая» переменная Х находится под контролем  экспериментатора, и может бать измерена с любой заданной точностью, в  то время как измеряемые значения Y как функции от Х (выборочные значения  при фиксированных ) определяются с ошибкой (содержат шум измерения).

Информация о работе Программы статистической обработки данных в социологическом исследовании