Статистическая обработка результатов измерений. Корреляционный анализ

Автор работы: Пользователь скрыл имя, 30 Сентября 2013 в 21:04, курсовая работа

Краткое описание

Познать любое общественное явление можно лишь в результате проведенного исследования. Всякое исследование базируется на фактическом материале и сопровождается не только сбором и накоплением фактов, характеризующих явления или процессы, но и их обработкой и анализом. В результате анализа вскрывается сущность явлений и процессов, выявляются частные и общие закономерности.
Наука, изучающая приемы, методы сбора, обработки и анализа массовых данных об общественных явлениях называется статистикой. Статистика - это экономическая наука. Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками.

Содержание

Введение
Основные понятия корреляционного анализа
Основные модели корреляционного анализа
Двумерная модель
Проверка значимости
Практическая часть
Заключение
Список литературы

Вложенные файлы: 1 файл

Kursovaya_TViMS.doc

— 525.00 Кб (Скачать файл)

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

 

Воронежский государственный технический  университет

 

 

Кафедра экономики производственного  менеджмента и организации машиностроительного  производства

КУРСОВОЙ ПРОЕКТ

по дисциплине «Теория вероятностей и математическая статистика»

Тема «Статистическая обработка результатов измерений. Корреляционный анализ.»

 

Выполнила: Тимошук К.В.            

Руководитель: Глушко Е.Г.                                    

                                        Воронеж 2012

 

 

Содержание

 Введение

Основные понятия корреляционного  анализа

Основные модели корреляционного  анализа

Двумерная модель

Проверка значимости

Практическая часть

Заключение

Список литературы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

Познать любое общественное явление можно лишь в результате проведенного исследования. Всякое исследование базируется на фактическом материале и сопровождается не только сбором и накоплением фактов, характеризующих явления или процессы, но и их обработкой и анализом. В результате анализа вскрывается сущность явлений и процессов, выявляются частные и общие закономерности. 
Наука, изучающая приемы, методы сбора, обработки и анализа массовых данных об общественных явлениях называется статистикой. Статистика - это экономическая наука. Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию.

Корреляционный анализ состоит в определении степени  связи между двумя случайными величинами X и Y. Корреляционная связь проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятностных значений независимой переменной.  

 

 

 

 

 

 

 

              1. Основные понятия корреляционного анализа.

Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.

   Показатели тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора.  
Более совершенным показателем степени тесноты корреляционной связи является линейный коэффициент корреляции. При расчете этого показателя учитываются не только отклонения индивидуальных значений признака от средней, но и сама величина этих отклонений. Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y  распределены по нормальному закону.

Коэффициент корреляции — параметр, который характеризует степень  линейной взаимосвязи между двумя  выборками, рассчитывается по формуле:

  Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между двумя выборками нет.

   Парный коэффициент корреляции – основной показатель взаимозависимости двух случайных величин, служит мерой линейной статистической зависимости между двумя величинами., он соответствует своему прямому назначению, когда статистическая связь между соответствующими признаками в генеральной совокупности линейна. То же самое относится к частным и множественным коэффициентам корреляции. 

    Частный коэффициент корреляции характеризует степень линейной зависимости между двумя величинами, обладает всеми свойствами парного, т.е. изменяется в пределах от -1 до +1. Если частный коэффициент корреляции равен ±1, то связь между двумя величинами функциональная, а равенство его нулю свидетельствует о линейной независимости этих величин.

  Множественный коэффициент корреляции, характеризует степень линейной зависимости между величиной х 1и остальными переменными (х 2, х з), входящими в модель, изменяется в пределах от 0 до 1.

  Ординальная (порядковая) переменная помогает упорядочивать статистически исследованные объекты по степени проявления в них анализируемого свойства

 Ранговая корреляция – статистическая связь между порядковыми переменными (измерение статистической связи между двумя или несколькими ранжировками одного и того же конечного множества объектов О 1,О 2,…, О п.

  Ранжировка – это расположение объектов в порядке убывания степени проявления в них k-го изучаемого свойства. В этом случае x(k) называют рангом i-го объекта по k-му признаку. Раж характеризует порядковое место, которое занимает объект О i, в ряду п объектов.

К. Спирмен в 1904г предложил  показатель, который служил для измерения  степени тесноты связи между  ранжировками

В последствии данный коэффициент  был назван ранговым коэффициентом К. Спирмен:

        ОСНОВНЫЕ МОДЕЛИ КОРРЕЛЯЦИОННОГО АНАЛИЗА. 

Такими моделями являются: коэффициент  парной корреляции, коэффициент частной корреляции, коэффициент множественной корреляции, коэффициент детерминации.

Линейный коэффициент парной корреляции (р) определяется по формуле:

где х, у — значения факторного и результативного показателей соответственно;

х, у — средние значения соответствующих показателей;

σX, σ-  средние квадратические отклонения (стандартные отклонения показателей х и у);

n — количество наблюдений в совокупности.

Значение коэффициента парной корреляции изменяется в пределах от -1 до +1. Знак «+» означает наличие прямой связи между показателями. Знак «-» — наличие обратной связи. Значение коэффициента от 0 до 1 характеризует степень приближения корреляционной зависимости между показателями и к функциональной. При р = 1 между показателями существует функциональная связь. При р = 0 линейная связь отсутствует. В целях упрощения расчетов на практике применяются и другие формулы коэффициента парной корреляции, представляющие собой некоторые преобразования исходной формулы.

Часто в анализе хозяйственной  деятельности при изучении связи  между показателями х и у требуется  исключить воздействие третьего показателя z, выступающего как общий фактор изменения анализируемых показателей. Для этого используется коэффициент частной корреляции (rx,y,z), свойства которого совпадают со свойствами коэффициента парной корреляции:

где rxy, rxz, ryz — коэффициенты парной корреляции между соответствующими показателями.

                      Двумерная корреляционная модель

Анализируется корреляционная зависимость между двумя признаками , .

Предполагается, что распределение  вероятностей двумерной случайной  величины подчинено закону Гаусса, т.е. плотность совместного распределения , определяется формулой:

содержащей пять параметров:

- математическое ожидание ;

- математическое ожидание ;

- дисперсия ;

- дисперсия ;

- коэффициент корреляции между.

Из условия нормальности совместного  распределения признаков , непосредственно  вытекает, что распределение каждого  их них также подчинено закону Гаусса с соответствующими параметрами:

;

.

Если , то из выражений, задающих двумерную  и одномерные плотности распределения  вероятностей , , следует, что , т.е. , есть независимые между собой случайные  величины.

Для случайных величин , , совместное распределение которых является нормальным, понятия "некоррелированность" и "стохастическая независимость" эквивалентны.

Таким образом, для решаемой задачи коэффициент корреляции может служить  мерой силы стохастической взаимосвязи  рассматриваемых случайных величин.

Точечные оценки параметров двумерного распределения

Для получения приближенных значений параметров корреляционной модели используют, как правило, метод моментов, расчеты  производят согласно следующим формулам.

Характеристики распределения  случайного вектора

  • теоретические
  • оценки по выборочным данным
  • сгруппированным
  • не сгруппированным

Приведенные эмпирические характеристики двумерного нормального закона распределения  случайного вектора  обладают свойством состоятельности, являются, кроме того, несмещенными и эффективными оценками.

Проверка значимости коэффициентов  корреляции

Для проверки значимости коэффициентов  корреляции чаще всего используют распределение  Стьюдента и условие:

 

 , f = N – 2, α = 0,05.

Если условие выполняется, то гипотеза об отсутствии корреляционной связи принимается.

 

 

 

 

 

 

 

 

                       

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

          Статистическая обработка результатов измерений

Вариант 13

ИДЗ-19.1

В результате эксперимента получены данные, записанные в виде статистического ряда. Требуется:

а) записать значения результатов  эксперимента в виде вариационного  ряда;

б) найти размах варьирования и  разбить его на 9 интервало;

в) построить полигон частот, гистограмму  относительных частот и график эмпирической функции распределения;

г) найти числовые характеристики выборки х, Dв ;

д) приняв в качестве нулевой гипотезу Н0: генеральная совокупность, из которой извлечена выборка, имеете нормальное распределение, проверить её, пользуясь критерием Пирсона при уровне значимости α=0,025;

е) найти доверительные интервалы  для математического ожидания и  среднего квадратичного отклонения при надежности ϒ=0,95.

1.13.

0,053

0,026

0,037

0,056

0,041

0,035

0,031

0,046

0,021

0,054

0,035

0,039

0,043

0,031

0,038

0,023

0,045

0,026

0,037

0,042

0,030

0,041

0,021

0,047

0,026

0,046

0,033

0,038

0,053

0,035

0,049

0,054

0,039

0,034

0,051

0,029

0,046

0,023

0,038

0,043

0,026

0,039

0,033

0,020

0,042

0,050

0,025

0,037

0,041

0,029

0,029

0,038

0,027

0,043

0,035

0,030

0,049

0,055

0,039

0,034

0,022

0,045

0,034

0,055

0,037

0,025

0,033

0,051

0,027

0,045

0,041

0,051

0,027

0,046

0,029

0,038

0,042

0,020

0,039

0,031

0,025

0,047

0,030

0,050

0,023

0,039

0,035

0,049

0,030

0,047

0,034

0,022

0,042

0,031

0,049

0,033

0,056

0,037

0,050

0,025


 

 

 

а) Располагаем значения результатов  эксперимента в порядке возрастания, т.е. записываем вариационный ряд:

Таблица 1.

0,02

0,02

0,021

0,021

0,022

0,022

0,023

0,023

0,023

0,025

0,025

0,025

0,025

0,026

0,026

0,026

0,026

0,27

0,27

0,27

0,029

0,029

0,029

0,029

0,03

0,03

0,03

0,03

0,31

0,31

0,031

0,031

0,033

0,033

0,033

0,033

0,034

0,034

0,034

0,034

0,035

0,035

0,035

0,035

0,035

0,037

0,037

0,037

0,037

0,037

0,038

0,038

0,038

0,038

0,038

0,039

0,039

0,039

0,039

0,039

0,039

0,041

0,041

0,041

0,041

0,042

0,042

0,042

0,042

0,043

0,043

0,043

0,045

0,045

0,045

0,046

0,046

0,046

0,046

0,047

0,047

0,047

0,049

0,049

0,049

0,049

0,05

0,05

0,05

0,051

0,051

0,051

0,053

0,053

0,054

0,054

0,055

0,055

0,056

0,056

Информация о работе Статистическая обработка результатов измерений. Корреляционный анализ