Автор работы: Пользователь скрыл имя, 19 Мая 2013 в 21:44, лабораторная работа
Корреляционный анализ представляет собой набор методов математической статистики для анализа зависимостей между случайными величинами, представленными эмпирическими данными, и позволяет решать следующие задачи:
-выяснение наличия либо отсутствия зависимости
-исследование силы и направления зависимости
- исследование достоверности связи
- исследование вида зависимости.
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«Воронежский государственный технический университет»
Инженерно-экономический факультет
Кафедра инженерной экономики
Отчет
по лабораторной работе № 2
по дисциплине «Математическое моделирование экономических процессов»
«Статистический пакет Statgraphics. Исследование зависимостей методами корреляционного анализа »
2013
Теоретическое введение
Корреляционный анализ представляет собой набор методов математической статистики для анализа зависимостей между случайными величинами, представленными эмпирическими данными, и позволяет решать следующие задачи:
-выяснение наличия либо отсутствия зависимости
-исследование силы и направления зависимости
- исследование достоверности связи
- исследование вида зависимости.
Для корректного выбора и применения определенного метода необходимо учитывать:
-тип статистических данных
-соответствие статистических данных теоретическому закону распределения
-предполагаемую линейность или нелинейность связи.
В математической статистике ставится задача исследования зависимостей между величинами. Эти величины могут иметь 2 варианта содержания.
1 вариант: моделирование функциональности некоторого объекта как преображение входа в выход.
Переменная X является вводимой и описывает условия функционирования моделируемого объекта. Все переменные Х являются измеримыми, т.е. может быть представлены в виде статистической выборки. Также определяются условия функционирования объекта.
Переменная Y является результатом функционирования объект
Зависимость может быть статистической, когда в силу действия случайных факторов связь между ними не является функциональной, но приближается к ней. Т.е. какая-либо математическая функция является идеальной в представлении зависимости, к которой приближаются эмпирические данные. Такое явление называется аппроксимация.
2 вариант: изучает связь между статистическими переменными в какой-либо среде, экономике государства. Также можно выделить факторы, воздействующие на результат. Таким образом, задача исследования функциональной и статистической зависимости не меняет в этом варианте своего смысла и соответственно используется этаже терминология и методы решения задач.
Для корректного выбора определения метода нужно учитывать тип статистических данных, их соответствие теоретическому закону распределения, а также проводить предварительный анализ связей при помощи диаграмм рассеяния.
Диаграммы рассеяния представляют собой графическое представление двух выборок X и Y, для которых предполагают наличие зависимостей. Каждая пара значений из выборок обозначаются точкой на плоскости XY.
Анализ диаграммы рассеяния помогают предположить наличие, либо отсутствие связи, направление связи, линейность или нелинейность, а также виды связи.
Коэффициент корреляции (парный коэффициент корреляции) обычно обозначают rxy или r.
Значение коэффициента корреляции находится в диапазоне от -1 до 1; r = [-1..1]. При │ r │=1, между переменными существует линейная функциональная зависимость, при r = -1, эта зависимость обратная, при r = 1 – прямая.
При r = 0, переменные не коррелированны, т.е. не связаны линейной зависимостью.
Для коэффициента корреляции также может быть вычислен уровень значимости, значение которого сравнивают со стандартным значением. Если вычисленное значение уровня значимости меньше стандартного значения, то наличие линейной статистической связи является достоверным.
Практические навыки
Ввести исходные данные для анализа. Указать тип данных для переменных - числовой.
Затем провести проверку гипотез о нормальном законе распределения для каждой переменной.
Частотная гистограмма для переменной Х
P-Value = 0,701092 – нормальное распределение
Частотная гистограмма для переменной Y3
P-Value = 0,33486 – нормальное распределение
Частотная гистограмма для Y5
P-Value = 0,194837 нормальное распределение
P-Value = 0,110565 – нормальное распределение
Частотная гистограмма для Y12
P-Value = 0,724261 – нормальное распределение
Построить диаграмму рассеяния.
X Y3
------------------------------
X
Y3
0,9591
( 100)
0,0000
Уровень значимости меньше 0,05 – линейная связь
X Y5
------------------------------
X
Y5
0,5693
( 100)
0,0000
Уровень значимости меньше 0,05 – линейная связь
X Y8
------------------------------
X
Y8 -0,6517
( 100)
0,0000
______________________________
Обратная зависимость.
X Y12
------------------------------
X
Y12
-0,0183
( 100)
0,8569
______________________________
Вывод
STATGRAPHICS- статистическая
графическая система,
STATGRAPHICS включает различные процедуры для ввода и модификации данных, изменения настройки системы, сохранения текстовых и графических файлов, а также доступ к командам DOS. STATGRAPHICS нацелен на использование в различных областях: в промышленности, образовании, маркетинге, туризме и др.