Автор работы: Пользователь скрыл имя, 25 Мая 2012 в 21:13, курсовая работа
Основной целью курсовой работы является статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод», выявление на основе корреляционно-регрессионного анализа экономических показателей, влияющих на изменение объема продаж, и прогнозирование объема продаж на основе трендового анализа.
Если , то между случайными величинами Y и х существует только корреляционная связь: .
Коэффициент корреляции находится по формуле:
(1), где
, , ,
Для вычисления r по значениям выборочных данных xi и yi, , формулу (1) преобразуем к виду (2):
Выбор формулы связи (вида уравнения) называется спецификацией уравнения регрессии.
Перечислим основные виды уравнений парной регрессии:
Определение параметров уравнения регрессии называется параметризацией.
Для
определения неизвестных
Алгоритм применения МНК
Согласно МНК для нахождения параметров полинома p-ой степени необходимо решить систему так называемых нормальных уравнений:
Решение
этой системы относительно
и дает искомые значения параметров.
Линейная зависимость
Для
определения неизвестных
.
Пусть d, da ,db – определители, соответствующие системе уравнений (3), а именно:
.
Тогда неизвестные коэффициенты уравнения регрессии будут равны:
.
Другое решение системы (3). Из первого уравнения следует: , а из второго – имеем:
Таким образом , .
Подставив значения а и b в формулу , получим:
.
Гиперболическая зависимость
При гиперболической
зависимости
параметры a и b находят, как
и в случае линейной зависимости, но для
уравнения регрессии
, где
.
Степенная зависимость
Для определения параметров a и b степенной зависимости необходимо преобразовать зависимость в линейную, для этого прологарифмировать обе части:
Пусть , a* = lna, x* = lnx, тогда .
Применив к
Определители d, da*, db относятся к системе уравнений
, где
Значение а находим в результате
потенцирования a =
ea*, значение b из соотношения
b = db / d.
Логарифмическая зависимость
Для определения параметров a и b при заданной зависимости уравнение регрессии представим в виде ,где x*=lnx..
Параболическая зависимость
Алгоритм применения МНК для параболической зависимости второго порядка заключается в следующем:
1. Строится целевая функция:
2. Находится система нормальных уравнений
Система преобразуется к виду:
Решение системы нормальных уравнений относительно неизвестных параметров a, b, c можно найти, как и при линейной зависимости, с помощью определителей:
, где
Тригонометрическая зависимость
Уравнение регрессии этого вида является приближением функции Y(х), которое тем точнее, чем больше значение m (m - число гармоник, количество составляющих исследуемого процесса). Поэтому при различных значениях m получаются различные виды тригонометрической зависимости.
Значения неизвестных
Для этого строится целевая функция:
Далее находят .
Получается система нормальных уравнений. Эта система обладает свойством ортогональности.
В результате решения системы получим:
Если
увеличивается число
При нелинейной зависимости определение тесноты связи между двумя случайными величинами х и Y производится с помощью корреляционного отношения
, где .
Корреляционное отношение h всегда положительно 0£ h £ 1.
Чем теснее связь между Y и х, тем меньше величина , , тем больше h.
Точность аппроксимации определяется как средняя относительная ошибка аппроксимации .
Величина d определяется в процентах. Чаще применяется при оценке нелинейной зависимости.
Поскольку коэффициент корреляции r определяется по данным случайной выборки, то он может отличаться от коэффициента корреляции r, который соответствует генеральной совокупности.
В случае, когда объем выборки N ³ 20, то предполагают, что коэффициент корреляции является случайной величиной, распределенной по нормальному закону.
Пусть sr – среднеквадратичное отклонение выборочного коэффициента корреляции r. Тогда при N ³ 20 доверительный интервал для r будет равен (r - xpsr, r + xpsr), где хр – параметр нормального распределения вероятностей:
.
Значение хр определяется по таблице функции распределения Ф(х) в зависимости от вероятности Р. Для оперативного определения значения хр при Р ³ 0,9, можно использовать таблицу 1.
Таблица 1.
(х) | 0,9 | 0,95 | 0,99 |
хр | 1,653 | 1,96 | 2,576 |
Значение среднеквадратичного отклонения sr можно определить по формуле .
Подставим в доверительный интервал вместо неизвестной величины r его оценку по выборке r и sr . Тогда
. Для проверки значимости выборочного коэффициента корреляции r чаще используется так называемая нулевая гипотеза: H0: r = 0, H1: r ¹ 0.
Суть нулевой гипотезы состоит в том, что в случае, когда для случайных величин х и Y на основании выборок и получено½r½>0, т.е. между ними имеется корреляционная связь, предполагается, что в генеральной совокупности этой связи нет (H0: r = 0).
При r = 0, получим:
.
При проверке нулевой гипотезы достаточно использовать только левый (нижний) предел доверительного интервала . Так как r = 0, то .
Данное условие означает, что нулевая гипотеза с вероятностью Ф(хр) подтверждается.
Если , то нулевая гипотеза с вероятностью Ф(хр) отвергается, а, следовательно, связь между х и Y имеет место.
В
тех случаях, когда размер выборки
N<20, для проверки нулевой гипотезы (r
= 0) используется t – критерий Стьюдента.
Алгоритм использования t – критерия Стьюдента (N<20)
Определяется расчетное значение tрасч. по формуле: .
По
таблице критических точек
Если ½tрасч½ £ tтеор., то нулевая гипотеза Н0 принимается (r = 0), если ½tрасч½ > tтеор., то Н0 – отвергается (r ¹ 0), следовательно, случайные величины х и Y коррелированы, то есть между ними существует линейная связь.
Статистическая
значимость коэффициентов регрессии
не гарантирует высокое качество
уравнения регрессии. При анализе
уравнения регрессии на начальном
этапе часто проверяют
При этом проверяют их некоррелированность, причем не любых, а только соседних величин ei , .