Автор работы: Пользователь скрыл имя, 25 Мая 2012 в 21:13, курсовая работа
Основной целью курсовой работы является статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод», выявление на основе корреляционно-регрессионного анализа экономических показателей, влияющих на изменение объема продаж, и прогнозирование объема продаж на основе трендового анализа.
Соседними считают соседние во времени (при рассмотрении временных рядов) или по возрастанию переменной х значения ei. Для этих величин рассчитывают коэффициент корреляции reiei-1 , который называется коэффициентом корреляции первого порядка:
,
где M(ei ) = M(ei-1 ) = 0
Наиболее известным методом определения автокорреляции первого порядка является критерий Дарбина – Уотсона (DW).
Автокорреляция, или последовательная корреляция, определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве.
Суть метода Дарбина – Уотсона состоит в том, что на основании критерия DW Дарбина – Уотсона делается вывод об автокорреляции. На практике вместо коэффициента корреляции reiei-1 используют критерий:
Предполагая, что (при больших N соотношение справедливо), критерий DW можно привести к более простому виду. Действительно, тогда
Поскольку коэффициент корреляции находится в пределах , нетрудно заметить, что:
Таким образом, 0 £ DW £ 4. Для более точного определения автокорреляции была построена таблица критических точек распределения Дарбина – Уотсона. По ней для заданного уровня значимости a, числа наблюдений N и количества параметров m уравнения регрессии определяются два значения:
d1 – нижняя граница,
d2
– верхняя граница.
Общая схема Дарбина – Уотсона следующая:
Рис.2.
1) 0 £ DW < d1 – существует положительная автокорреляция (H0 отвергается);
2) d1 £ DW < d2 – вывод о наличии автокорреляции не определен;
3) d2 £ DW < 4-d2 – автокорреляция отсутствует (H0 принимается);
4) 4-d2 £ DW < 4-d1 - вывод о наличии автокорреляции не определен;
5) 4-d1 £ DW <4 – существует отрицательная автокорреляция (H0 отвергается).
Например,
пусть N = 20, DW, рассчитанное по формуле
пункта 2, равно 2,3 (DW=2,3). Так как d2 £
DW < 4-d2
Изучение
связи между тремя и более
связанными между собой признаками
носит название множественной (многофакторной)
регрессии. При исследовании зависимостей
методами множественной регрессии
задача формулируется так же, как
и при использовании парной регрессии,
т.е. требуется определить аналитическое
выражение связи между
Ŷ = f(x1, x2, …, xk)
Построение модели множественной регрессии включает несколько этапов:
Выбор
формы связи затрудняется тем, что,
используя математический аппарат,
теоретическая зависимость
Практика построения многофакторных моделей взаимосвязей показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.
Важным
этапом построения уже выбранного уравнения
множественной регрессии
Наиболее
приемлемым способом отбора факторных
признаков является шаговая регрессия
(шаговый регрессионный анализ)
Если
же при включении в модель факторного
признака коэффициенты регрессии меняют
не только величину, но и знаки, а
множественный коэффициент
Качество
уравнения регрессии зависит
от степени достоверности и
Аналитическая
форма выражения связи
Уравнение линейной множественной регрессии имеет вид:
Ŷ = a0 + a1 x1 + a2 x2 +… + ak xk
где
Ŷ – теоретические значения результативного
признака, полученные в результате
подстановки соответствующих
x1, x2, …, xk - факторные признаки;
a0, a1, …, ak – параметры модели (коэффициенты регрессии)
Параметры могут быть определены графическим методом, методом наименьших квадратов и т. д.
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.
Значимость
коэффициентов регрессии
Сkk – элемент обратной матрицы ((ΧTΧ)-1)
где S2ост – остаточная дисперсия, характеризующая степень рассеяния фактических значений Y относительно расчетных значений Ŷ.
Параметр модели признается статистически значимым, если
tak> tкр (α; n=n-k-1)
где α – уровень значимости критерия проверки гипотезы о равенстве нулю параметров, измеряющих связь, т.е. статистическая существенность связи утверждается при отклонении нулевой гипотезы об отсутствии связи;
n=n-k-1 – число степеней свободы, которое характеризует число свободно варьирующих элементов совокупности.
1. Основная идея метода Брандона. Сложная множественная корреляционная зависимость:
Ŷ = f(x1, x2, …, xk)
представляется в виде некоторых парных корреляционных зависимостей:
Ŷ = yср*Ŷ0*Ŷ1*Ŷ2*…* Ŷn-1
Ŷ0 – зависимая переменная в уравнении парной регрессии, построенной для случайных величин y0i и xi1.
Ŷ0i = f(xi1), i= 1,N
Ŷk – зависимость переменных в уравнении парной регрессии построенных для случайных величин yki и xik+1.
Ŷk = f(xk+1)
2. Алгоритм метода Брондона
- Вычисляется среднее значение Y:
- Каждое i-ое наблюдение преобразуется к виду:
- Для пары переменных y0i и xi1 также как для парной регрессии выбирается вид зависимостей с максимальным уровнем спецификации по критерию Дарбина-Уотсона и по величине корреляционного отношения η, для линейной зависимости берется коэффициент корреляции r:
Ŷ0 = f(x1)
- Вычисляются значения Ŷ0i
y0i
Y1i =
Ŷk
- Для пары переменных y1i и xi2 выбирается вид зависимостей с максимальным уровнем спецификации:
Ŷ1 = f2(x2)
Процесс определения Ŷk , k= 0, n-1 продолжается до исчерпания всех n факторов.
Ŷn = fn(xn)
Таким образом, общую формулу множественной нелинейной регрессии можно записать в следующем виде:
n-1 n-1
Ŷ = yсрП Ŷk = yсрП fk+1(xk+1)
k=0 k=0
После построения уравнения множественной регрессии (линейной и нелинейной) проводят спецификацию множественной регрессии.
Спецификация проводится для того, чтобы из двух зависимостей наилучшим образом выбрать ту зависимость, которая отражает адекватно зависимость между величинами xi и y существующими реально. Спецификация множественной регрессии включает:
Для проверки значимости коэффициентов используют t-критерий Стьюдента. В зависимости от выбранной формы уравнения регрессии для коэффициентов уравнения находят значение tрасч и сравнивают его с табличным значением критерия Стьюдента tкр.