Автор работы: Пользователь скрыл имя, 12 Июня 2012 в 12:23, задача
Анализируя точки поля корреляции, предполагаем, что связь между признаками x и y может быть линейной, т.е. y=a+b*x или не линейной вида y=a+b*lnx, y=a*bx . Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у от х вида y=a+b*x, т. к. затраты на производство (у) можно условно разделить на 2 вида: постоянные, не зависящие от объема производства (a), такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции (b*x) такие как расход материала, электроэнергии и т.д.
+0,7≤ r уx2 ‹ 1
Факторы x1 и x3 явно коллинеарны r уx1 › r уx3 (0,877›0,801), т.е. фактор x3 теснее связан с результатом, чем фактор x1. r x1x3 ‹ r x3x2 (0,662‹0,775), т.е. корреляция фактора x2 с фактором x3 сильнее, чем корреляция факторов x1 и x2.
Из модели следует исключить фактор x2 , т.к. он имеет наибольшую тесноту связи с x3 и менее тесно связан с результатом у.
2.1. Уравнение регрессии в естественной форме будет иметь вид
ỹ = a + b1x1 + b3x3, параметр x2 исключен из модели. Стандартизованное уравнение ty = β1tx1 + β3tx3.
Оценим параметры уравнения. Стандартизованные коэффициенты регрессии определяются из системы нормальных уравнений:
r уx1 = β1*1 + β3 * r x1x3 ;
r уx2 = β1* r x1x3 + β3*1;
Найдем β1 и β3, используя метод Крамера:
1 x1x3
Δ = = 1 - r2 x1x3 = 1 – 0,6622 = 0,562
x1x3 1
r уx1 r x1x3
Δ β1 = = r уx1 - r уx3* r x1x3 = 0,877-0,801*0,662=0,347
r уx3 1
1 r уx1
Δ β3 = = r уx3 - r уx1* r x1x3 = 0,801-0,877*0,662=0,220
r x1x3 r уx3
β1 = Δ β1/ Δ=0,347/0,562=0,617
β3 = Δ β3/ Δ=0,220/0,562=0,391
Получим уравнение множественной регрессии в стандартном виде:
ty = 0,617* tx1 + 0,391* tx3
2.2. Стандартизованные коэффициенты регрессии βJ сравнимы между собой, в отличие от коэффициентов чистой регрессии bj, которые нельзя сравнивать, т.к. они имеют разные единицы измерения. Сравним β1 и β3: β1 › β3, т.е. фактор х1 – возраст сильнее влияет на результат у – заработную плату, чем фактор х3 – выработка.
2.3. Коэффициент множественной корреляции определим по формуле:
Ryx1x3 = √ β1 r уx1 + β3 r уx3 = √0,617*0,877+0,391*0,801= √ 0,854 = 0,924
Значение Ryx1x3 близко к 1, поэтому зависимость у от х1 и х3 характеризуется как тесная.
2.4. Оценим качество модели.
Коэффициент множественной детерминации:
R2yx1x3 = 0,9242=0,854.
Т.е. в данной модели 85,4% вариации заработной платы объясняется вариацией учтенных в модели факторов: возраст х1 и выработки х3 . На долю прочих факторов, не включенных в модель, приходится 14,6% от общей вариации.
2.5. Оценим значимость уравнения в целом с помощью F – критерия Фишера.
Проверим гипотезу Н0 о статистической незначимости уравнения регрессии:
Fфакт = (R2yx1x3/1- R2yx1x3)*(n-m-1)/m = (0,854/0,146)*(15-2-1)/2=35,
Fтабл = (α=0.05, k1 = k2=15-2-1=12)=4,75.
Сравнивая Fтабл и Fфакт приходим к выводу о необходимости отклонить гипотезу Н0, т.к. Fфакт› Fтабл. С вероятностью 0,95 делаем вывод о статистической значимости уравнения в целом.
2.6. Оценим статистическую значимость присутствия фактора х1 в уравнении регрессии и целесообразности его включения в модель после фактора х3.
Fх1факт = (R2yx1x3 – r2 уx3 )/(1- R2yx1x3)*(n-m-1)/1=(0,854-0,
Fтабл = (α=0.05, k1 = k2=15-2-1=12)=4,75.
Fфакт› F1табл
Сравнивая F1табл и Fфакт , приходим к выводу, что необходимо отклонить гипотезу Н о несущественности прироста R2yx1x3 за счет включения в модель фактора х1 после фактора х3 . Принимаем альтернативную гипотезу: прирост R2yx1x3 за счет включения фактора х1 существенный, целесообразность включения в модель фактора х1 после фактора х3 подтверждена статистически, коэффициент регрессии b1 статистически значим.
Оценим статистическую значимость присутствия фактора х3 в уравнении множественной регрессии и целесообразности его включения в модель после фактора х1 .
Fх3факт = (R2yx1x3 – r2 уx1 )/(1- R2yx1x3)*(n-m-1)/1=(0,854-0,
Fтабл = (α=0.05, k1 = k2=15-2-1=12)=4,75.
Fфакт› F3табл , т.е. прирост R2yx1x3 за счет включения в модель фактора х3 после фактора х1 существенный, целесообразность включения в модель фактора х3 после фактора х1 проверена и подтверждена статистически. Коэффициент регрессии b3 статистически значим.
3. Для построения уравнения регрессии в естественной форме рассчитаем b1 и b3, используя формулы перехода:
b1 = β1*( σy/ σx1 )=0,617*(0,556/8,081)=0,042
b3 = β3*( σy/ σx3 )=0,391*(0,556/5,480)=0,040
a = y- b1* х1- b3* х3=3,787-0,042*34,6-0,040*17,
Получим уравнение множественной регрессии в естественной форме:
ỹ=1,622+0,042*х1+0,081*х3 .
Интерпретация параметров уравнения:
Параметр b1 = 0,042 показывает, что заработная плата рабочего увеличится в среднем на 42 рубля при увеличении возраста рабочего на 1 год при условии, что выработка рабочего не меняется и фиксирована на среднем уровне.
Параметр b3 = 0,040 показывает, что заработная плата рабочего увеличится в среднем на 40 рублей при увеличении выработки рабочего за смену на 1 шт., при условии, что возраст рабочего не изменится и фиксирован на среднем уровне.
Параметр a = 1,622 не имеет экономической интерпретации.
4. Найдем среднюю ошибку аппроксимации.
Предварительно найдем ỹ, затем найдем у- ỹ. Рассчитаем
Аi = │ (уi- ỹi )/yi │*100%,
А =1/n*∑ Аi=1/15*75,1=5,01%.
А=5,01%‹10% ошибка аппроксимации находится в допустимых пределах. Качество модели хорошее
5. Используем полученную модель для прогноза.
Если х1=35, х2=10, х3=20,
Ур=1,622+0,042*35+0,040*20=3,
Т.е. для рабочего данного цеха, возраст которого 35 лет, а выработка 20 шт. в смену, прогнозное значение заработной платы – 3892 руб.
21