Автор работы: Пользователь скрыл имя, 12 Июня 2012 в 12:23, задача
Анализируя точки поля корреляции, предполагаем, что связь между признаками x и y может быть линейной, т.е. y=a+b*x или не линейной вида y=a+b*lnx, y=a*bx . Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у от х вида y=a+b*x, т. к. затраты на производство (у) можно условно разделить на 2 вида: постоянные, не зависящие от объема производства (a), такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции (b*x) такие как расход материала, электроэнергии и т.д.
Задание №1.
Таблица №1.
№ | x | y | yx | X2 | Y2 | ỹ | y- ỹ | Ai |
1 | 15,2 | 28,3 | 430,16 | 231,04 | 800,89 | 28,328 | -0,028 | 0,01 |
2 | 14,9 | 28,2 | 420,18 | 222,01 | 795,24 | 27,821 | 0,379 | 0,01 |
3 | 7,8 | 16,8 | 131,04 | 60,84 | 282,24 | 15,822 | 0,978 | 0,06 |
4 | 10,5 | 19,5 | 204,75 | 110,25 | 380,25 | 20,385 | -0,885 | 0,05 |
5 | 11,6 | 20,7 | 240,12 | 134,56 | 428,49 | 22,244 | -1,544 | 0,07 |
6 | 9,4 | 19,8 | 186,12 | 88,36 | 392,04 | 18,526 | 1,274 | 0,06 |
7 | 13,4 | 26,3 | 352,42 | 179,56 | 691,69 | 25,286 | 1,014 | 0,04 |
8 | 14,9 | 27,5 | 409,75 | 222,01 | 756,25 | 27,821 | -0,321 | 0,01 |
9 | 9,7 | 18,3 | 177,51 | 94,09 | 334,89 | 19,033 | -0,733 | 0,04 |
10 | 8,4 | 17,3 | 145,32 | 70,56 | 299,29 | 16,836 | 0,464 | 0,01 |
11 | 7,6 | 15,2 | 115,52 | 57,76 | 231,04 | 15,484 | -0,284 | 0,02 |
12 | 5,9 | 13,1 | 77,29 | 34,81 | 171,61 | 12,611 | 0,489 | 0,04 |
13 | 10,8 | 19,5 | 210,6 | 116,64 | 380,25 | 20,892 | -1,392 | 0,07 |
14 | 12,6 | 23,4 | 294,84 | 158,76 | 547,56 | 23,934 | -0,534 | 0,02 |
15 | 16,3 | 31,3 | 510,19 | 265,69 | 979,69 | 30,187 | 1,113 | 0,04 |
сумма | 169 | 325,2 | 3905,81 | 2046,94 | 7471,42 | 325,21 |
| 0,55 |
среднее | 11,26667 | 21,68 | 260,3873 | 136,4627 | 498,0947 | 21,68067 |
| 0,036667 |
1. Строим поле корреляции:
Анализируя точки поля корреляции, предполагаем, что связь между признаками x и y может быть линейной, т.е. y=a+b*x или не линейной вида y=a+b*lnx, y=a*bx . Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у от х вида y=a+b*x, т. к. затраты на производство (у) можно условно разделить на 2 вида: постоянные, не зависящие от объема производства (a), такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции (b*x) такие как расход материала, электроэнергии и т.д.
2.1. Модель линейной парной регрессии.
2.1.1. Рассчитаем параметры а и b линейной регрессии y=a+b*x. Строим расчетную таблицу (табл. 1). По исходным данным рассчитываем y*x, x2, y2. Рассчитав сумму у, х, у*х, у2, х2 определим их среднее значение. Определяем параметры b и а:
ху-х*у 260,387-11,267*21,68
b= = =1,69
х2 –(х)2 136,46-(11,267)2
а= у – b*х = 21,68-1,69*11,267 = 2,64
Уравнение регрессии ỹх = 2,64+1,69*х
С увеличением выпуска продукции на 1 тыс.ед. затраты на производство увеличиваются на 1,69 млн. руб. в среднем, постоянные затраты равны 2,64 млн. руб.
2.1.2. Тесноту связи оценим с помощью линейного коэффициента парной корреляции r xy.
Предварительно определим σx и σy.
_
σy = √y2-(y)2 = √498,09 – (21,68)2 = √28,07 = 5,3
_
σx = √x2-(x)2 = √136,46 – (11,267)2 =√9,51 = 3,083
r xy = b *( σx/ σy) = 1,69*(3,083/5,300) = 0,980
Значение r xy близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида y = a+bx.
2.1.3 Оценим качество построенной модели. Определим коэффициент детерминации: R2 = r2xy = 0,9802 = 0,960
Т.е. данная модель объясняет 96% общей дисперсии у, на долю не объясненной дисперсии приходится 4%. Следовательно, качество модели высокое. Найдем величину средней ошибки аппроксимации А. Предварительно определим у, подставляя в уравнение регрессии:
Ух = а*bx фактические значения х. Найдем (у – х), тогда
Аi = │(yi - yi)/ yi│*100% ; I = 1…15
A = 1/n*∑Ai = 1/15*0,55 = 0,033 = 3,3%
Т.е. в среднем расчетные значения отклоняются от фактических на 3,3%. Допустимая ошибка А = 3,3%.
2.1.4. Определим средний коэффициент эластичности:
Э = b*(x/y) = 1,69*(11,267/21,68) = 0,879%.
Он показывает, что с увеличением выпуска продукции на 1% затраты на
производство увеличиваются в среднем на 0,879%.
2.1.5. Оценим статистическую значимость полученного уравнения.
Проверим гипотезу Н0, что выявленная зависимость у от х носит случайный характер, т.е. полученное уравнение статистически не значимо. Примем α = 0,05. Найдем табличное (критическое) значение F-критерия Фишера.
Fтабл. =( α = 0,05, k1 = 1, k2 = 15-2 = 13) = 4.67.
Найдем фактическое значение F-критерия Фишера:
Fфакт = r2xy *(n – 2) = 0,960 *(15 – 2) = 312
1- r2xy 1-0,960
Fфакт › Fтабл
Поэтому гипотеза Н0 о случайном характере зависимости у от х отвергается, принимается альтернативная гипотеза Н1 – с вероятностью 0,95 выявленная зависимость у от х носит не случайный характер, полученное уравнение статистически значимо, надежно и может быть использовано для прогноза.
2.2. Модель полулогарифмической парной регрессии.
2.2.1. Рассчитаем параметры a и b в регрессии ỹ = а+b *lnx .
Линеаризуем данное уравнение, обозначив z = lnx. Тогда ỹ = а+b* z. Строим расчетную таблицу.
Таблица №2.
№ | x | y | z | yz | z2 | y2 | ỹ | y - ỹ | Ai |
1 | 15,2 | 28,3 | 2,72 | 76,976 | 7,3984 | 800,89 | 27,6636 | 0,6364 | 2,25 |
2 | 14,9 | 28,2 | 2,7 | 76,14 | 7,29 | 795,24 | 27,311 | 0,889 | 3,15 |
3 | 7,8 | 16,8 | 2,05 | 34,44 | 4,2025 | 282,24 | 15,8515 | 0,9485 | 5,65 |
4 | 10,5 | 19,5 | 2,35 | 45,825 | 5,5225 | 380,25 | 21,1405 | -1,6405 | 8,41 |
5 | 11,6 | 20,7 | 2,45 | 50,715 | 6,0025 | 428,49 | 22,9035 | -2,2035 | 10,64 |
6 | 9,4 | 19,8 | 2,24 | 44,352 | 5,0176 | 392,04 | 19,2012 | 0,5988 | 3,02 |
7 | 13,4 | 26,3 | 2,6 | 68,38 | 6,76 | 691,69 | 25,548 | 0,752 | 2,86 |
8 | 14,9 | 27,5 | 2,7 | 74,25 | 7,29 | 756,25 | 27,311 | 0,189 | 0,69 |
9 | 9,7 | 18,3 | 2,27 | 41,541 | 5,1529 | 334,89 | 19,7301 | -1,4301 | 7,81 |
10 | 8,4 | 17,3 | 2,13 | 36,849 | 4,5369 | 299,29 | 17,2619 | 0,0381 | 0,22 |
11 | 7,6 | 15,2 | 2,03 | 30,856 | 4,1209 | 231,04 | 15,4989 | -0,2989 | 1,97 |
12 | 5,9 | 13,1 | 1,77 | 23,187 | 3,1329 | 171,61 | 10,9151 | 2,1849 | 16,68 |
13 | 10,8 | 19,5 | 2,38 | 46,41 | 5,6644 | 380,25 | 21,6694 | -2,1694 | 11,13 |
14 | 12,6 | 23,4 | 2,53 | 59,202 | 6,4009 | 547,56 | 24,3139 | -0,9139 | 3,91 |
15 | 16,3 | 31,3 | 2,79 | 87,327 | 7,7841 | 979,69 | 28,8977 | 2,4023 | 7,68 |
∑ | 169 | 325,2 | 35,71 | 796,45 | 86,2765 | 7471,42 | 325,2173 | -0,0173 | 86,07 |
Ср | 11,26667 | 21,68 | 2,380667 | 53,09667 | 5,751767 | 498,0947 | 21,68115 | -0,00115 | 5,738 |
Используя исходные данные, рассчитываем z(z = lnx), y*z, z2 . Рассчитав ∑z, ∑yz и ∑z2 определяем их средние значения. Тогда параметры b и а уравнения:
b = zy – z*y = 53,09667-2,380667*21,68 = 17,63
z2 – (z)2 5,751767 – (2,380667)2
а = y - b*z = 21,68 – 1,48*2,380667 = -20,29
Уравнение полулогарифмической регрессии
ỹх = -20,29 + 17,63*lnx.
2.2.2. Оценим тесноту связи между признаками у и х.
Т.к. уравнение ỹх = a+b*lnx линейно относительно параметров а и b и его линеаризация не была связана с преобразованием зависимой переменной у, то теснота связи между переменными у и х, оцениваемая с помощью индекса парной корреляции Rxy, также может быть определена с помощью линейного коэффициента парной корреляции r xy, т.е. в данном случае Rxy= r xz.
σy = 5,3
σz = √z2 – (z)2 = √5,751767 – (2,380667)2 =√ 0,0841 = 0.29
Rxy = r xz. = b*( σz/ σy) = 17.63*(0,29/5,3) = 0,965
Значение индекса корреляции Rxy, близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида y=b+lnx.
2.2.3. Оценим качество построенной модели, ỹ = а + b*lnx.
Определим индекс детерминации:
R2ху = r2yz = 0.9652 = 0.931
Т.е. данная модель объясняет 93,1% общей дисперсии у, а на долю необъясненной дисперсии приходится 6,9%. Следовательно, качество модели высокое.
Найдем величину средней ошибки аппроксимации А.
Предварительно определим ỹ , подставляя в уравнение регрессии
ỹх = -20,29+17,63* lnx Фактические значения х.
Найдем (y - ỹ) и Аi, i=1,…,15. Тогда
А = (1/n)*∑Ai = (1/15)* 86,07 = 5,74 %.
Т.е. в среднем расчетные значения отклоняются от фактических на 2,74%. Ошибка допустимая т.к. 5,74% ‹ 10%.
2.2.4. Определим средний коэффициент эластичности:
Э = b/y = 17,63/21,68 = 0,813%.
2.2.5. Оценим статистическую значимость полученного уравнения. Сравним фактическое и табличное значение F – критерия Фишера. Примем α = 0,05. Найдем табличное (критическое) значение F – критерия Фишера.
Fтабл = (α = 0,05, k1 = 1, k2 = 15-2=13)=4,67.
Найдем фактическое значение F – критерия Фишера:
Fфакт = (R2ху /1- R2ху)*(n-2) = (0,931/1-0,931)*(15-2) =175, 41
Fфакт › Fтабл.
Поэтому гипотеза Н0 о случайном характере зависимости у от х отвергается, принимается альтернативная гипотеза Н1 – с вероятностью 0,95 выявленная зависимость у от х носит неслучайный характер, полученное уравнение статистически значимо, надежно и может быть использовано для прогноза.
2.3. Модель степной парной регрессии.
2.3.1. Рассчитаем параметры а и b степной регрессии
ỹ = a*xb .
Расчету параметров предшествует процедура линеаризации данного уравнения: ln y = ln (a*xb ) = ln a + b*ln x.
Обозначим Y = ln y, X = ln a, A = ln a. Тогда получим Y = A + b*X.
Строим расчетную таблицу (таблица №3).
По исходным данным рассчитываем Y = ln y, X = ln x, X*Y и X2 .
Рассчитав ∑X, ∑Y, ∑XY, ∑X2 определяем их средние значения. Тогда параметры b и a уравнения Y = A+b*X:
b= YX – X*Y = 7,325202 – 2,381624*3,046122 = 0,88
X2 – (X)2 5,75602172 – (2,381624)2
А = Y – b*X = 3,046122 – 0,88*2,381624 = 0,95
Определим а: а = еА = 2,7182311,31 = 2,59
Уравнение степной регрессии ỹх = 2,59*х0,88 .
21
№ | x | y | X | Y | YX | X2 | y2 | ỹ | y - ỹ | (y - ỹ)2 | Ai |
1 | 15,2 | 28,3 | 2,721295 | 3,342862 | 9,096915 | 7,40544881 | 800,89 | 28,40025 | -0,10025 | 0,01005 | 0,35 |
2 | 14,9 | 28,2 | 2,701361 | 3,339322 | 9,020715 | 7,2973524 | 795,24 | 27,90639 | 0,293609 | 0,086206 | 1,04 |
3 | 7,8 | 16,8 | 2,054124 | 2,821379 | 5,795461 | 4,21942431 | 282,24 | 15,78858 | 1,011422 | 1,022975 | 6,02 |
4 | 10,5 | 19,5 | 2,351375 | 2,970414 | 6,984559 | 5,5289656 | 380,25 | 20,50909 | -1,00909 | 1,018258 | 5,17 |
5 | 11,6 | 20,7 | 2,451005 | 3,030134 | 7,426873 | 6,00742599 | 428,49 | 22,38839 | -1,68839 | 2,850649 | 8,16 |
6 | 9,4 | 19,8 | 2,24071 | 2,985682 | 6,690046 | 5,02077991 | 392,04 | 18,60597 | 1,194032 | 1,425712 | 6,03 |
7 | 13,4 | 26,3 | 2,595255 | 3,269569 | 8,485364 | 6,73534699 | 691,69 | 25,41862 | 0,881379 | 0,776829 | 3,35 |
8 | 14,9 | 27,5 | 2,701361 | 3,314186 | 8,952814 | 7,2973524 | 756,25 | 27,90639 | -0,40639 | 0,165154 | 1,48 |
9 | 9,7 | 18,3 | 2,272126 | 2,906901 | 6,604845 | 5,16255604 | 334,89 | 19,12753 | -0,82753 | 0,684806 | 4,52 |
10 | 8,4 | 17,3 | 2,128232 | 2,850707 | 6,066964 | 4,52937019 | 299,29 | 16,85255 | 0,447453 | 0,200215 | 2,59 |
11 | 7,6 | 15,2 | 2,028148 | 2,721295 | 5,519191 | 4,11338531 | 231,04 | 15,43177 | -0,23177 | 0,053717 | 1,52 |
12 | 5,9 | 13,1 | 1,774952 | 2,572612 | 4,566264 | 3,15045585 | 171,61 | 12,3495 | 0,750495 | 0,563243 | 5,73 |
13 | 10,8 | 19,5 | 2,379546 | 2,970414 | 7,068238 | 5,6622398 | 380,25 | 21,02387 | -1,52387 | 2,322181 | 7,81 |
14 | 12,6 | 23,4 | 2,533697 | 3,152736 | 7,988077 | 6,41961955 | 547,56 | 24,0783 | -0,6783 | 0,460093 | 2,9 |
15 | 16,3 | 31,3 | 2,791165 | 3,443618 | 9,611707 | 7,79060266 | 979,69 | 30,20125 | 1,098754 | 1,207261 | 3,51 |
∑ | 169 | 325,2 | 35,72435 | 45,69183 | 109,878 | 86,3403258 | 7471,42 | 325,9884 | -0,78844 | 12,84735 | 60,18 |
Ср | 11,26667 | 21,68 | 2,381624 | 3,046122 | 7,325202 | 5,75602172 | 498,0947 | 21,73256 | -0,05256 | 0,85649 | 4,012 |