Автор работы: Пользователь скрыл имя, 25 Сентября 2013 в 13:28, курсовая работа
Целью проекта является построение и анализ эконометрической модели, показывающей влияние различных факторов на цену автомобиля. Проанализируем 6 факторов на основе выборки содержащей 40 наблюдений. В качестве переменных использовались следующие показатели: объем двигателя, мощность, максимальная скорость, тип привода (dummy-переменная, где 0 – передний привод, 1 – задний), полная масса и время разгона до 100 км/ч (сек.).
Верификация модели
Посмотрим, насколько полученное нами уравнение регрессии соответствует действительности. Для этого подставим технические характеристики автомобиля в уравнение:
PRICE = -689298.152209 + 3819.95354877*MAKS_SPEED + 442.690488743*MASSA + 144.812902114*MOCHNOST + 153.436539214*OB + 312078.14974*PRIVOD - 29629.4526403*RAZGON
Отсюда прогнозируемая цена автомобиля составляет около 1 361 890 рублей. Фактическая цена – 1 500 000 рублей. Таким образом, прогнозное значение составляет 90,7% фактического. Следовательно, разработанная модель достаточно достоверна.
Корректировка модели
Исключаем переменные RAZGON и MOCHNOST
Dependent Variable: PRICE |
||||
Method: Least Squares |
||||
Date: 12/31/12 Time: 12:13 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-1357863. |
485599.8 |
-2.796260 |
0.0083 |
MAKS_SPEED |
5151.374 |
2653.472 |
1.941371 |
0.0603 |
MASSA |
483.4028 |
230.8282 |
2.094210 |
0.0436 |
OB |
186.0084 |
87.62925 |
2.122675 |
0.0409 |
PRIVOD |
321403.7 |
136089.8 |
2.361703 |
0.0239 |
R-squared |
0.705798 |
Mean dependent var |
1014325. | |
Adjusted R-squared |
0.672175 |
S.D. dependent var |
375802.8 | |
S.E. of regression |
215169.5 |
Akaike info criterion |
27.51271 | |
Sum squared resid |
1.62E+12 |
Schwarz criterion |
27.72382 | |
Log likelihood |
-545.2542 |
Hannan-Quinn criter. |
27.58904 | |
F-statistic |
20.99151 |
Durbin-Watson stat |
1.380353 | |
Prob(F-statistic) |
0.000000 |
|||
Уравнение регрессии имеет вид:
PRICE = -1357863.21741 + 5151.37383882*MAKS_SPEED + 483.402764614*MASSA + 186.008416269*OB + 321403.668484*PRIVOD
В соответствие с величинами Probability при t-статистиках значимы все коэффициенты.
Регрессия значима, так как Prob(F-statistic) точно меньше 0,05.
R-squared равно 0,706, что свидетельствует о высокой степени достоверности модели.
Так как коэффициент Durbin-Watson достаточно близок к 2, можно сделать вывод о том, что автокорреляции нет
Проводим тест на гетероскедастичность White
Heteroskedasticity Test: White |
||||
F-statistic |
0.169502 |
Prob. F(13,26) |
0.9991 | |
Obs*R-squared |
3.125172 |
Prob. Chi-Square(13) |
0.9974 | |
Scaled explained SS |
5.210592 |
Prob. Chi-Square(13) |
0.9703 | |
Как следует из приведенной таблицы, вероятность ошибки первого рода равна 99,91%. Следовательно, нулевую гипотезу (об отсутствии гетероскедастичности) нельзя отклонить.
Матрица корреляции
PRICE |
MAKS_SPEED |
MASSA |
OB |
PRIVOD | |
PRICE |
1.000000 |
0.746429 |
0.657484 |
0.605613 |
0.576177 |
MAKS_SPEED |
0.746429 |
1.000000 |
0.571623 |
0.515563 |
0.624163 |
MASSA |
0.657484 |
0.571623 |
1.000000 |
0.600023 |
0.276300 |
OB |
0.605613 |
0.515563 |
0.600023 |
1.000000 |
0.152933 |
PRIVOD |
0.576177 |
0.624163 |
0.276300 |
0.152933 |
1.000000 |
Выводы по модели
PRICE=-1357863.21741+5151.
Интерпритация коэффициентов уравнения:
Коэффициент при переменной MAKS_SPEED: если максимальное число километров ,пройденных за час увеличивается на 1 , то цена увеличится в среднем на 5151,374 р.
Коэффициент при переменной MASSA: при увеличение массы на 1 кг цена увеличится в среднем на 483.402 р.
Коэффициент при переменной OB : при увеличении объема двигателя на 1 л цена увеличится в среднем на 186.008 р.
Коэффициент при переменной PRIVOD: автомобили с задним приводом в среднем дороже на 321403,668 р.
Верификация модели
Проверим,насколько полученное нами уравнение регрессии отражает действительность. Для этого подставим характеристики автомобиля Kia Cerato в уравнение:
PRICE = -1357863.21741 + 5151.37383882*MAKS_SPEED
+ 483.402764614*MASSA + 186.008416269*OB + 321403.668484*PRIVOD= -1357863,21741+5151,37383882*
Отсюда прогнозируемая стоимость автомобиля Kia Cerato 720959,9. Фактическая цена 700000. Таким образом,прогнозное значение составляет 102,99% фактического. Следовательно, разработанная модель достаточно достоверна.
Таким образом, выведенная модель подтверждает наши предположения о том, что такие показатели ,как максимальная скорость, мощность, объем двигателя и привод положительно коррелируют с ценой автомобиля. Мы исключили из нашей модели такие переменные ,как разгон и мощность, так как они были тесно связаны с другими переменными.
Построим полулогарифмическую модель
Log(Price)= β0+ β1*maks_speed+β2*massa+β3*
Dependent Variable: LOG(PRICE) |
||||
Method: Least Squares |
||||
Date: 12/31/12 Time: 00:52 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
11.95549 |
1.356548 |
8.813174 |
0.0000 |
MAKS_SPEED |
0.004173 |
0.004508 |
0.925637 |
0.3614 |
MASSA |
0.000567 |
0.000265 |
2.135794 |
0.0402 |
MOCHNOST |
-0.000393 |
0.002017 |
-0.194752 |
0.8468 |
OB |
0.000152 |
0.000162 |
0.942117 |
0.3530 |
PRIVOD |
0.229268 |
0.152178 |
1.506572 |
0.1414 |
RAZGON |
-0.041519 |
0.052699 |
-0.787845 |
0.4364 |
R-squared |
0.678992 |
Mean dependent var |
13.75975 | |
Adjusted R-squared |
0.620627 |
S.D. dependent var |
0.384161 | |
S.E. of regression |
0.236618 |
Akaike info criterion |
0.112885 | |
Sum squared resid |
1.847601 |
Schwarz criterion |
0.408439 | |
Log likelihood |
4.742291 |
Hannan-Quinn criter. |
0.219748 | |
F-statistic |
11.63352 |
Durbin-Watson stat |
1.463572 | |
Prob(F-statistic) |
0.000001 |
|||
Уравнение регрессии имеет
вид:
LOG(PRICE)=11.9554910814+0.
Проведем тест Вальда
Wald Test: |
|||
Equation: Untitled |
|||
Test Statistic |
Value |
df |
Probability |
t-statistic |
-0.787845 |
33 |
0.4364 |
F-statistic |
0.620700 |
(1, 33) |
0.4364 |
Chi-square |
0.620700 |
1 |
0.4308 |
Так как probability > 0,05 , мы можем утверждать
о незначимости переменной razgon
C(2)=C(3)=C(5)=C(7)=0
Wald Test: |
|||
Equation: Untitled |
|||
Test Statistic |
Value |
df |
Probability |
F-statistic |
3.814777 |
(4, 33) |
0.0117 |
Chi-square |
15.25911 |
4 |
0.0042 |
Мы отвергаем гипотезу об одновременной
= 0 коэффициентов maks speed, massa, ob и razgon.
Correlogram
Date: 12/31/12 Time: 00:13 |
||||||
Sample: 1 40 |
||||||
Included observations: 40 |
||||||
Autocorrelation |
Partial Correlation |
AC |
PAC |
Q-Stat |
Prob | |
. |** | |
. |** | |
1 |
0.268 |
0.268 |
3.0903 |
0.079 |
. |*. | |
. |*. | |
2 |
0.147 |
0.081 |
4.0491 |
0.132 |
.*| . | |
**| . | |
3 |
-0.170 |
-0.247 |
5.3633 |
0.147 |
**| . | |
**| . | |
4 |
-0.279 |
-0.218 |
9.0015 |
0.061 |
.*| . | |
. |*. | |
5 |
-0.112 |
0.076 |
9.6085 |
0.087 |
**| . | |
**| . | |
6 |
-0.231 |
-0.211 |
12.247 |
0.057 |
. |*. | |
. |*. | |
7 |
0.080 |
0.113 |
12.572 |
0.083 |
. |*. | |
. |*. | |
8 |
0.148 |
0.138 |
13.718 |
0.089 |
. |*. | |
. | . | |
9 |
0.196 |
0.029 |
15.796 |
0.071 |
. |** | |
. |*. | |
10 |
0.213 |
0.077 |
18.348 |
0.049 |
. |*. | |
. |*. | |
11 |
0.075 |
0.087 |
18.670 |
0.067 |
.*| . | |
.*| . | |
12 |
-0.068 |
-0.134 |
18.950 |
0.090 |
.*| . | |
. | . | |
13 |
-0.147 |
-0.006 |
20.294 |
0.088 |
***| . | |
**| . | |
14 |
-0.346 |
-0.231 |
28.036 |
0.014 |
.*| . | |
. | . | |
15 |
-0.161 |
-0.020 |
29.788 |
0.013 |
**| . | |
**| . | |
16 |
-0.251 |
-0.238 |
34.187 |
0.005 |
. | . | |
.*| . | |
17 |
-0.053 |
-0.088 |
34.392 |
0.007 |
. |*. | |
. | . | |
18 |
0.129 |
0.034 |
35.656 |
0.008 |
. |*. | |
. |*. | |
19 |
0.191 |
0.097 |
38.583 |
0.005 |
. |** | |
. | . | |
20 |
0.221 |
-0.061 |
42.701 |
0.002 |
Проводим тест на гетероскедастичность White
Heteroskedasticity Test: White |
||||
F-statistic |
0.529147 |
Prob. F(25,14) |
0.9200 | |
Obs*R-squared |
19.43344 |
Prob. Chi-Square(25) |
0.7759 | |
Scaled explained SS |
24.00889 |
Prob. Chi-Square(25) |
0.5189 | |
Как следует из приведенной распечатки, вероятность ошибки первого рода равна 92%. Следовательно, нулевую гипотезу (об отсутствии гетероскедастичности) нельзя отклонить.
Проинтерпретируем результаты модели:
Если максимальная скорость вырастет на 1км/ч, то цена вырастет в e0.0041727 раз, при прочих равных условиях. При увеличении объема двигателя на см3 цена увеличится в среднем в e0.000152 раз, при прочих равных условиях. При увеличении времени разгона до 100 км/ч на 1 сек, цена снизится в e0.0415187 раз, при прочих равных условиях.
Построим логарифмическую модель
Log(Price)= β0+ β1*log(maks_speed) +β2*log(massa)
+β3*log(mochnost)+ +β4*log(ob)+β5*privod+ β6*log(razgon)
Dependent Variable: LOG(PRICE) |
||||
Method: Least Squares |
||||
Date: 12/31/12 Time: 00:28 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-1.044733 |
6.089542 |
-0.171562 |
0.8648 |
LOG(MAKS_SPEED) |
0.803068 |
0.877050 |
0.915647 |
0.3665 |
LOG(MASSA) |
1.050744 |
0.478146 |
2.197539 |
0.0351 |
LOG(MOCHNOST) |
0.168585 |
0.294982 |
0.571509 |
0.5715 |
LOG(OB) |
0.260563 |
0.326291 |
0.798558 |
0.4303 |
PRIVOD |
0.222526 |
0.148269 |
1.500830 |
0.1429 |
LOG(RAZGON) |
-0.098233 |
0.441668 |
-0.222413 |
0.8254 |
R-squared |
0.689640 |
Mean dependent var |
13.75975 | |
Adjusted R-squared |
0.633211 |
S.D. dependent var |
0.384161 | |
S.E. of regression |
0.232660 |
Akaike info criterion |
0.079151 | |
Sum squared resid |
1.786313 |
Schwarz criterion |
0.374705 | |
Log likelihood |
5.416976 |
Hannan-Quinn criter. |
0.186014 | |
F-statistic |
12.22137 |
Durbin-Watson stat |
1.556608 | |
Prob(F-statistic) |
0.000000 |
|||
Информация о работе Факторы, влияющие на цену импортных автомобилей