Автор работы: Пользователь скрыл имя, 25 Сентября 2013 в 13:28, курсовая работа
Целью проекта является построение и анализ эконометрической модели, показывающей влияние различных факторов на цену автомобиля. Проанализируем 6 факторов на основе выборки содержащей 40 наблюдений. В качестве переменных использовались следующие показатели: объем двигателя, мощность, максимальная скорость, тип привода (dummy-переменная, где 0 – передний привод, 1 – задний), полная масса и время разгона до 100 км/ч (сек.).
Уральский федеральный университет
им. Б.Н. Ельцина
Высшая школа экономики и менеджмента
Исследовательский проект на тему:
«Факторы, влияющие на цену импортных автомобилей»
Выполнил:
Студент 3 курса
ВШЭМ
Екатеринбург
2012
Введение.
Целью проекта является построение и анализ эконометрической модели, показывающей влияние различных факторов на цену автомобиля. Проанализируем 6 факторов на основе выборки содержащей 40 наблюдений. В качестве переменных использовались следующие показатели: объем двигателя, мощность, максимальная скорость, тип привода (dummy-переменная, где 0 – передний привод, 1 – задний), полная масса и время разгона до 100 км/ч (сек.).
Были выбраны такие параметры т.к. например, объём двигателя значительно влияет на цену иномарки, т.к. в первую очередь объем двигателя влияет на его мощность, чем больше цилиндров и объем каждого из них, тем, соответственно, больше мощность самого двигателя. А чем больше мощность, тем больше максимальная скорость и быстрее разгон. Но так как объем пространства, где сгорает топливная смесь больше, то соответственно и этой смеси нужно больше, отсюда и больший расход топлива.
От мощности автомобиля зависят скорость разгона, максимальная скорость и управляемость автомобиля в целом. Чем тяжелее автомобиль, тем больше нужно мощности для его ускорения, когда вы жмете на педаль газа, и наоборот чем легче автомобиль, тем меньше требуется мощности. За каждую лошадиную силу под капотом нужно платить транспортный налог, причем, чем больше лошадиных сил, тем выше ставка налога.
Выборка произведена на базе данных сайта autonet.ru, содержащей данные о технических характеристиках более чем 20 000 автомобилей.
Выборка является репрезентативной, т.к. включает в себя более 50% процентов генеральной совокупности и включает такие автомобили, как Kia, Skoda, Ford, Hyundai, Mazda,Volvo,Volkswagen и другие.
Данные выборки
название |
объем двигателя |
мощность |
макс. скорость |
тип привода |
полная масса |
разгон до 100 |
цена | |||||
Kia Cerato |
1600 |
126 |
190 |
0 |
1660 |
9,8 |
700 000 | |||||
Skoda Octavia |
1600 |
105 |
191 |
0 |
1880 |
10,9 |
670 000 | |||||
Volkswagen Jetta |
1600 |
105 |
190 |
0 |
1800 |
10,9 |
710 000 | |||||
Kia Optima 2.4 |
2400 |
180 |
210 |
0 |
1890 |
9,3 |
1 300 000 | |||||
audi a5 1.8 tfsi |
1798 |
170 |
230 |
0 |
1925 |
7,9 |
1 500 000 | |||||
audi a4 1.8 tfsi |
1798 |
170 |
230 |
0 |
1980 |
8,1 |
1 300 000 | |||||
ford focus III 1.6 ti-vct |
1599 |
85 |
224 |
0 |
1900 |
8 |
850 000 | |||||
ford fusion 2.5 |
2500 |
130,5 |
200 |
0 |
1890 |
8,2 |
680 000 | |||||
ford focus III 2.0 ti-vct |
1999 |
150 |
206 |
0 |
1875 |
9,3 |
900 000 | |||||
hyundai solaris 1.6 |
1591 |
123 |
190 |
0 |
1565 |
10,2 |
600 000 | |||||
toyota camry vII 3.5 |
3456 |
249 |
210 |
0 |
2100 |
7,1 |
1 500 000 | |||||
toyota corolla 1.6 |
1598 |
124 |
195 |
0 |
1735 |
10,4 |
800 000 | |||||
toyota avensis 2.0 d |
1998 |
177 |
200 |
0 |
2100 |
8,5 |
1 100 000 | |||||
Hyundai Elantra |
1600 |
150 |
202 |
0 |
1810 |
10,2 |
900 000 | |||||
BMW 3er |
1995 |
156 |
220 |
1 |
1890 |
9 |
1 500 000 | |||||
mercedes-benz c |
2000 |
188 |
240 |
1 |
1890 |
7,2 |
1 600 000 | |||||
mercedes-benz c250 |
1796 |
204 |
240 |
1 |
2020 |
7,2 |
1 500 000 | |||||
mazda 3 2.0 |
1999 |
150 |
200 |
0 |
1820 |
10,6 |
800 000 | |||||
mazda 6 2.0 |
1998 |
150 |
208 |
0 |
1850 |
9,7 |
950 000 | |||||
mazda 2 1.5 |
1498 |
103 |
188 |
0 |
2000 |
10,4 |
660 000 | |||||
volvo s40 2.0 d3 |
1984 |
150 |
210 |
0 |
2020 |
9,5 |
1 200 000 | |||||
volvo s40 2.0 d4 |
1984 |
177 |
220 |
0 |
2020 |
8,7 |
1 400 000 | |||||
volkswagen passat 2.0 tdi 4m |
1968 |
170 |
220 |
1 |
2200 |
8,5 |
1 600 000 | |||||
volkswagen p 2.0 tdi 4m |
1598 |
105 |
190 |
0 |
1660 |
10,5 |
1 433 000 | |||||
suzuki kizashi 2.4 |
2400 |
178 |
215 |
0 |
2000 |
7,8 |
1 300 000 | |||||
suzuki sx4 1.6 |
1586 |
110 |
180 |
0 |
1650 |
10,7 |
800 000 | |||||
peugeot 408 1.6 THP |
1598 |
150 |
207 |
0 |
1850 |
9,6 |
560 000 | |||||
nissan almera 1.6 |
1597 |
102 |
185 |
0 |
1600 |
10,9 |
500 000 | |||||
nissan teana 3.5 |
3498 |
249 |
210 |
0 |
2060 |
7,2 |
1 400 000 | |||||
mitsubishi lanser 1.8 |
1798 |
143 |
204 |
0 |
1850 |
9,8 |
620 000 | |||||
citroen c-elysee |
1587 |
106 |
185 |
0 |
2200 |
7,8 |
1 000 000 | |||||
citroen c6 3 hdi v6 |
2992 |
241 |
235 |
0 |
2340 |
8,5 |
1 500 000 | |||||
chevrolet astra 2.0 |
1998 |
128 |
201 |
0 |
1650 |
9,1 |
1 000 000 | |||||
chevrolet aveo 1.2 |
1229 |
86 |
171 |
0 |
1568 |
13,4 |
500 000 | |||||
chevrolet epica 2.0 |
1993 |
143 |
207 |
0 |
1945 |
9,9 |
800 000 | |||||
chevrolet prisma 1.4 |
1389 |
97 |
184 |
0 |
1410 |
11 |
450 000 | |||||
opel astra 1.4 t |
1364 |
140 |
207 |
0 |
1650 |
10,2 |
700 000 | |||||
bmw alpina B3 3.0 |
2979 |
360 |
285 |
1 |
2090 |
4,8 |
1 700 000 | |||||
Kia Optima 2.0 |
2000 |
150 |
210 |
0 |
1980 |
9,5 |
950 000 | |||||
kia rio 1.6 |
1591 |
123 |
190 |
0 |
1565 |
10,3 |
640 000 |
Описание переменных.
Объясняющие переменные:
Объем двигателя
Масса
Мощность
6
Тип привода:
Разгон до 100 км/ч:
Максимальная скорость
Объясняемая переменная:
Цена:
Множественная линейная регрессионная модель
Произведём оценку по МНК по данной модели
Price= β0+ β1*maks_speed+β2*massa+β3*
Dependent Variable: PRICE |
||||
Method: Least Squares |
||||
Date: 12/30/12 Time: 01:46 |
||||
Sample: 1 40 |
||||
Included observations: 40 |
||||
PRICE=C(1)+C(2)*MAKS_SPEED+C( | ||||
*OB+C(6)*PRIVOD+C(7)*RAZGON |
||||
Coefficient |
Std. Error |
t-Statistic |
Prob. | |
C(1) |
-689298.2 |
1263456. |
-0.545566 |
0.5890 |
C(2) |
3819.954 |
4198.636 |
0.909808 |
0.3695 |
C(3) |
442.6905 |
247.2131 |
1.790725 |
0.0825 |
C(4) |
144.8129 |
1878.887 |
0.077074 |
0.9390 |
C(5) |
153.4365 |
150.4712 |
1.019707 |
0.3153 |
C(6) |
312078.1 |
141735.3 |
2.201838 |
0.0348 |
C(7) |
-29629.45 |
49082.67 |
-0.603664 |
0.5502 |
R-squared |
0.709013 |
Mean dependent var |
1014325. | |
Adjusted R-squared |
0.656106 |
S.D. dependent var |
375802.8 | |
S.E. of regression |
220380.0 |
Akaike info criterion |
27.60172 | |
Sum squared resid |
1.60E+12 |
Schwarz criterion |
27.89728 | |
Log likelihood |
-545.0344 |
Hannan-Quinn criter. |
27.70859 | |
F-statistic |
13.40118 |
Durbin-Watson stat |
1.325048 | |
Prob(F-statistic) |
0.000000 |
Уравнение регрессии имеет вид:
PRICE = -689298.152209 + 3819.95354877*MAKS_SPEED + 442.690488743*MASSA + 144.812902114*MOCHNOST + 153.436539214*OB + 312078.14974*PRIVOD - 29629.4526403*RAZGON
Адекватность регрессии мы проверяем с помощью критерия Фишера F-statistic и вероятности Prob (F-statistic). Выдвигаем нулевую гипотезу H0 о статистической незначимости линейного уравнения регрессии в целом и отсутствии связи между зависимой и независимыми переменными Если Prob (F-statistic) > a=0,05, то H0 принимаем. Т.к. Prob (F-statistic) очень мала и точно меньше 0,05, то отвергаем гипотезу H0 о незначимости регрессии.
R-squared равно 0,709, что свидетельствует о высокой степени достоверности модели, то есть доля влияния независимых переменных на зависимую значительна.
Так как коэффициент Durbin-Watson достаточно близок к 2, можно сделать вывод о том, что автокорреляции нет.
Проинтерпретируем результаты модели:
Если максимальная скорость вырастет на 1км/ч, то цена вырастет в среднем на 3819.953, при прочих равных условиях. При увеличении объема двигателя на см3 цена увеличится на 153.4365, при прочих равных условиях. При увеличении времени разгона до 100 км/ч на 1 сек, цена снизится на 29629.4 , при прочих равных условиях.
Проводим тест на гетероскедастичность White
Heteroskedasticity Test: White |
||||
F-statistic |
0.401881 |
Prob. F(25,14) |
0.9773 | |
Obs*R-squared |
16.71231 |
Prob. Chi-Square(25) |
0.8920 | |
Scaled explained SS |
25.46390 |
Prob. Chi-Square(25) |
0.4366 | |
Как следует из приведенной распечатки, вероятность ошибки первого рода равна 97.73%. Следовательно, нулевую гипотезу (об отсутствии гетероскедастичности) нельзя отклонить.
Рассмотрим попарно
различные облака наблюдений
Матрица корреляции
PRICE |
MAKS_SPEED |
MASSA |
MOCHNOST |
OB |
PRIVOD |
RAZGON | |
PRICE |
1.000000 |
0.746429 |
0.657484 |
0.728023 |
0.605613 |
0.576177 |
-0.748046 |
MAKS_SPEED |
0.746429 |
1.000000 |
0.571623 |
0.809663 |
0.515563 |
0.624163 |
-0.816915 |
MASSA |
0.657484 |
0.571623 |
1.000000 |
0.599047 |
0.600023 |
0.276300 |
-0.675430 |
MOCHNOST |
0.728023 |
0.809663 |
0.599047 |
1.000000 |
0.812871 |
0.455241 |
-0.776225 |
OB |
0.605613 |
0.515563 |
0.600023 |
0.812871 |
1.000000 |
0.152933 |
-0.673970 |
PRIVOD |
0.576177 |
0.624163 |
0.276300 |
0.455241 |
0.152933 |
1.000000 |
-0.482406 |
RAZGON |
-0.748046 |
-0.816915 |
-0.675430 |
-0.776225 |
-0.673970 |
-0.482406 |
1.000000 |
Проанализировав полученные
данные, мы видим, что коэффициент
корреляции между Y и X1,X2,Х3,Х4,Х5,X6 бо
Проверка на мультиколлинеарность
Коэффициент корреляции
между многими переменными
Проведем тест Wald на линейное ограничение
Wald Test: |
|||
Equation: Untitled |
|||
Test Statistic |
Value |
df |
Probability |
F-statistic |
2.779459 |
(2, 33) |
0.0766 |
Chi-square |
5.558918 |
2 |
0.0621 |
Probability больше 0,05 ,значит, нулевую гипотезу
не отвергаем.
Wald Test: |
|||
Equation: Untitled |
|||
Test Statistic |
Value |
df |
Probability |
t-statistic |
2.201838 |
33 |
0.0348 |
F-statistic |
4.848092 |
(1, 33) |
0.0348 |
Chi-square |
4.848092 |
1 |
0.0277 |
Probability меньше 0,05 ,значит, нулевую гипотезу отвергаем.
Wald Test: |
|||
Equation: Untitled |
|||
Test Statistic |
Value |
df |
Probability |
t-statistic |
-0.603664 |
33 |
0.5502 |
F-statistic |
0.364411 |
(1, 33) |
0.5502 |
Chi-square |
0.364411 |
1 |
0.5461 |
Probability больше 0,05 ,значит, нулевую гипотезу
не отвергаем.
4) Н(0) :β(3)=0
Wald Test: |
|||
Equation: Untitled |
|||
Test Statistic |
Value |
df |
Probability |
t-statistic |
0.077074 |
33 |
0.9390 |
F-statistic |
0.005940 |
(1, 33) |
0.9390 |
Chi-square |
0.005940 |
1 |
0.9386 |
Probability больше 0,05 ,значит, нулевую гипотезу
не отвергаем.
Correlogram
Date: 12/30/12 Time: 23:49 |
||||||
Sample: 1 40 |
||||||
Included observations: 40 |
||||||
Autocorrelation |
Partial Correlation |
AC |
PAC |
Q-Stat |
Prob | |
. |** | |
. |** | |
1 |
0.336 |
0.336 |
4.8687 |
0.027 |
. |*. | |
. | . | |
2 |
0.103 |
-0.011 |
5.3411 |
0.069 |
**| . | |
**| . | |
3 |
-0.213 |
-0.276 |
7.4106 |
0.060 |
**| . | |
.*| . | |
4 |
-0.317 |
-0.196 |
12.104 |
0.017 |
.*| . | |
. |*. | |
5 |
-0.122 |
0.097 |
12.816 |
0.025 |
**| . | |
**| . | |
6 |
-0.228 |
-0.269 |
15.391 |
0.017 |
. | . | |
. |*. | |
7 |
0.043 |
0.094 |
15.487 |
0.030 |
. |*. | |
. |*. | |
8 |
0.133 |
0.110 |
16.409 |
0.037 |
. |*. | |
. | . | |
9 |
0.161 |
-0.018 |
17.819 |
0.037 |
. |** | |
. |*. | |
10 |
0.244 |
0.127 |
21.158 |
0.020 |
. |*. | |
. | . | |
11 |
0.082 |
0.072 |
21.545 |
0.028 |
. | . | |
.*| . | |
12 |
-0.027 |
-0.119 |
21.590 |
0.042 |
.*| . | |
. | . | |
13 |
-0.148 |
-0.008 |
22.962 |
0.042 |
***| . | |
**| . | |
14 |
-0.385 |
-0.277 |
32.519 |
0.003 |
**| . | |
. | . | |
15 |
-0.212 |
-0.029 |
35.535 |
0.002 |
**| . | |
**| . | |
16 |
-0.258 |
-0.206 |
40.195 |
0.001 |
. | . | |
. | . | |
17 |
-0.015 |
-0.055 |
40.212 |
0.001 |
. |*. | |
. | . | |
18 |
0.173 |
0.038 |
42.497 |
0.001 |
. |** | |
. |*. | |
19 |
0.248 |
0.125 |
47.426 |
0.000 |
. |*. | |
.*| . | |
20 |
0.211 |
-0.166 |
51.183 |
0.000 |
Информация о работе Факторы, влияющие на цену импортных автомобилей