Факторы, влияющие на цену импортных автомобилей

Автор работы: Пользователь скрыл имя, 25 Сентября 2013 в 13:28, курсовая работа

Краткое описание

Целью проекта является построение и анализ эконометрической модели, показывающей влияние различных факторов на цену автомобиля. Проанализируем 6 факторов на основе выборки содержащей 40 наблюдений. В качестве переменных использовались следующие показатели: объем двигателя, мощность, максимальная скорость, тип привода (dummy-переменная, где 0 – передний привод, 1 – задний), полная масса и время разгона до 100 км/ч (сек.).

Вложенные файлы: 1 файл

эконометрика проект.docx

— 138.23 Кб (Скачать файл)

Уральский федеральный  университет 

им. Б.Н. Ельцина

Высшая школа экономики  и менеджмента

 

 

 

Исследовательский проект на тему:

«Факторы, влияющие на цену импортных автомобилей»

 

 

 

Выполнил:

Студент 3 курса 

ВШЭМ

 

 

 

Екатеринбург

2012

Введение.


Целью проекта является построение и анализ эконометрической модели, показывающей влияние различных  факторов на цену автомобиля. Проанализируем 6 факторов на основе выборки содержащей 40 наблюдений. В качестве переменных использовались следующие показатели: объем двигателя, мощность, максимальная скорость, тип привода (dummy-переменная, где 0 – передний привод, 1 – задний), полная масса и время разгона до 100 км/ч (сек.).

Были выбраны такие параметры т.к. например, объём двигателя значительно влияет на цену иномарки, т.к. в первую очередь объем двигателя влияет на его мощность, чем больше цилиндров и объем каждого из них, тем, соответственно, больше мощность самого двигателя. А чем больше мощность, тем больше максимальная скорость и быстрее разгон. Но так как объем пространства, где сгорает топливная смесь больше, то соответственно и этой смеси нужно больше, отсюда и больший расход топлива.

От мощности автомобиля зависят  скорость разгона, максимальная скорость и управляемость автомобиля в  целом. Чем тяжелее автомобиль, тем  больше нужно мощности для его  ускорения, когда вы жмете на педаль газа, и наоборот чем легче автомобиль, тем меньше требуется мощности. За каждую лошадиную силу под капотом  нужно платить транспортный налог, причем, чем больше лошадиных сил, тем выше ставка налога.

Выборка произведена на базе данных сайта autonet.ru, содержащей данные о технических характеристиках более чем 20 000 автомобилей.

Выборка является репрезентативной, т.к. включает в себя более 50% процентов  генеральной совокупности и включает такие автомобили, как  Kia, Skoda, Ford, Hyundai, Mazda,Volvo,Volkswagen и другие.

 

 

Данные выборки

 

название

объем двигателя

мощность

макс. скорость

тип привода

полная масса

разгон до 100

цена

Kia Cerato

1600

126

190

0

1660

9,8

700 000

Skoda Octavia

1600

105

191

0

1880

10,9

670 000

Volkswagen Jetta

1600

105

190

0

1800

10,9

710 000

Kia Optima 2.4

2400

180

210

0

1890

9,3

1 300 000

audi a5 1.8 tfsi

1798

170

230

0

1925

7,9

1 500 000

audi a4 1.8 tfsi

1798

170

230

0

1980

8,1

1 300 000

ford focus III 1.6 ti-vct

1599

85

224

0

1900

8

850 000

ford fusion 2.5

2500

130,5

200

0

1890

8,2

680 000

ford focus III 2.0 ti-vct

1999

150

206

0

1875

9,3

900 000

hyundai solaris 1.6

1591

123

190

0

1565

10,2

600 000

toyota camry vII 3.5

3456

249

210

0

2100

7,1

1 500 000

toyota corolla 1.6

1598

124

195

0

1735

10,4

800 000

toyota avensis 2.0 d

1998

177

200

0

2100

8,5

1 100 000

Hyundai Elantra

1600

150

202

0

1810

10,2

900 000

BMW 3er

1995

156

220

1

1890

9

1 500 000

mercedes-benz c

2000

188

240

1

1890

7,2

1 600 000

mercedes-benz c250

1796

204

240

1

2020

7,2

1 500 000

mazda 3 2.0

1999

150

200

0

1820

10,6

800 000

mazda 6 2.0

1998

150

208

0

1850

9,7

950 000

mazda 2 1.5

1498

103

188

0

2000

10,4

660 000

volvo s40 2.0 d3

1984

150

210

0

2020

9,5

1 200 000

volvo s40 2.0 d4

1984

177

220

0

2020

8,7

1 400 000

volkswagen passat 2.0 tdi 4m

1968

170

220

1

2200

8,5

1 600 000

volkswagen p 2.0 tdi 4m

1598

105

190

0

1660

10,5

1 433 000

suzuki kizashi 2.4

2400

178

215

0

2000

7,8

1 300 000

suzuki sx4 1.6

1586

110

180

0

1650

10,7

800 000

peugeot 408 1.6 THP

1598

150

207

0

1850

9,6

560 000

nissan almera 1.6

1597

102

185

0

1600

10,9

500 000

nissan teana 3.5

3498

249

210

0

2060

7,2

1 400 000

mitsubishi lanser 1.8

1798

143

204

0

1850

9,8

620 000

citroen c-elysee

1587

106

185

0

2200

7,8

1 000 000

citroen c6 3 hdi v6

2992

241

235

0

2340

8,5

1 500 000

chevrolet astra 2.0

1998

128

201

0

1650

9,1

1 000 000

chevrolet aveo 1.2

1229

86

171

0

1568

13,4

500 000

chevrolet epica 2.0

1993

143

207

0

1945

9,9

800 000

chevrolet prisma 1.4

1389

97

184

0

1410

11

450 000

opel astra 1.4 t

1364

140

207

0

1650

10,2

700 000

bmw alpina B3 3.0

2979

360

285

1

2090

4,8

1 700 000

Kia Optima 2.0

2000

150

210

0

1980

9,5

950 000

kia rio 1.6

1591

123

190

0

1565

10,3

640 000


 

Описание переменных.

Объясняющие переменные:

Объем двигателя

Масса

Мощность

6

Тип привода:

Разгон до 100 км/ч:

Максимальная скорость

 

Объясняемая переменная:

Цена:

 

Множественная линейная регрессионная модель

Произведём оценку по МНК  по данной модели

Price= β0+ β1*maks_speed+β2*massa+β3*mochnost+β4*ob+β5*privod+ β6*razgon

 

Dependent Variable: PRICE

   

Method: Least Squares

   

Date: 12/30/12   Time: 01:46

   

Sample: 1 40

     

Included observations: 40

   

PRICE=C(1)+C(2)*MAKS_SPEED+C(3)*MASSA+C(4)*MOCHNOST+C(5)

*OB+C(6)*PRIVOD+C(7)*RAZGON

 
         
         
 

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C(1)

-689298.2

1263456.

-0.545566

0.5890

C(2)

3819.954

4198.636

0.909808

0.3695

C(3)

442.6905

247.2131

1.790725

0.0825

C(4)

144.8129

1878.887

0.077074

0.9390

C(5)

153.4365

150.4712

1.019707

0.3153

C(6)

312078.1

141735.3

2.201838

0.0348

C(7)

-29629.45

49082.67

-0.603664

0.5502

         
         

R-squared

0.709013

Mean dependent var

1014325.

Adjusted R-squared

0.656106

S.D. dependent var

375802.8

S.E. of regression

220380.0

Akaike info criterion

27.60172

Sum squared resid

1.60E+12

Schwarz criterion

27.89728

Log likelihood

-545.0344

Hannan-Quinn criter.

27.70859

F-statistic

13.40118

Durbin-Watson stat

1.325048

Prob(F-statistic)

0.000000

     

 

Уравнение регрессии имеет вид:

PRICE = -689298.152209 + 3819.95354877*MAKS_SPEED + 442.690488743*MASSA + 144.812902114*MOCHNOST + 153.436539214*OB + 312078.14974*PRIVOD - 29629.4526403*RAZGON

Адекватность регрессии  мы проверяем с помощью критерия Фишера F-statistic и вероятности Prob (F-statistic). Выдвигаем нулевую гипотезу Hо статистической незначимости линейного уравнения регрессии в целом и отсутствии связи между зависимой и независимыми переменными Если Prob (F-statistic) > a=0,05, то Hпринимаем. Т.к. Prob (F-statistic) очень мала и точно меньше 0,05, то отвергаем гипотезу Hо незначимости регрессии.

R-squared равно 0,709, что свидетельствует о высокой степени достоверности модели, то есть доля влияния независимых переменных на зависимую значительна.

Так как коэффициент Durbin-Watson  достаточно близок к 2, можно сделать вывод о том, что автокорреляции нет.

Проинтерпретируем результаты модели:

Если максимальная скорость вырастет на 1км/ч, то цена вырастет в  среднем на 3819.953, при прочих равных условиях. При увеличении объема двигателя на см3 цена увеличится на 153.4365, при прочих равных условиях. При увеличении времени разгона до 100 км/ч на 1 сек, цена снизится на 29629.4 , при прочих равных условиях.

 

 

 

 

 

 

 

Проводим тест на гетероскедастичность  White

 

Heteroskedasticity Test: White

 
         
         

F-statistic

0.401881

Prob. F(25,14)

0.9773

Obs*R-squared

16.71231

Prob. Chi-Square(25)

0.8920

Scaled explained SS

25.46390

Prob. Chi-Square(25)

0.4366

         
         
         

Как следует из приведенной  распечатки, вероятность ошибки первого  рода равна 97.73%. Следовательно, нулевую  гипотезу (об отсутствии гетероскедастичности) нельзя отклонить.

 
Рассмотрим попарно  различные облака наблюдений

 

Матрица корреляции

 

 

 

PRICE

MAKS_SPEED

MASSA

MOCHNOST

OB

PRIVOD

RAZGON

PRICE

1.000000

0.746429

0.657484

0.728023

0.605613

0.576177

-0.748046

MAKS_SPEED

0.746429

1.000000

0.571623

0.809663

0.515563

0.624163

-0.816915

MASSA

0.657484

0.571623

1.000000

0.599047

0.600023

0.276300

-0.675430

MOCHNOST

0.728023

0.809663

0.599047

1.000000

0.812871

0.455241

-0.776225

OB

0.605613

0.515563

0.600023

0.812871

1.000000

0.152933

-0.673970

PRIVOD

0.576177

0.624163

0.276300

0.455241

0.152933

1.000000

-0.482406

RAZGON

-0.748046

-0.816915

-0.675430

-0.776225

-0.673970

-0.482406

1.000000


 

 

 

Проанализировав полученные данные, мы видим, что коэффициент  корреляции между Y и X1,X2,Х3,Х4,Х5,X6 больше 0,5 , т. е. можно говорить о наличии сильной зависимости между этими переменными.

 

 

Проверка на мультиколлинеарность

Коэффициент корреляции  между многими переменными превышают  по модулю 0,4,например: между mochnost и ob - 0.812871, между razgon и privod 0.482406 ,- что является признаком мультиколлинеарности модели.

 

Проведем тест Wald на линейное ограничение

  1. Н(0) : β(5)= β(6)= β(3)= 0

 

Wald Test:

   

Equation: Untitled

 
       
       

Test Statistic

Value

df

Probability

       
       

F-statistic

2.779459

(2, 33)

0.0766

Chi-square

5.558918

2

0.0621

       
       

 

 
Probability больше 0,05 ,значит, нулевую гипотезу не отвергаем.

 

 

 

 

 

 

 

  1. Н(0) : β(5)=0

Wald Test:

   

Equation: Untitled

 
       
       

Test Statistic

Value

df

Probability

       
       

t-statistic

2.201838

33

0.0348

F-statistic

4.848092

(1, 33)

0.0348

Chi-square

4.848092

1

0.0277

       
       

 

 

Probability меньше 0,05 ,значит, нулевую гипотезу отвергаем.

  1. Н(0) :β(6)=0

 

Wald Test:

   

Equation: Untitled

 
       
       

Test Statistic

Value

df

Probability

       
       

t-statistic

-0.603664

33

0.5502

F-statistic

0.364411

(1, 33)

0.5502

Chi-square

0.364411

1

0.5461

       
       

 
Probability больше 0,05 ,значит, нулевую гипотезу не отвергаем.

 

 

 

 

4) Н(0) :β(3)=0

 

Wald Test:

   

Equation: Untitled

 
       
       

Test Statistic

Value

df

Probability

       
       

t-statistic

0.077074

33

0.9390

F-statistic

0.005940

(1, 33)

0.9390

Chi-square

0.005940

1

0.9386

       
       

 
Probability больше 0,05 ,значит, нулевую гипотезу не отвергаем.

 

 

Correlogram

 

Date: 12/30/12   Time: 23:49

     

Sample: 1 40

         

Included observations: 40

       
             
             

Autocorrelation

Partial Correlation

 

AC 

PAC

Q-Stat

Prob

             
             

. |**    |

. |**    |

1

0.336

0.336

4.8687

0.027

. |*.    |

. | .    |

2

0.103

-0.011

5.3411

0.069

**| .    |

**| .    |

3

-0.213

-0.276

7.4106

0.060

**| .    |

.*| .    |

4

-0.317

-0.196

12.104

0.017

.*| .    |

. |*.    |

5

-0.122

0.097

12.816

0.025

**| .    |

**| .    |

6

-0.228

-0.269

15.391

0.017

. | .    |

. |*.    |

7

0.043

0.094

15.487

0.030

. |*.    |

. |*.    |

8

0.133

0.110

16.409

0.037

. |*.    |

. | .    |

9

0.161

-0.018

17.819

0.037

. |**    |

. |*.    |

10

0.244

0.127

21.158

0.020

. |*.    |

. | .    |

11

0.082

0.072

21.545

0.028

. | .    |

.*| .    |

12

-0.027

-0.119

21.590

0.042

.*| .    |

. | .    |

13

-0.148

-0.008

22.962

0.042

***| .    |

**| .    |

14

-0.385

-0.277

32.519

0.003

**| .    |

. | .    |

15

-0.212

-0.029

35.535

0.002

**| .    |

**| .    |

16

-0.258

-0.206

40.195

0.001

. | .    |

. | .    |

17

-0.015

-0.055

40.212

0.001

. |*.    |

. | .    |

18

0.173

0.038

42.497

0.001

. |**    |

. |*.    |

19

0.248

0.125

47.426

0.000

. |*.    |

.*| .    |

20

0.211

-0.166

51.183

0.000

             
             

Информация о работе Факторы, влияющие на цену импортных автомобилей