Анализ данных житлового фонду України у 1990-2009 роках

Автор работы: Пользователь скрыл имя, 11 Июня 2013 в 11:55, курсовая работа

Краткое описание

Метою роботи є побудова регресійної моделі для аналізу даних житлового фонду України у 1990-2009 роках.
Дані взяті з офіційного сайту Держкомстату України http://ukrstat.gov.ua/

Перша частина присвячена побудові простої лінійної регресійної моделі та перевірці її на адекватність та значущість одержаних значень b0 та b1.
Друга частина присвячена побудові багатовимірної лінійної регресійної моделі та перевірці її на мультиколінеарність, адекватність, значущість одержаних коефіцієнтів bі та гомоскедастичність.

Содержание

1) Вступ 3
2) Постановка задачі та початкові дані 4
1) Дано: 4
2) Потрібно: 4
3) Розв’язок 6
І) Побудова та перевірка простої лінійної регресійної моделі: 6
1) Побудова простої лінійної регресійної моделі: 6
2) Побудова графіку простої лінійної регресійної моделі: 7
3) Знаходження коефіцієнтів кореляції: 8
4) Перевірка регресійної модель на адекватність: 8
5) Знаходження дисперсії для значень b0 та b1: 9
6) Перевірка значущості одержаних значень b0 та b1: 9
7) Побудова інтервалів довіри для β0 та β1: 10
8) Побудова інтервалів довіри для прогнозованих значень: 11
II) Побудова та перевірка багатовимірної регресійної моделі: 12
1) Аналіз та вибір факторів: 12
2) Математично-статистичний аналіз на мультиколінеарність: 12
3) Оцінка невідомих параметрів b0…bm.: 13
4) Перевірка на адекватність за допомогою критерія Фішера: 14
5) Побудова множинного коефіцієнта кореляції: 15
6) Побудова варіаційно-коваріаційної матриці параметрів: 16
7) Перевірка значущості коефіцієнтів bi: 17
8) Побудова інтервалів довіри для знайдених параметрів bi : 18
9) Побудова інтервалів довіри: 18
Побудова довірчого інтервалу для індивідуального значення yn+k: 19
Побудова довірчого інтервалу для математичного сподівання yn+k: 19
10) Перевірка наявності мультиколінеарності методом Фаррара-Глобера: 20
11) Побудова t–статистики факторів і визначення мультиколінеарності: 21
12) Оцінка наявності гетероскедастичності 23
4) Висновки 29
5) Використана література 31

Вложенные файлы: 1 файл

Курсовая_Обласова.docx

— 302.11 Кб (Скачать файл)

За цими двома формулами можна  знайти точечну оцінку прогнозного значення.

 

Для більшої достовірності використовують інтервальну оцінку прогнозного значення.

Інтервальні оцінки будуються як для індивідуального значення   так і для його математичного сподівання .

 

  • Побудова  довірчого інтервалу для індивідуального значення yn+k:

 

Відомо, що дисперсія для прогнозного  значення yn+k буде мати вигляд:

 

 

Тоді інтервал довіри для прогнозного  значення yn+k має вигляд:

 

,

 

де 

.

 

Спираючись на наші початкові данні  ми маємо:

 

X`n+k = (1, 24, 2100, 1200)

ŷ n+k = 1097,86

 

D(yn+k ) = 12,99

1 086,44 < yn+k < 1 109,29

1 089,83 < yn+k < 1 105,9


 

  • Побудова довірчого інтервалу для математичного сподівання прогнозного значення yn+k:

 

Відомо, що дисперсія для математичного  сподівання прогнозного значення yn+k  буде мати вигляд:

 

 

Тоді інтервал довіри для математичного сподівання прогнозного значення має вигляд:

 

,

 

де 

 

Спираючись на наші початкові данні  ми маємо:

 

1 087,85 < М(yn+k ) < 1 107,88

1 090,82 < М(yn+k ) < 1 104,91


 

  1. Перевірка наявності мультиколінеарності методом Фаррара-Глобера:

 

При побудові структури регресії з  одного боку потрібно включити в регресію всі фактори які мають суттєвий статистичний вплив на показник, а  з іншого боку повинна бути виконана умова лінійної незалежності між  факторами, якщо існує лінійна залежність хоча б між двома факторами, то кажуть, що в системі присутнє явище  мультиколінеарності. Якщо між факторами і існує лінійна залежність то кажуть, що між цими факторами присутня строга мультиколінеарність. Враховуючи той факт, що фактори і – є випадковими величинами, то між ними існує приблизна лінійна залежність: , – деяке відхилення. В таких випадках кажуть, що між факторами існує нестрога мультиколінеарність. Якщо мультиколінеарність нестрога, то одержані оцінки регресії малонадійні. В цьому випадку незначні зміни вхідних даних приводять до значних змін оцінок параметрів.

 

Для обчислення загальної мультиколінеарності і мультиколінеарності між окремими факторами використовуються:

 – кореляційна матриця елементами якого є , де – це коефіцієнти кореляції між та факторами.

 

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

1

-0,914

-0,989

-0,967

-0,990

-0,939

-0,939

0,939

x2

-0,914

1

0,948

0,815

0,887

0,928

0,992

-0,980

x3

-0,989

0,948

1

0,947

0,981

0,968

0,969

-0,955

x4

-0,967

0,815

0,947

1

0,986

0,869

0,844

-0,844

x5

-0,990

0,887

0,981

0,986

1

0,918

0,909

-0,911

x6

-0,939

0,928

0,968

0,869

0,918

1

0,957

-0,942

x7

-0,939

0,992

0,969

0,844

0,909

0,957

1

-0,977

x8

0,939

-0,980

-0,955

-0,844

-0,911

-0,942

-0,977

1


 

Для дослідження загальної мультиколінеарності використовується критерій . Для цього розраховуємо число розрахункове:

 

 

Задаємо рівень значущості α і для ступенів вільності знаходимо табличне значення, яке залежить від α і k – .

k = 21

 

α = 0,01

,

α = 0,05

.

 

Якщо виконується умова  то можна стверджувати, що в системі присутнє явище мультиколінеарності.

Оскільки при  і при , то в системі присутнє явище мультиколінеарності.

 

  1. Побудова t–статистики для всіх факторів і визначення мультиколінеарності між ними:

 

Для того, щоб з’ясувати між  якими факторами присутнє явище  мультиколінеарності використовується так звана – статистика. На першому етапі знаходимо частинні коефіцієнти кореляції, які позначатимемо наступним чином:

 

 

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

1

-0,719

0,162

0,069

-0,047

-0,289

0,250

-0,554

x2

-0,719

1

-0,592

0,383

0,499

0,720

0,130

0,870

x3

0,162

-0,592

1

-0,866

-0,951

-0,975

-0,870

-0,824

x4

0,069

0,383

-0,866

1

0,718

0,815

0,847

0,564

x5

-0,047

0,499

-0,951

0,718

1

0,912

0,860

0,782

x6

-0,289

0,720

-0,975

0,815

0,912

1

0,757

0,888

x7

0,250

0,130

-0,870

0,847

0,860

0,757

1

0,507

x8

-0,554

0,870

-0,824

0,564

0,782

0,888

0,507

1


 

Після цього знаходимо  – статистику

 

 

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

 

2,311

0,367

0,154

0,106

0,676

0,577

1,487

x2

2,311

 

1,641

0,929

1,288

2,320

0,293

3,937

x3

0,367

1,641

 

3,878

6,857

9,818

3,950

3,252

x4

0,154

0,929

3,878

 

2,305

3,150

3,560

1,528

x5

0,106

1,288

6,857

2,305

 

4,979

3,774

2,805

x6

0,676

2,320

9,818

3,150

4,979

 

2,588

4,310

x7

0,577

0,293

3,950

3,560

3,774

2,588

 

1,315

x8

1,487

3,937

3,252

1,528

2,805

4,310

1,315

 

 

А) Для заданого рівня значимості =0,05 і степенем свободи =14-8-1=5 по таблицям розподілу критичних точок Стьюдента =2,571

 

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

 

2,311

0,367

0,154

0,106

0,676

0,577

1,487

x2

2,311

 

1,641

0,929

1,288

2,320

0,293

3,937

x3

0,367

1,641

 

3,878

6,857

9,818

3,950

3,252

x4

0,154

0,929

3,878

 

2,305

3,150

3,560

1,528

x5

0,106

1,288

6,857

2,305

 

4,979

3,774

2,805

x6

0,676

2,320

9,818

3,150

4,979

 

2,588

4,310

x7

0,577

0,293

3,950

3,560

3,774

2,588

 

1,315

x8

1,487

3,937

3,252

1,528

2,805

4,310

1,315

 

 

Отже, між  факторами 

  • 2 та 8,
  • 3 та 4,
  • 3 та 5,
  • 3 та 6,
  • 3 та 7,
  • 3 та 8,
  • 4 та 6,
  • 4 та 7,
  • 5 та 6,
  • 5 та 7,
  • 5 та 8,
  • 6 та 7,
  • 6 та 8

присутнє  явище мультиколінеарності.

 

Б) Для заданого рівня значимості = 0,01 і степенем свободи =14-8-1=5 по таблицям розподілу критичних точок Стьюдента = 4,032

 

 

 

 

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

 

2,311

0,367

0,154

0,106

0,676

0,577

1,487

x2

2,311

 

1,641

0,929

1,288

2,320

0,293

3,937

x3

0,367

1,641

 

3,878

6,857

9,818

3,950

3,252

x4

0,154

0,929

3,878

 

2,305

3,150

3,560

1,528

x5

0,106

1,288

6,857

2,305

 

4,979

3,774

2,805

x6

0,676

2,320

9,818

3,150

4,979

 

2,588

4,310

x7

0,577

0,293

3,950

3,560

3,774

2,588

 

1,315

x8

1,487

3,937

3,252

1,528

2,805

4,310

1,315

 

Информация о работе Анализ данных житлового фонду України у 1990-2009 роках