Автор работы: Пользователь скрыл имя, 11 Июня 2013 в 11:55, курсовая работа
Метою роботи є побудова регресійної моделі для аналізу даних житлового фонду України у 1990-2009 роках.
Дані взяті з офіційного сайту Держкомстату України http://ukrstat.gov.ua/
Перша частина присвячена побудові простої лінійної регресійної моделі та перевірці її на адекватність та значущість одержаних значень b0 та b1.
Друга частина присвячена побудові багатовимірної лінійної регресійної моделі та перевірці її на мультиколінеарність, адекватність, значущість одержаних коефіцієнтів bі та гомоскедастичність.
1) Вступ 3
2) Постановка задачі та початкові дані 4
1) Дано: 4
2) Потрібно: 4
3) Розв’язок 6
І) Побудова та перевірка простої лінійної регресійної моделі: 6
1) Побудова простої лінійної регресійної моделі: 6
2) Побудова графіку простої лінійної регресійної моделі: 7
3) Знаходження коефіцієнтів кореляції: 8
4) Перевірка регресійної модель на адекватність: 8
5) Знаходження дисперсії для значень b0 та b1: 9
6) Перевірка значущості одержаних значень b0 та b1: 9
7) Побудова інтервалів довіри для β0 та β1: 10
8) Побудова інтервалів довіри для прогнозованих значень: 11
II) Побудова та перевірка багатовимірної регресійної моделі: 12
1) Аналіз та вибір факторів: 12
2) Математично-статистичний аналіз на мультиколінеарність: 12
3) Оцінка невідомих параметрів b0…bm.: 13
4) Перевірка на адекватність за допомогою критерія Фішера: 14
5) Побудова множинного коефіцієнта кореляції: 15
6) Побудова варіаційно-коваріаційної матриці параметрів: 16
7) Перевірка значущості коефіцієнтів bi: 17
8) Побудова інтервалів довіри для знайдених параметрів bi : 18
9) Побудова інтервалів довіри: 18
Побудова довірчого інтервалу для індивідуального значення yn+k: 19
Побудова довірчого інтервалу для математичного сподівання yn+k: 19
10) Перевірка наявності мультиколінеарності методом Фаррара-Глобера: 20
11) Побудова t–статистики факторів і визначення мультиколінеарності: 21
12) Оцінка наявності гетероскедастичності 23
4) Висновки 29
5) Використана література 31
За цими двома формулами можна знайти точечну оцінку прогнозного значення.
Для більшої достовірності
Інтервальні оцінки будуються як для індивідуального значення так і для його математичного сподівання .
Відомо, що дисперсія для прогнозного значення yn+k буде мати вигляд:
Тоді інтервал довіри для прогнозного значення yn+k має вигляд:
де
Спираючись на наші початкові данні ми маємо:
X`n+k = (1, 24, 2100, 1200)
ŷ n+k = 1097,86
D(yn+k ) = 12,99
|
|
1 086,44 < yn+k < 1 109,29 |
1 089,83 < yn+k < 1 105,9 |
Відомо, що дисперсія для математичного сподівання прогнозного значення yn+k буде мати вигляд:
Тоді інтервал довіри для математичного сподівання прогнозного значення має вигляд:
де
Спираючись на наші початкові данні ми маємо:
|
|
1 087,85 < М(yn+k ) < 1 107,88 |
1 090,82 < М(yn+k ) < 1 104,91 |
При побудові структури регресії з одного боку потрібно включити в регресію всі фактори які мають суттєвий статистичний вплив на показник, а з іншого боку повинна бути виконана умова лінійної незалежності між факторами, якщо існує лінійна залежність хоча б між двома факторами, то кажуть, що в системі присутнє явище мультиколінеарності. Якщо між факторами і існує лінійна залежність то кажуть, що між цими факторами присутня строга мультиколінеарність. Враховуючи той факт, що фактори і – є випадковими величинами, то між ними існує приблизна лінійна залежність: , – деяке відхилення. В таких випадках кажуть, що між факторами існує нестрога мультиколінеарність. Якщо мультиколінеарність нестрога, то одержані оцінки регресії малонадійні. В цьому випадку незначні зміни вхідних даних приводять до значних змін оцінок параметрів.
Для обчислення загальної мультиколінеарності і мультиколінеарності між окремими факторами використовуються:
– кореляційна матриця елементами якого є , де – це коефіцієнти кореляції між та факторами.
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 | |
x1 |
1 |
-0,914 |
-0,989 |
-0,967 |
-0,990 |
-0,939 |
-0,939 |
0,939 |
x2 |
-0,914 |
1 |
0,948 |
0,815 |
0,887 |
0,928 |
0,992 |
-0,980 |
x3 |
-0,989 |
0,948 |
1 |
0,947 |
0,981 |
0,968 |
0,969 |
-0,955 |
x4 |
-0,967 |
0,815 |
0,947 |
1 |
0,986 |
0,869 |
0,844 |
-0,844 |
x5 |
-0,990 |
0,887 |
0,981 |
0,986 |
1 |
0,918 |
0,909 |
-0,911 |
x6 |
-0,939 |
0,928 |
0,968 |
0,869 |
0,918 |
1 |
0,957 |
-0,942 |
x7 |
-0,939 |
0,992 |
0,969 |
0,844 |
0,909 |
0,957 |
1 |
-0,977 |
x8 |
0,939 |
-0,980 |
-0,955 |
-0,844 |
-0,911 |
-0,942 |
-0,977 |
1 |
Для дослідження загальної
Задаємо рівень значущості α і для ступенів вільності знаходимо табличне значення, яке залежить від α і k – .
k = 21
α = 0,01
,
α = 0,05
.
Якщо виконується умова то можна стверджувати, що в системі присутнє явище мультиколінеарності.
Оскільки при і при , то в системі присутнє явище мультиколінеарності.
Для того, щоб з’ясувати між якими факторами присутнє явище мультиколінеарності використовується так звана – статистика. На першому етапі знаходимо частинні коефіцієнти кореляції, які позначатимемо наступним чином:
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 | |
x1 |
1 |
-0,719 |
0,162 |
0,069 |
-0,047 |
-0,289 |
0,250 |
-0,554 |
x2 |
-0,719 |
1 |
-0,592 |
0,383 |
0,499 |
0,720 |
0,130 |
0,870 |
x3 |
0,162 |
-0,592 |
1 |
-0,866 |
-0,951 |
-0,975 |
-0,870 |
-0,824 |
x4 |
0,069 |
0,383 |
-0,866 |
1 |
0,718 |
0,815 |
0,847 |
0,564 |
x5 |
-0,047 |
0,499 |
-0,951 |
0,718 |
1 |
0,912 |
0,860 |
0,782 |
x6 |
-0,289 |
0,720 |
-0,975 |
0,815 |
0,912 |
1 |
0,757 |
0,888 |
x7 |
0,250 |
0,130 |
-0,870 |
0,847 |
0,860 |
0,757 |
1 |
0,507 |
x8 |
-0,554 |
0,870 |
-0,824 |
0,564 |
0,782 |
0,888 |
0,507 |
1 |
Після цього знаходимо – статистику
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 | |
x1 |
2,311 |
0,367 |
0,154 |
0,106 |
0,676 |
0,577 |
1,487 | |
x2 |
2,311 |
1,641 |
0,929 |
1,288 |
2,320 |
0,293 |
3,937 | |
x3 |
0,367 |
1,641 |
3,878 |
6,857 |
9,818 |
3,950 |
3,252 | |
x4 |
0,154 |
0,929 |
3,878 |
2,305 |
3,150 |
3,560 |
1,528 | |
x5 |
0,106 |
1,288 |
6,857 |
2,305 |
4,979 |
3,774 |
2,805 | |
x6 |
0,676 |
2,320 |
9,818 |
3,150 |
4,979 |
2,588 |
4,310 | |
x7 |
0,577 |
0,293 |
3,950 |
3,560 |
3,774 |
2,588 |
1,315 | |
x8 |
1,487 |
3,937 |
3,252 |
1,528 |
2,805 |
4,310 |
1,315 |
А) Для заданого рівня значимості =0,05 і степенем свободи =14-8-1=5 по таблицям розподілу критичних точок Стьюдента =2,571
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 | |
x1 |
2,311 |
0,367 |
0,154 |
0,106 |
0,676 |
0,577 |
1,487 | |
x2 |
2,311 |
1,641 |
0,929 |
1,288 |
2,320 |
0,293 |
3,937 | |
x3 |
0,367 |
1,641 |
3,878 |
6,857 |
9,818 |
3,950 |
3,252 | |
x4 |
0,154 |
0,929 |
3,878 |
2,305 |
3,150 |
3,560 |
1,528 | |
x5 |
0,106 |
1,288 |
6,857 |
2,305 |
4,979 |
3,774 |
2,805 | |
x6 |
0,676 |
2,320 |
9,818 |
3,150 |
4,979 |
2,588 |
4,310 | |
x7 |
0,577 |
0,293 |
3,950 |
3,560 |
3,774 |
2,588 |
1,315 | |
x8 |
1,487 |
3,937 |
3,252 |
1,528 |
2,805 |
4,310 |
1,315 |
Отже, між факторами
|
|
присутнє явище мультиколінеарності.
Б) Для заданого рівня значимості = 0,01 і степенем свободи =14-8-1=5 по таблицям розподілу критичних точок Стьюдента = 4,032
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 | |
x1 |
2,311 |
0,367 |
0,154 |
0,106 |
0,676 |
0,577 |
1,487 | |
x2 |
2,311 |
1,641 |
0,929 |
1,288 |
2,320 |
0,293 |
3,937 | |
x3 |
0,367 |
1,641 |
3,878 |
6,857 |
9,818 |
3,950 |
3,252 | |
x4 |
0,154 |
0,929 |
3,878 |
2,305 |
3,150 |
3,560 |
1,528 | |
x5 |
0,106 |
1,288 |
6,857 |
2,305 |
4,979 |
3,774 |
2,805 | |
x6 |
0,676 |
2,320 |
9,818 |
3,150 |
4,979 |
2,588 |
4,310 | |
x7 |
0,577 |
0,293 |
3,950 |
3,560 |
3,774 |
2,588 |
1,315 | |
x8 |
1,487 |
3,937 |
3,252 |
1,528 |
2,805 |
4,310 |
1,315 |
Информация о работе Анализ данных житлового фонду України у 1990-2009 роках