Автор работы: Пользователь скрыл имя, 19 Января 2014 в 16:26, задача
Задача 1. По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта). Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня. Требуется: 1.Найти корреляционную зависимость между фактором (х) и результирующим признаком (у). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии. 2. На одном графике построить исходные данные и теоретическую прямую. 3. Найти коэффициент вариации. 4. Найти коэффициент корреляции.
По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта).
Выполнить прогноз заработной
платы
при прогнозном значении среднедушевого
прожиточного минимума
, составляющем 107% от среднего уровня.
Номер региона |
Среднедушевой прожиточный
минимум в день одного трудоспособного,
руб., |
Среднедневная заработная
плата, руб., |
1 |
83 |
137 |
2 |
88 |
142 |
3 |
75 |
128 |
4 |
89 |
140 |
5 |
85 |
133 |
6 |
79 |
153 |
7 |
81 |
142 |
8 |
97 |
154 |
9 |
79 |
132 |
10 |
90 |
150 |
11 |
84 |
132 |
12 |
112 |
166 |
Требуется:
1.Найти корреляционную зависимость между фактором (х) и результирующим признаком (у). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. На одном графике построить исходные данные и теоретическую прямую.
3. Найти коэффициент вариации.
4. Найти коэффициент корреляции.
5. Найти коэффициент детерминации.
6. Оценить точность модели.
7. Представить схему дисперсионного анализа.
8. Проверить адекватность модели по F-критерию Фишера (α=0,05).
9. Оценить статистическую значимость коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
10. Найти доверительные интервалы для статистически значимых параметров модели.
11. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
12. Найти доверительный интервал для индивидуальных значений зависимой переменной.
13. Найти коэффициент эластичности.
Решение
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
83 |
137 |
11371 |
6889 |
18769 |
138,96 |
-1,96 |
3,86 |
1,43 |
2 |
88 |
142 |
12496 |
7744 |
20164 |
143,47 |
-1,47 |
2,15 |
1,03 |
3 |
75 |
128 |
9600 |
5625 |
16384 |
131,76 |
-3,76 |
14,13 |
2,94 |
4 |
89 |
140 |
12460 |
7921 |
19600 |
144,37 |
-4,37 |
19,08 |
3,12 |
5 |
85 |
133 |
11305 |
7225 |
17689 |
140,77 |
-7,77 |
60,30 |
5,84 |
6 |
79 |
153 |
12087 |
6241 |
23409 |
135,36 |
17,64 |
311,12 |
11,53 |
7 |
81 |
142 |
11502 |
6561 |
20164 |
137,16 |
4,84 |
23,40 |
3,41 |
8 |
97 |
154 |
14938 |
9409 |
23716 |
151,57 |
2,43 |
5,89 |
1,58 |
9 |
79 |
132 |
10428 |
6241 |
17424 |
135,36 |
-3,36 |
11,30 |
2,55 |
10 |
90 |
150 |
13500 |
8100 |
22500 |
145,27 |
4,73 |
22,38 |
3,15 |
11 |
84 |
132 |
11088 |
7056 |
17424 |
139,86 |
-7,86 |
61,85 |
5,96 |
12 |
112 |
166 |
18592 |
12544 |
27556 |
165,08 |
0,92 |
0,84 |
0,55 |
Итого |
1042 |
1709 |
149367 |
91556 |
244799 |
1709,00 |
0,00 |
536,31 |
43,08 |
Среднее значение |
86,83 |
142,42 |
12447,3 |
7629,67 |
20399,9 |
142,42 |
0,00 |
44,69 |
3,59 |
9,47 |
10,84 |
||||||||
89,64 |
117,41 |
Рассчитаем параметры линейного уравнения парной регрессии .
0,9;
64,21.
Получили уравнение: .
Коэффициент регрессии показывает, что с увеличением среднедушевого прожиточного минимума в день на одного трудоспособного на 1 руб. среднедневная заработная плата увеличивается на 0,9 руб.
2. На одном графике построить исходные данные и теоретическую прямую.
3. Найти коэффициент вариации.
Коэффициент ковариации находится по формуле 80,74.
4. Найти коэффициент корреляции.
Коэффициент корреляции можно найти по формуле 0,79.
Величина коэффициента корреляции указывает на сильную линейную корреляционную зависимость между признаками.
5. Найти коэффициент детерминации.
Коэффициент детерминации равен квадрату линейного коэффициента корреляции.
=0,62.
6. Оценить точность модели.
Точность модели оценим с помощью средней ошибки аппроксимации .
Вычислим прогнозные значения и относительные ошибки для различных значений факторной переменной х.
Заполним 7, 8, 9, 10 колонки расчетной таблицы.
не превосходит допустимых 7%, показывает хорошую точность модели.
7. Представить схему дисперсионного анализа.
Схема дисперсионного анализа имеет вид, представленный в таблице 1.1 ( – число наблюдений, – число параметров при переменной ).
Таблица 1.1
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Общая |
|||
Факторная |
|||
Остаточная |
Составим расчетную таблицу
1 |
3 |
7 |
5 |
9 |
7 |
||||
1 |
137 |
138,96 |
29,34 |
3,86 |
11,92 |
||||
2 |
142 |
143,47 |
0,17 |
2,15 |
1,10 |
||||
3 |
128 |
131,76 |
207,84 |
14,13 |
113,59 |
||||
4 |
140 |
144,37 |
5,84 |
19,08 |
3,81 |
||||
5 |
133 |
140,77 |
88,67 |
60,30 |
2,73 |
||||
6 |
153 |
135,36 |
112,01 |
311,12 |
49,78 |
||||
7 |
142 |
137,16 |
0,17 |
23,40 |
27,60 |
||||
8 |
154 |
151,57 |
134,17 |
5,89 |
83,85 |
||||
9 |
132 |
135,36 |
108,51 |
11,30 |
49,78 |
||||
10 |
150 |
145,27 |
57,51 |
22,38 |
8,13 |
||||
11 |
132 |
139,86 |
108,51 |
61,85 |
6,51 |
||||
12 |
166 |
165,08 |
556,17 |
0,84 |
513,80 |
||||
Итого |
1709 |
1709,00 |
1408,92 |
536,31 |
872,61 |
||||
Среднее значение |
142,42 |
142,42 |
117,41 |
44,69 |
72,72 |
||||
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы | ||||||
Общая |
117,41 |
12-1=11 |
10,67 | ||||||
Факторная |
872,61 |
1 |
872,61 | ||||||
Остаточная |
536,31 |
12-1-1 = 10 |
53,63 |
8. Проверить
адекватность модели по F-
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину -критерия Фишера:
.
16,27
Фактическое значение -критерия Фишера (1.9) сравнивается с табличным значением при уровне значимости и степенях свободы и . При этом, если фактическое значение -критерия больше табличного, то признается статистическая значимость уравнения в целом.
4,96.
Так как , то признается статистическая значимость уравнения в целом.
9. Оценить
статистическую значимость
Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:
=53,63.
0,22,
142,83,
0,20.
Фактические значения -статистик: 4,03, 0,45, 4,03
Табличное значение -критерия Стьюдента при и числе степеней свободы есть . Так как и , то признаем статистическую значимость коэффициента регрессии и показателя тесноты связи, , следовательно, свободный член уравнения регрессии статистически не значим.
10. Найти доверительные интервалы для статистически значимых параметров модели.
Доверительный интервал для коэффициента регрессии определяется как .коэффициента регрессии заключено в пределах
, тогда с вероятностью 0,95 значение
коэффициента регрессии
11. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
92,91 прогнозное значение факторной переменной;
147,89 прогноз.
- ошибка прогноза;
- средняя ошибка индивидуального прогнозируемого значения.
7,74;
17,25.
Тогда доверительный интервал прогноза
, .
13. Найти коэффициент эластичности.
Коэффициент эластичности находится по формуле
0,55
Остатки мы вычисляли в п. 7 (схема дисперсионного анализа).
Остаточная сумма квадратов 536,31.
Дисперсия остатков =53,63.
1. Первая предпосылка
МНК – случайный характер
Если на графике получена горизонтальная полоса остатков εi то они представляют собой случайные величины и МНК оправдан, теоретические значения yx независимы от εi.
При этом возможны следующие случаи, если εi зависит от yx:
- остатки εi не случайны;
- остатки εi не имеют постоянной дисперсии;
- остатки εi носят систематический характер.
2. Вторая предпосылка МНК –
нулевая средняя величина
Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xi. Если же график показывает зависимости εi от xi, то это свидетельствует о наличии систематической погрешности модели, причины которой могут быть разные.
Возможно, нарушена третья предпосылка МНК и дисперсия остатков не постоянна для каждого значения фактора xi. Может быть, неправильно подобрана модель.
Корреляция случайны остатков с факторными признаками, позволяет проводить корректировку модели, например, использовать кусочно-линейные модели.
3. В соответствии с третей
предпосылкой МНК требуется,
Проверка на наличие гетероскедастичности методом графического анализа остатков.
В этом случае по оси абсцисс откладываются значения объясняющей переменной Xi, а по оси ординат квадраты отклонения εi2.
Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
В нашем случае зависимость между отклонениями не наблюдается.