Автор работы: Пользователь скрыл имя, 07 Декабря 2014 в 18:03, контрольная работа
Исследовать зависимость сменной добычи угля на одного рабочего от мощности пласта путем построения уравнения парной линейной регрессии
.
Для исходных данных, приведенных в задаче, требуется
Построить поле корреляции и сформулировать гипотезу о форме связи.
Найти оценки и параметров модели парной линейной регрессии и . Записать полученное уравнение регрессии.
Проверить значимость оценок коэффициентов и с надежностью 0,95 с помощью t-статистики Стьюдента и сделать выводы о значимости этих оценок.
МИНОБРНАУКИ РОССИИ
Федеральное
государственное бюджетное образовательное
учреждение
высшего профессионального образования
«Челябинский государственный университет»
(ФГБОУ ВПО «ЧелГУ»)
ЭКОНОМИЧЕСКИЙ ФАКУЛЬТЕТ
Контрольная работа
по дисциплине «Эконометрика»
Направление 080100 «Экономика»
Выполнила студентка
гр.ЭЭЗ – 301
Шергина К.В.
Проверил
Постников Е.А.
Челябинск 2014
Вариант №8.
Исходные данные
Имеются данные о сменной добычи угля Y (тонн) на одного рабочего и мощности пласта Х (в метрах).
№ |
X |
Y |
1 |
22,7 |
5,4 |
2 |
25,8 |
7,2 |
3 |
20,8 |
5,6+(N/2) = 9,6 |
4 |
15,2 |
6,4-(N/2) = 2,4 |
5 |
25,4 |
7,5 |
6 |
19,4 |
6,7 |
7 |
18,2 |
6,2 |
8 |
21,0 |
6,4 |
9 |
16,4 |
5,5 |
10 |
23,5 |
6,9 |
11 |
18,8 |
5,4 |
12 |
17,5 |
6,3 |
где N – номер варианта студента
Задание
Исследовать зависимость сменной добычи угля на одного рабочего от мощности пласта путем построения уравнения парной линейной регрессии
Для исходных данных, приведенных в задаче, требуется
1. Построим поле корреляции:
у
9,6
7,5
7,2
6,9
6,7
6,4
6,2
5,5
5,4
2,4
0 15,2 16,4 17,5 18,2 18,8 19,4 20,8 21 22,7 23,5 25,4 25,8 х
Предположим, что взаимосвязь между У (добыча угля на одного рабочего за смену, тонн) и Х (мощность пласта, метр) близка к линейной.
2. Найдем оценки и параметров модели парной линейной регрессии и . Уравнение регрессии:
Построение линейной регрессии сводится к оценке ее параметров a и b. Классический подход к оцениванию параметров линейной регрессии основа на методе наименьших квадратов, который позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного признака y от расчетных (теоретических) минимальна:
Вычисление МНК-оценок для парной линейной регрессии:
Решим задачу минимизации: .
Чтобы найти минимум этой функции необходимо вычислить производные по каждому из параметров a, b и приравнять их к нулю:
Þ Þ
Решая эту систему, найдем искомые значения оценок a, b:
Параметр называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Знак при коэффициенте регрессии показывает направление связи: при – связь прямая, а при – связь обратная.
Составим таблицу для расчетов необходимых значений.
σx2=– 2 = 426,606 - 20,3922 = 426,606 – 415,834 = 10,772
σy2=– 2 = 42,181 – 6,2922 = 42,181 – 39,589 = 2,592
= (131,362 – 20,392*6,292)/10,772 = 3,056/10,772 = 0,284
= 6,292 – 0,284*20,392 = 6,292 – 5,791 = 0,501
Уравнение регрессии:
= +*x = 0,501 + 0,284*22,7 = 0,501 + 6,447 = 6,948
№ |
X |
Y |
xy |
Х2 |
У2 |
( у - ŷ ) |
( у - ŷ )2 |
( X- |
( X- |
( y - ) |
( y - )2 | |
1 |
22,7 |
5,4 |
122,58 |
515,29 |
29,16 |
6,948 |
-1,548 |
2,396 |
2,308 |
5,327 |
-0,892 |
0,796 |
2 |
25,8 |
7,2 |
185,76 |
665,64 |
51,84 |
7,828 |
-0,628 |
0,394 |
5,408 |
29,246 |
0,908 |
0,824 |
3 |
20,8 |
9,6 |
199,68 |
432,64 |
92,16 |
6,408 |
3,192 |
10,189 |
0,408 |
0,166 |
3,308 |
10,943 |
4 |
15,2 |
2,4 |
36,48 |
231,04 |
5,76 |
4,818 |
-2,418 |
5,847 |
-5,192 |
26,957 |
-3,892 |
15,148 |
5 |
25,4 |
7,5 |
190,5 |
645,16 |
56,25 |
7,715 |
-0,215 |
0,046 |
5,008 |
25,080 |
1,208 |
1,459 |
6 |
19,4 |
6,7 |
129,98 |
376,36 |
44,89 |
6,011 |
0,689 |
0,477 |
-0,992 |
0,984 |
0,408 |
0,166 |
7 |
18,2 |
6,2 |
112,84 |
331,24 |
38,44 |
5,670 |
0,451 |
0,203 |
-2,192 |
4,805 |
-0,092 |
0,008 |
8 |
21 |
6,4 |
134,4 |
441 |
40,96 |
6,465 |
-0,065 |
0,004 |
0,608 |
0,371 |
0,108 |
0,012 |
9 |
16,4 |
5,5 |
90,2 |
268,96 |
30,25 |
5,159 |
0,341 |
0,116 |
-3,992 |
15,936 |
-0,792 |
0,627 |
10 |
23,5 |
6,9 |
162,15 |
552,25 |
47,61 |
7,175 |
-0,275 |
0,076 |
3,108 |
9,661 |
0,608 |
0,371 |
11 |
18,8 |
5,4 |
101,52 |
353,44 |
29,16 |
5,840 |
-0,440 |
0,194 |
-1,592 |
2,534 |
-0,892 |
0,796 |
12 |
17,5 |
6,3 |
110,25 |
306,25 |
39,69 |
5,471 |
0,829 |
0,687 |
-2,892 |
8,364 |
0,008 |
0,000 |
Итого |
244,7 |
75,5 |
1576,34 |
5119,27 |
506,17 |
75,508 |
-0,087 |
20,629 |
0,000 |
129,431 |
-0,004 |
31,15 |
Ср. знач. |
20,392 |
6,292 |
131,362 |
426,606 |
42,181 |
|||||||
10,772 |
2,592 |
|||||||||||
* |
3,282 |
1,7 |
3. Проверим значимость оценок коэффициентов и с надежностью 0,95 с помощью t-статистики Стьюдента и сделаем выводы о значимости этих оценок.
Значение t-статистики для коэффициента регрессии рассчитывается по формуле или .
= = = 2,607
= = = 0,0159 = 0,016
= = 0,192 = = 17,75
Уровень доверия q = 0,95
Уровень значимости γ = 1 - q = 1 – 0,95 = 0,05
Число степеней свободы n – 2 = 12 – 2 = 10
Критическое значение t-статистики (tкр) (определяется по таблицам распределения Стьюдента на основе γ и n – 2): tкр = 2,2281
Полученные фактические значения критерия Стьюдента сравниваются с табличными. Если оказывается, что tф > tтабл , то оценка соответствующего коэффициента статистически значима, в противном случае нет.
t = 0,192 < tкр = 2,2281 – оценка незначима;
t = 17,75 > tкр = 2,2281 – оценка значима.
4. Определим интервальные оценки коэффициентов и с надежностью 0,95.
Рассчитаем доверительные интервалы для параметров .
: , (0,501-2,228*2,607; 0,501+5,808)
: (- 5,307; 6,309) – очень низкая точность коэффициента.
: , (0,284-2,228*0,016; 0,284+0,036)
: (0,248; 0,32) – высокая точность коэффициента.
5. Проверим при уровне значимости 0,05 значимость уравнения регрессии с помощью F-статистики Фишера и сделаем выводы о значимости уравнения регрессии.
Уравнение значимо, если есть достаточно высокая вероятность того, что существует хотя бы один коэффициент, отличный от нуля.
Имеются альтернативные гипотезы:
H0: α=b=0 и
H1: α≠0Úb≠0≠0.
Если принимается гипотеза H0, то уравнение статистически незначимо. В противном случае говорят, что уравнение статистически значимо.
Процедура оценки значимости уравнения парной регрессии осуществляется следующим образом:
Рассчитывается значение F-статистики по формуле
F = (t )2 = (0,192)2 = 0,037
= (17,75)2 = 315,063
Fкр = 4,96, при уровне значимости γ = 0,05
F(t ) < Fкр – уравнение незначимо;
F(t ) > Fкр - уравнение значимо.
6. Определим коэффициент детерминации R2 и коэффициент корреляции rxy. Сделаем выводы о качестве уравнения регрессии.
= 1 – = 1 – 0,662 = 0,338
Коэффициент детерминации лежит в пределах 0 £ R2 £ 1.
Качество подгонки уравнения к статистическим данным низкое, т.к. значение коэффициента близко к 0. На 34% изменение y описывается полученным уравнением и влиянием переменной x.
7. Рассчитаем среднюю ошибку аппроксимации и сделаем выводы о качестве уравнения регрессии.
Оценку качества модели дает также средняя ошибка аппроксимации (средняя абсолютная процентная ошибка) – показывает в процентах среднее отклонение расчетных
значений зависимой переменной от фактических значений yi .
= * = * = 15,89*1,611 = 25,6%
Качество подгонки уравнения очень низкое.
8. Рассчитаем прогнозное значение результата , если значение фактора X будет больше на 15% его среднего уровня .
= 20,392 → х = 1,15*20,392 = 23,45
Прогнозное значение = 0,501+0,284*х = 0,501+0,284*23,45 = 7,16
Экономическая интерпретация: При изменении мощности пласта на 1 метр сменная добыча угля на одного рабочего увеличится на 0,284 тонны.