Автор работы: Пользователь скрыл имя, 11 Июня 2014 в 07:19, контрольная работа
Задача. Построить модель связи между указанными факторами, проверить ее адекватность, осуществить точечный и интервальный прогноз.
На основе таблицы исходных данных построим поля рассеяния (рис.1.).
Анализируя построенное поле рассеяния, выдвигаем гипотезу о том, что зависимость среднесуточной производительности Y от стоимости основных производственных фондов X, описывается линейной моделью вида:
Задача. Построить модель связи между указанными факторами, проверить ее адекватность, осуществить точечный и интервальный прогноз.
Решение
i, номер |
X Стоимость основных производственных фондов, млн. руб. |
Y Среднесуточная производительность |
1 |
2,50 |
33,80 |
2 |
2,00 |
30,60 |
3 |
2,90 |
37,80 |
4 |
3,30 |
40,20 |
5 |
3,80 |
41,50 |
6 |
4,00 |
44,30 |
7 |
5,00 |
50,00 |
8 |
7,40 |
60,20 |
9 |
7,50 |
58,30 |
10 |
6,90 |
62,60 |
На основе таблицы исходных данных построим поля рассеяния (рис.1.).
Анализируя построенное поле рассеяния, выдвигаем гипотезу о том, что зависимость среднесуточной производительности Y от стоимости основных производственных фондов X, описывается линейной моделью вида:
,
где - неизвестные постоянные коэффициенты,
- случайная переменная, отражающая влияние неучтенных факторов и погрешностей измерений.
Рис.1 « Зависимость среднесуточной производительности от стоимости основных производственных фондов»
На основе таблицы 1.0. составим вспомогательную таблицу 1.1., необходимую для вычисления оценок неизвестных постоянных коэффициентов .
i |
|
|
|
|
1 |
2,50 |
33,80 |
84,5 |
6,25 |
2 |
2,00 |
30,60 |
61,2 |
4 |
3 |
2,90 |
37,80 |
109,62 |
8,41 |
4 |
3,30 |
40,20 |
132,66 |
10,89 |
5 |
3,80 |
41,50 |
157,7 |
14,44 |
6 |
4,00 |
44,30 |
177,2 |
16 |
7 |
5,00 |
50,00 |
250 |
25 |
8 |
7,40 |
60,20 |
445,48 |
54,76 |
9 |
7,50 |
58,30 |
437,25 |
56,25 |
10 |
6,90 |
62,60 |
431,94 |
47,61 |
Сумма |
45,3 |
459,3 |
2287,55 |
243,61 |
Для нахождения оценок используем следующие формулы:
Найдем среднее значение:
n = 10
Следовательно,
Таким образом, получим линейное уравнение: .
2. Коэффициент парной корреляции характеризует тесноту линейной зависимости между X и Y:
Подставим значения из таблицы 1.1., дополнив ее еще одним столбцом:
Таблица 2.1.
|
|
33,8 |
1142,44 |
30,6 |
936,36 |
37,8 |
1428,84 |
40,2 |
1616,04 |
41,5 |
1722,25 |
44,3 |
1962,49 |
50 |
2500 |
60,2 |
3624,04 |
58,3 |
3398,89 |
62,6 |
3918,76 |
Сумма = 459,3 |
Сумма = 22250,11 |
.
Используем t – критерий Стьюдента. Пусть уровень значимости равен 0,5: ,
для получаем:
Следовательно, гипотеза о существенном отличии коэффициента корреляции от нуля принимается и между X и Y существует тесная линейная связь, причем положительная.
Рассматривая другие варианты уровня значимости, получаем, что гипотеза принимается при любом уровне значимости.
Коэффициент парной корреляции связан с коэффициентом уравнения регрессии следующим образом:
где - выборочные среднеквадратические отклонения случайных переменных X и Y соответственно.
Рассчитаем дополнительно столбцы:
i |
|
|
|
|
|
|
1 |
2,5 |
33,8 |
-2,03 |
4,1209 |
-12,13 |
147,1369 |
2 |
2 |
30,6 |
-2,53 |
6,4009 |
-15,33 |
235,0089 |
3 |
2,9 |
37,8 |
-1,63 |
2,6569 |
-8,13 |
66,0969 |
4 |
3,3 |
40,2 |
-1,23 |
1,5129 |
-5,73 |
32,8329 |
5 |
3,8 |
41,5 |
-0,73 |
0,5329 |
-4,43 |
19,6249 |
6 |
4 |
44,3 |
-0,53 |
0,2809 |
-1,63 |
2,6569 |
7 |
5 |
50 |
0,47 |
0,2209 |
4,07 |
16,5649 |
8 |
7,4 |
60,2 |
2,87 |
8,2369 |
14,27 |
203,6329 |
9 |
7,5 |
58,3 |
2,97 |
8,8209 |
12,37 |
153,0169 |
10 |
6,9 |
62,6 |
2,37 |
5,6169 |
16,67 |
277,8889 |
Сумма |
45,3 |
459,3 |
0 |
38,401 |
0 |
1154,461 |
Среднее |
4,53 |
45,93 |
Результат совпал с полученным выше.
3.
1) Используя наблюдения над переменными X и Y, то есть , и уравнения регрессии , в котором коэффициенты неизвестны, составим отклонения
2) Определим сумму квадратов отклонений
, которая является некоторой функцией .
3) Оценки неизвестных параметров регрессионной модели , найдем из условия минимума функции .
4) Для нахождения точки минимума функции запишем необходимые условия экстремума .
5) Определим частные производные функции :
6) Необходимые условия экстремума запишем еще раз:
7) Система уравнений записывается в виде системы нормальных уравнений:
Найдем численные значения оценок . Обозначим
Тогда .
В матричном виде система запишется ,
ее решением будет вектор А:
где - матрица, обратная к матрице .
Используя вычисленные в таблице 1.2. значения, получим
Найдем матрицу , обратную к . Для этого сначала вычислим главный определитель:
Определим
матрицу алгебраических
где - минор элемента, стоящего на пересечении i-й строки и j-го столбца.
составим присоединенную матрицу
здесь , так как матрица симметрична.
Найдем вектор оценок А:
= - решение системы нормальных уравнений.
Отсюда, .
4.Составим таблицу:
i |
|
|
1,75 |
|
| |
1 |
2,5 |
33,8 |
13,475 |
34,995 |
-1,195 |
1,428025 |
2 |
2 |
30,6 |
10,78 |
32,3 |
-1,7 |
2,89 |
3 |
2,9 |
37,8 |
15,631 |
37,151 |
0,649 |
0,421201 |
4 |
3,3 |
40,2 |
17,787 |
39,307 |
0,893 |
0,797449 |
5 |
3,8 |
41,5 |
20,482 |
42,002 |
-0,502 |
0,252004 |
6 |
4 |
44,3 |
21,56 |
43,08 |
1,22 |
1,4884 |
7 |
5 |
50 |
26,95 |
48,47 |
1,53 |
2,3409 |
8 |
7,4 |
60,2 |
39,886 |
61,406 |
-1,206 |
1,454436 |
9 |
7,5 |
58,3 |
40,425 |
61,945 |
-3,645 |
13,28603 |
10 |
6,9 |
62,6 |
37,191 |
58,711 |
3,889 |
15,12432 |
Сумма |
45,3 |
459,3 |
244,167 |
459,3 |
0,0 |
39,48276 |
Среднее |
4,53 |
45,93 |
Рассчитаем коэффициент детерминации:
,
коэффициент детерминации ;
Следовательно, регрессия Y на Х объясняет 97 % колебаний значений Y. Это свидетельствует о значительном влиянии независимой переменной Х на зависимую переменную Y.
Проверим гипотезу о статической незначимости коэффициентов уравнения регрессии и показания тесноты связи.
Используем t – критерий Стьюдента. Он связан со статистикой Фишера:
. Рассчитаем фактическое значение F-статистики Фишера:
Для парной регрессии , поэтому
, где - коэффициент детерминации.
У нас
.
Так как , то гипотеза отвергается и признается статистическая значимость коэффициентов уравнения.
5. Рассчитаем коэффициент детерминации: (результат был получен выше), то есть вариация среднесуточной производительности на 98% объясняется вариацией стоимости основных производственных фондов.
Выдвинем гипотезу о статистической незначимости уравнения регрессии и показателя полноты связи.
Рассчитаем
фактическое значение F-
Табличное значение = 5,32 при уровне значимости равном 0,05. Для зависимости Х от Y выполняется неравенство < . Гипотеза отклоняется и признается статистическая значимость, надежность уравнения регрессии.
6. Построим дисперсионный анализ.
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
1115,63 |
1115,63 |
226,0 |
0,00 |
Остаток |
8 |
39,48 |
4,935 |
||
Итого |
9 |
1155,11 |
Разложение
суммы квадратов зависимой
= + , где
Составим таблицу:
Таблица 6.1.
|
|
-10,935 |
119,5742 |
-13,63 |
185,7769 |
-8,779 |
77,07084 |
-6,623 |
43,86413 |
-3,928 |
15,42918 |
-2,85 |
8,1225 |
2,54 |
6,4516 |
15,476 |
239,5066 |
16,015 |
256,4802 |
12,781 |
163,354 |
0,0 |
1115,63 |
MS – средние квадраты – это суммы квадратов, приходящихся на одну степень свободы df.
Для регрессии:
.
Для остатков:
.
Выборочное значение F-статистики Фишера определяется по формуле:
- это совпадает с результатами, полученными через коэффициент детерминации.
7. Точечный прогноз величины Y в точке есть
= , где =(1, ) – вектор независимого переменного, для которого определяется прогноз.
Пусть прогнозная точка = 8 млн. руб.
Определим вектор =(1;8).
Найдем точечный прогноз:
= 21,52 + 5,39 * 8 = 64,64.
Таким образом, получили, что при стоимости основных производственных фондов 8 млн. руб. получим среднесуточную производительность равную 64,64 тонн.
8. Для получения интервального прогноза рассчитаем доверительные интервалы для признака .
Вычислим значения всех параметров,
где - соответственно верхняя и нижняя границы доверительного интервала,
=(1, ) – вектор независимой переменной,
- квантиль распределения Стьюдента.
Информация о работе Контрольная работа по «Экономико-математическому моделированию»