Автор работы: Пользователь скрыл имя, 13 Марта 2014 в 07:14, контрольная работа
Задача 1. В базе данных магазина, торгующего подержанными автомобилями, содержится информация об их потребительских свойствах и ценах. Для анализа зависимости цены автомобиля Y от его возраста X1 и мощности двигателя X2 из базы данных выбраны сведения о 16 автомобилях. Эти сведения приведены в таблице 1.
На основе полученных в пунктах 1 и 2 статистических характеристик провести содержательный экономический анализ зависимости цены автомобиля от его возраста и мощности двигателя.
Изобразим графически линию регрессии и доверительную полосу вместе с полями рассеяний:
1.6. Рассчитаем точечный и интервальный прогноз среднего значения цены поступивших автомобилей возраста 3 года с помощью уравнения регрессии :
тыс. у.е. - точечный прогноз.
Интервальный прогноз среднего значения цены автомобиля найдем по формуле:
.
или , - интервальный прогноз среднего значения цены автомобиля.
Точечный и интервальный прогноз среднего значения цены поступивших автомобилей мощностью двигателя 165 л.с. помощью уравнения регрессии :
тыс. у.е. - точечный прогноз.
Интервальный прогноз среднего значения цены автомобиля найдем по формуле:
.
или , - интервальный прогноз среднего значения цены автомобиля.
2. Множественная зависимость
2.1.
Найдем оценки коэффициентов множественной линейной регрессионной модели с помощью метода наименьших квадратов.
По значениям, найденным в таблицах п.п.1.1-1.2. составим
; .
Найдем .
.
.
Следовательно, уравнение множественной линейной регрессии имеет вид: .
2.2.
Проверим статическую значимость параметров множественной регрессии с надежностью 0,9.
Данная проверка осуществляется с помощью статистик имеющих (при определенных предположениях на модель) t-распределение Стьюдента с (n – m – 1) степенями свободы, , zj – элемент матрицы .
Необходимые вычисления поместим в таблице:
i |
||||||
1 |
2,7 |
2,74 |
0,04 |
- |
- |
0,002 |
2 |
4,2 |
4,0 |
-0,2 |
0,04 |
0,06 |
0,0004 |
3 |
7,3 |
7,45 |
0,15 |
-0,2 |
0,12 |
0,02 |
4 |
0,7 |
1,05 |
0,35 |
0,15 |
0,04 |
0,12 |
5 |
2,9 |
3,25 |
0,35 |
0,35 |
0 |
0,12 |
6 |
3,9 |
4,35 |
0,45 |
0,35 |
0,01 |
0,2 |
7 |
3,9 |
3,55 |
-0,35 |
0,45 |
0,64 |
0,12 |
8 |
1,9 |
1,92 |
0,02 |
-0,35 |
0,14 |
0,0004 |
9 |
7,2 |
7,55 |
0,35 |
0,02 |
0,11 |
0,12 |
10 |
2,7 |
2,56 |
-0,14 |
0,35 |
0,24 |
0,02 |
11 |
7,1 |
7,1 |
0 |
-0,14 |
0,02 |
0 |
12 |
3,8 |
3,55 |
-0,25 |
0 |
0,06 |
0,02 |
13 |
4,8 |
4,5 |
-0,3 |
-0,25 |
0,003 |
0,09 |
14 |
2,3 |
2,25 |
-0,05 |
-0,3 |
0,06 |
0,03 |
15 |
3,6 |
3,5 |
-0,1 |
-0,05 |
0,003 |
0,01 |
16 |
0,5 |
0,26 |
-0,34 |
-0,1 |
0,06 |
0,12 |
59,5 |
1,57 |
0,97 |
Тогда ,
.
Рассчитаем, для каждого коэффициента - статистику:
Так как n = 16, m = 2 и надежность g = 0,9, то уровень значимости
a = 1 – g = 0,1, и квантиль распределения Стьюдента
= = .
Ввиду выполнения неравенств , , то все коэффициенты выборочного уравнения регрессии статистически значимы с надежностью 0,9. Следовательно, обе объясняющие переменные X1 и X2, а также свободный член имеют существенное влияние на результирующую переменную Y.
Качество уравнения множественной регрессии оценивает F-тест. Проверим гипотезу о статистической незначимости уравнения регрессии. Найдем коэффициент детерминации .
Рассчитаем коэффициент детерминации для регрессионной модели
Поскольку , то
Для проверки гипотезы Н0 используется следующая F-статистика: . Критерий адекватности (значимости) уравнения множественной регрессии уровня значимости a (или надежности g = 1 – a) имеет вид: F ³ F1 – a(n1, n2), где F1 – a(n1, n2) – квантиль порядка (1 – a) F-распределения Фишера с n1 = m и n2 = n – m – 1 степенями свободы.
Имеем:
F1 – a(n1; n2) = F1 – 0,1(2; 13) = F0,9(2; 13) =3,01.
Очевидно, неравенство F=323,621 ³ F1 – a(n1, n2)=3,01, выполнено. Следовательно, построенное уравнение регрессии значимо, т.е. исследуемая зависимая переменная Y достаточно хорошо описывается включенными в регрессионную модель объясняющими переменными X1 и X2.
2.3.
Найдем точечный и интервальный прогноз среднего значения цены поступивших автомобилей возраста 3 года и мощностью двигателя 165 л.с. с доверительной вероятностью 0,95.
По условию .
Точечный прогноз:
.
Прогнозируемое среднее значение yp результирующей переменной Y с надежностью (доверительной вероятностью) g накрывается интервалом с границами
, Se – выборочное стандартное отклонение остатков.
Имеем ; квантиль распределения Стьюдента ; дисперсия остатков рассчитана ранее и равна , так что .
Находим значение выражения:
,
Тогда границы доверительного интервала для среднего значения цены поступивших автомобилей равны:
– нижняя граница (тыс. у.е.);
– верхняя граница (тыс. руб.).
3. Экономическая интерпретация
3.
Так как и проверка значимости этого коэффициента показала его существенное отличие от нуля, то есть основания утверждать, что между переменными между У и существует достаточно тесная отрицательная зависимость, которая может быть отражена с помощью найденного уравнения регрессии: .
Коэффициент формально определяет цену нового автомобиля.
Коэффициент определяет, что при увеличении возраста на 1 год следует ожидать уменьшения цены автомобиля на 1,40 тыс. у.е.
Значимое значение говорит о том, что между переменными между У и существует тесная положительная линейная зависимость, которая может быть отражена с помощью найденного уравнения регрессии: .
Коэффициент показывает, что при увеличении мощности двигателя на 1 л.с. следует ожидать увеличения цены автомобиля на 0,10 тыс. у.е.
В результате зависимости цены от возраста и мощности двигателя автомобиля, получено уравнение множественной регрессии .
Коэффициент показывает, что при увеличении возраста на 1 год при неизменной мощности двигателя, следует ожидать уменьшения цены автомобиля на 1,11 тыс. у.е.
Коэффициент показывает, что при увеличении мощности двигателя на 1 л.с. при неизменном возрасте, следует ожидать увеличения цены автомобиля на 0,03 тыс. у.е.
Задача 2.
Таблица 2
Месяц, |
Объем
продаж (тыс.у.е.) |
1 |
441 |
2 |
448 |
3 |
518 |
4 |
572 |
5 |
601 |
6 |
637 |
7 |
591 |
8 |
653 |
9 |
719 |
10 |
691 |
11 |
730 |
12 |
744 |
В базе данных магазина также содержится информация об объеме ежемесячных продажах автомобилей за прошлый год, представленная в таблице 2.
1. Представить графически ежемесячные объемы продаж автомагазина. На основе визуального анализа построенного графика выдвинуть гипотезу о виде статистической зависимости объема продаж от времени и записать её математически.
2. Методом
наименьших квадратов найти
.
3. Для линии
тренда построить
4. С помощью
уравнения тренда найти
Решение.
1.
Представим графически ежемесячные объемы продаж магазина (на основе таблицы).
На основе визуального анализа построенного графика выдвигаем гипотезу о существовании линейного тренда вида:
2.
Найдем оценку уравнения линейного тренда с помощью метода наименьших квадратов.
Сформируем таблицу промежуточных расчетов.
t |
|||
1 |
441 |
441 |
1 |
2 |
448 |
896 |
4 |
3 |
518 |
1554 |
9 |
4 |
572 |
2288 |
16 |
5 |
601 |
3005 |
25 |
6 |
637 |
3822 |
36 |
7 |
591 |
4137 |
49 |
8 |
653 |
5224 |
64 |
9 |
719 |
6471 |
81 |
10 |
691 |
6910 |
100 |
11 |
730 |
8030 |
121 |
12 |
744 |
8928 |
144 |
Σ=78 |
Σ=7345 |
Σ=51706 |
Σ=650 |
По итогам таблицы находим:
,
Следовательно, уравнение тренда будет иметь вид: .
3.
Для расчета доверительных интервалов составим таблицу:
t |
|||||||
1 |
441 |
459,64 |
72,08 |
30,25 |
26,44 |
410,09 |
494,43 |
2 |
448 |
487,36 |
335,99 |
20,25 |
23,09 |
415,65 |
508,32 |
3 |
518 |
515,07 |
0,69 |
12,25 |
20,01 |
509,87 |
562,34 |
4 |
572 |
542,79 |
195,72 |
6,25 |
17,34 |
520,15 |
582,56 |
5 |
601 |
570,51 |
200,22 |
2,25 |
15,31 |
545,39 |
619,00 |
6 |
637 |
598,22 |
497,74 |
0,25 |
14,18 |
589,76 |
653,12 |
7 |
591 |
625,94 |
553,66 |
0,25 |
14,18 |
563,14 |
646,87 |
8 |
653 |
653,66 |
0,4 |
2,25 |
15,31 |
615,32 |
675,10 |
9 |
719 |
681,38 |
316,48 |
6,25 |
17,34 |
648,65 |
752,01 |
10 |
691 |
709,09 |
49,7 |
12,25 |
20,01 |
684,26 |
718,90 |
11 |
730 |
736,81 |
0,79 |
20,25 |
23,09 |
718,35 |
752,66 |
12 |
744 |
764,53 |
137,59 |
30,25 |
26,44 |
729,09 |
770,99 |
Σ |
7345 |
2361,06 |
143 |