Автор работы: Пользователь скрыл имя, 20 Декабря 2010 в 18:04, контрольная работа
Цели контрольной работы: овладение навыками построения экономико-математических моделей статистическими методами; навыками объективного анализа надежности построенных моделей; навыками совершенствования моделей.
1. Цели выполнения контрольной работы 3
2. Алгоритм выполнения контрольной работы 3
3. Методы отбора факторов правых частей моделей 4
4. Сбор исходной информации 13
5. Построение модели 16
6. Анализ надежности модели 18
7. Повторное построение модели 25
8. Методы совершенствования моделей 25
Библиографический список 26
4. СБОР
ИСХОДНОЙ ИНФОРМАЦИИ
Задача этапа - собрать исходную отчетную информацию по всем отобранным на предыдущем этапе факторам X, а также по выбранному на втором этапе функции - Y, например, в помесячном разрезе. Минимальное число используемых при этом наблюдений определяется ориентировочной формулой математической статистики: 20-30 (N + 1), где N – количество факторов, включаемых в правую часть будущей модели. При этом следует «нейтрализовать» инфляцию для приведения некоторых стоимостных показателей разных временных периодов в сопоставимый вид. Кроме того, желательно с помощью манипулирования размерностью факторов исходную информацию по всем факторам формировать как информацию приблизительно одного порядка. С учетом учебных целей построения модели число наблюдений может быть существенно уменьшено (например, до 20-25).
В
табл.3 приведен пример [2] заполнения электронных
таблиц EXCEL исходной информацией для
построения модели коэффициента отнесения
затрат на электроэнергию (КЭ).
Исходная
информация для построения модели
Таблица
EXCEL |
A | B | C | G |
1 | ЭВ (X1) | Q (X2) | QОТ(X3) | КЭ (Y) |
2 | млн.кВт*ч в месяц | тыс. Гкал
в месяц |
% | - |
3 | ||||
4 | 40,126 | 192,56 | 68,48 | 0,3902 |
5 | 38,668 | 161,5 | 78,09 | 0,3851 |
6 | 39,888 | 127,5 | 97,11 | 0,4282 |
7 | 26,272 | 83,052 | 100 | 0,4236 |
8 | 16,344 | 60,7 | 98,7 | 0,406 |
9 | 6,49 | 33,6 | 100 | 0,3832 |
10 | 0,104 | 29 | 1,88 | 0,0535 |
11 | 0 | 35,7 | 0 | 0,0468 |
12 | 6,362 | 47,9 | 41,06 | 0,2161 |
13 | 18,085 | 98,3 | 67,28 | 0,3131 |
14 | 32,645 | 116 | 87,66 | 0,3922 |
15 | 32,678 | 147 | 71,3 | 0,3358 |
16 | 40,268 | 200,21 | 64,06 | 0,3234 |
17 | 35,814 | 156,65 | 74,92 | 0,3407 |
18 | 36,241 | 119,3 | 95,37 | 0,4159 |
19 | 27,317 | 84,42 | 99,38 | 0,4292 |
20 | 13,274 | 48,8 | 99,95 | 0,4084 |
21 | 1,348 | 23,4 | 29,65 | 0,1086 |
22 | 0 | 18,15 | 0 | 0,0609 |
23 | 0 | 21,06 | 0 | 0,0624 |
24 | 0,743 | 33,415 | 8,19 | 0,0456 |
25 | 17,36 | 59,2 | 89,09 | 0,3929 |
26 | 29,055 | 139,8 | 70,04 | 0,3311 |
27 | 38,757 | 182,105 | 73,26 | 0,3824 |
28 | 36,504 | 165,18 | 76,54 | 0,3758 |
29 | 31,641 | 164,8 | 66,56 | 0,3721 |
5. ПОСТРОЕНИЕ
МОДЕЛИ
Следует обработать подготовленный массив исходной информации с помощью компьютерной программы (например, EXCEL) [3, 4]:
В
результате получаем «Вывод
итогов»: параметры модели и целый ряд
критериев, позволяющих оценить ее надежность
с разных сторон. Для рассматриваемого
примера этот «Вывод
итогов» приведен в табл.4. Параметры
модели, т.е. числовой материал правой
части модели (в «чисто» математической
литературе они обычно называются «коэффициентами»),
для рассматриваемого примера для наглядности
затенены. В табл.4 фактор (или переменная)
Х1 –
это крайний левый столбец исходных данных
табл.3, т.е. фактор ЭВ.
Фактор Х2
- следующий, второй слева столбец исходных
данных, т.е. фактор Q и т.д. Далее:
Y – пересечение - это свободный член
модели. Таким образом, для нашего примера
получена модель:
КЭ = - 0,50485 + 0,127873ЭВ + 0,000787Q + 0,003297QОТ -
- 0,00638ТТ
- 0,00004ТК + 0,005994КПД
Модель и критерии ее надежности
Регрессионная статистика | |
Множественный R | 0,99192938 |
R-квадрат | 0,983923894 |
Нормированный R-квадрат | 0,981731698 |
Стандартная ошибка | 0,018989533 |
Наблюдения | 26 |
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 3 | 0,485547706 | 0,161849235 | 448,830207 | 7,11686E-20 |
Остаток | 22 | 0,007933252 | 0,000360602 | ||
Итого | 25 | 0,493480958 |
Коэффи-циенты | Стандарт-
ная ошибка |
t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | ||
Y-пересечение | 0,033403 | 0,01 | 2,893 | 0,008441 | 0,00946 | 0,06 | 0,00946 | 0,057 | |
Переменная X 1 | 0,000321 | 0 | 0,278 | 0,783766 | -0,00207 | 0 | -0,00207 | 0,003 | |
Переменная X 2 | 0,000406 | 0 | 1,651 | 0,112959 | -0,0001 | 0 | -0,0001 | 9E-04 | |
Переменная X 3 | 0,00346 | 0 | 17,63 | 1,83E-14 | 0,00305 | 0 | 0,00305 | 0,004 |
ВЫВОД ОСТАТКА | |||
Наблюдение | Предсказанное Y | Остатки | Стандартные остатки |
1 | 0,361361 | 0,03 | 1,619 |
2 | 0,381537 | 0 | 0,2 |
3 | 0,433936 | -0 | -0,322 |
4 | 0,421529 | 0 | 0,116 |
5 | 0,404776 | 0 | 0,069 |
6 | 0,395115 | -0 | -0,669 |
7 | 0,051711 | 0 | 0,1 |
8 | 0,047893 | -0 | -0,061 |
9 | 0,196949 | 0,02 | 1,075 |
10 | 0,311884 | 0 | 0,068 |
11 | 0,39425 | -0 | -0,115 |
12 | 0,350238 | -0 | -0,811 |
13 | 0,349219 | -0 | -1,449 |
14 | 0,367685 | -0 | -1,515 |
15 | 0,423418 | -0 | -0,422 |
16 | 0,420274 | 0,01 | 0,501 |
17 | 0,403286 | 0,01 | 0,287 |
18 | 0,14592 | -0 | -2,095 |
19 | 0,04077 | 0,02 | 1,13 |
20 | 0,041951 | 0,02 | 1,148 |
21 | 0,07554 | -0 | -1,681 |
22 | 0,371243 | 0,02 | 1,216 |
23 | 0,341795 | -0 | -0,6 |
24 | 0,373217 | 0,01 | 0,515 |
25 | 0,376974 | -0 | -0,066 |
26 | 0,34073 | 0,03 | 1,761 |
6. АНАЛИЗ
НАДЕЖНОСТИ МОДЕЛИ
Анализ полученной предварительной модели проводится на предмет соответствия ее параметров ряду статистических критериев. Этот анализ, как правило, приводит к выбрасыванию из правой части модели ряда слабо влияющих на величину затрат факторов. После этого модель следует построить заново. Основные шаги такого анализа:
В дальнейшем прогнозируемый показатель для общности будем обозначать как Y. Факторы правой части модели - как X1, X2, ….
Возможные пределы изменения коэффициента множественной корреляции (от 0 до +1) делятся «плавающей» границей на две области: несущественного (от 0 до приблизительно +0,75) и существенного (от приблизительно +0,75 до +1) влияния факторов правой части модели на Y. Местоположение этой границы зависит как от числа факторов, включаемых в модель, так и от количества используемых наблюдений факторов. Более точно эта граница может быть определена с помощью специальных критериев математической статистики. В моем примере коэффициент множественной корреляции достаточно высок (0.99192938), поэтому нет необходимости использовать данные критерии.
Если значение коэффициента множественной корреляции соответствует, напротив, несущественной области – это означает, что факторы, включенные исследователем в правую часть модели, в совокупности слабо влияют на Y. Практические следствия: в такой ситуации надо продолжить работу по выявлению факторов, которые действительно оказывают влияние на Y путем углубления теоретических поисков, проведения дополнительного экспертного опроса, проведения специальных экспериментов и т.д.;
R –квадрат 0,983923894
где n – число наблюдений;
N – число факторов правой части модели;
R – коэффициент множественной корреляции.
В моём примере значение этого коэффициента велико, что вполне достаточно выбранных наблюдений факторов (достаточно выборка).
Нормированный R-квадрат 0,981731698