Построение и анализ надежности моделей
Автор работы: Пользователь скрыл имя, 20 Декабря 2010 в 18:04, контрольная работа
Краткое описание
Цели контрольной работы: овладение навыками построения экономико-математических моделей статистическими методами; навыками объективного анализа надежности построенных моделей; навыками совершенствования моделей.
Содержание
1. Цели выполнения контрольной работы 3
2. Алгоритм выполнения контрольной работы 3
3. Методы отбора факторов правых частей моделей 4
4. Сбор исходной информации 13
5. Построение модели 16
6. Анализ надежности модели 18
7. Повторное построение модели 25
8. Методы совершенствования моделей 25
Библиографический список 26
Вложенные файлы: 1 файл
Курсовая мат методы1.doc
— 311.50 Кб (Скачать файл)4. СБОР
ИСХОДНОЙ ИНФОРМАЦИИ
Задача этапа - собрать исходную отчетную информацию по всем отобранным на предыдущем этапе факторам X, а также по выбранному на втором этапе функции - Y, например, в помесячном разрезе. Минимальное число используемых при этом наблюдений определяется ориентировочной формулой математической статистики: 20-30 (N + 1), где N – количество факторов, включаемых в правую часть будущей модели. При этом следует «нейтрализовать» инфляцию для приведения некоторых стоимостных показателей разных временных периодов в сопоставимый вид. Кроме того, желательно с помощью манипулирования размерностью факторов исходную информацию по всем факторам формировать как информацию приблизительно одного порядка. С учетом учебных целей построения модели число наблюдений может быть существенно уменьшено (например, до 20-25).
В
табл.3 приведен пример [2] заполнения электронных
таблиц EXCEL исходной информацией для
построения модели коэффициента отнесения
затрат на электроэнергию (КЭ).
Исходная
информация для построения модели
| Таблица
EXCEL |
A | B | C | G |
| 1 | ЭВ (X1) | Q (X2) | QОТ(X3) | КЭ (Y) |
| 2 | млн.кВт*ч в месяц | тыс. Гкал
в месяц |
% | - |
| 3 | ||||
| 4 | 40,126 | 192,56 | 68,48 | 0,3902 |
| 5 | 38,668 | 161,5 | 78,09 | 0,3851 |
| 6 | 39,888 | 127,5 | 97,11 | 0,4282 |
| 7 | 26,272 | 83,052 | 100 | 0,4236 |
| 8 | 16,344 | 60,7 | 98,7 | 0,406 |
| 9 | 6,49 | 33,6 | 100 | 0,3832 |
| 10 | 0,104 | 29 | 1,88 | 0,0535 |
| 11 | 0 | 35,7 | 0 | 0,0468 |
| 12 | 6,362 | 47,9 | 41,06 | 0,2161 |
| 13 | 18,085 | 98,3 | 67,28 | 0,3131 |
| 14 | 32,645 | 116 | 87,66 | 0,3922 |
| 15 | 32,678 | 147 | 71,3 | 0,3358 |
| 16 | 40,268 | 200,21 | 64,06 | 0,3234 |
| 17 | 35,814 | 156,65 | 74,92 | 0,3407 |
| 18 | 36,241 | 119,3 | 95,37 | 0,4159 |
| 19 | 27,317 | 84,42 | 99,38 | 0,4292 |
| 20 | 13,274 | 48,8 | 99,95 | 0,4084 |
| 21 | 1,348 | 23,4 | 29,65 | 0,1086 |
| 22 | 0 | 18,15 | 0 | 0,0609 |
| 23 | 0 | 21,06 | 0 | 0,0624 |
| 24 | 0,743 | 33,415 | 8,19 | 0,0456 |
| 25 | 17,36 | 59,2 | 89,09 | 0,3929 |
| 26 | 29,055 | 139,8 | 70,04 | 0,3311 |
| 27 | 38,757 | 182,105 | 73,26 | 0,3824 |
| 28 | 36,504 | 165,18 | 76,54 | 0,3758 |
| 29 | 31,641 | 164,8 | 66,56 | 0,3721 |
5. ПОСТРОЕНИЕ
МОДЕЛИ
Следует обработать подготовленный массив исходной информации с помощью компьютерной программы (например, EXCEL) [3, 4]:
- EXCEL;
- внести в рабочий лист исходную информацию: столбец с рядом наблюдений Y и столбцы рядов наблюдений всех X;
- Сервис/ Анализ данных/ Регрессия; ОК/;
- выделить «входной интервал Y», т.е. интервал наблюдений текущих затрат и «входной интервал X1, X2,….», т.е. интервал наблюдений факторов правой части модели;
- отметить «константа – ноль» (если для модели необходимо уравнение без свободного члена). В большинстве случаев это не требуется;
- отметить «уровень надежности», например 95%;
- предусмотреть показ программой «остатков»;
- предусмотреть показ «стандартных остатков»; ОК;
- выходная информация: 1) числовые параметры модели-зависимости затрат (Y) от отобранных факторов X; 2) критерии, позволяющие оценить надежность полученной модели;
В
результате получаем «Вывод
итогов»: параметры модели и целый ряд
критериев, позволяющих оценить ее надежность
с разных сторон. Для рассматриваемого
примера этот «Вывод
итогов» приведен в табл.4. Параметры
модели, т.е. числовой материал правой
части модели (в «чисто» математической
литературе они обычно называются «коэффициентами»),
для рассматриваемого примера для наглядности
затенены. В табл.4 фактор (или переменная)
Х1 –
это крайний левый столбец исходных данных
табл.3, т.е. фактор ЭВ.
Фактор Х2
- следующий, второй слева столбец исходных
данных, т.е. фактор Q и т.д. Далее:
Y – пересечение - это свободный член
модели. Таким образом, для нашего примера
получена модель:
КЭ = - 0,50485 + 0,127873ЭВ + 0,000787Q + 0,003297QОТ -
- 0,00638ТТ
- 0,00004ТК + 0,005994КПД
Модель и критерии ее надежности
| Регрессионная статистика | |
| Множественный R | 0,99192938 |
| R-квадрат | 0,983923894 |
| Нормированный R-квадрат | 0,981731698 |
| Стандартная ошибка | 0,018989533 |
| Наблюдения | 26 |
| Дисперсионный анализ | |||||
| df | SS | MS | F | Значимость F | |
| Регрессия | 3 | 0,485547706 | 0,161849235 | 448,830207 | 7,11686E-20 |
| Остаток | 22 | 0,007933252 | 0,000360602 | ||
| Итого | 25 | 0,493480958 |
| Коэффи-циенты | Стандарт-
ная ошибка |
t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | ||
| Y-пересечение | 0,033403 | 0,01 | 2,893 | 0,008441 | 0,00946 | 0,06 | 0,00946 | 0,057 | |
| Переменная X 1 | 0,000321 | 0 | 0,278 | 0,783766 | -0,00207 | 0 | -0,00207 | 0,003 | |
| Переменная X 2 | 0,000406 | 0 | 1,651 | 0,112959 | -0,0001 | 0 | -0,0001 | 9E-04 | |
| Переменная X 3 | 0,00346 | 0 | 17,63 | 1,83E-14 | 0,00305 | 0 | 0,00305 | 0,004 | |
| ВЫВОД ОСТАТКА | |||
| Наблюдение | Предсказанное Y | Остатки | Стандартные остатки |
| 1 | 0,361361 | 0,03 | 1,619 |
| 2 | 0,381537 | 0 | 0,2 |
| 3 | 0,433936 | -0 | -0,322 |
| 4 | 0,421529 | 0 | 0,116 |
| 5 | 0,404776 | 0 | 0,069 |
| 6 | 0,395115 | -0 | -0,669 |
| 7 | 0,051711 | 0 | 0,1 |
| 8 | 0,047893 | -0 | -0,061 |
| 9 | 0,196949 | 0,02 | 1,075 |
| 10 | 0,311884 | 0 | 0,068 |
| 11 | 0,39425 | -0 | -0,115 |
| 12 | 0,350238 | -0 | -0,811 |
| 13 | 0,349219 | -0 | -1,449 |
| 14 | 0,367685 | -0 | -1,515 |
| 15 | 0,423418 | -0 | -0,422 |
| 16 | 0,420274 | 0,01 | 0,501 |
| 17 | 0,403286 | 0,01 | 0,287 |
| 18 | 0,14592 | -0 | -2,095 |
| 19 | 0,04077 | 0,02 | 1,13 |
| 20 | 0,041951 | 0,02 | 1,148 |
| 21 | 0,07554 | -0 | -1,681 |
| 22 | 0,371243 | 0,02 | 1,216 |
| 23 | 0,341795 | -0 | -0,6 |
| 24 | 0,373217 | 0,01 | 0,515 |
| 25 | 0,376974 | -0 | -0,066 |
| 26 | 0,34073 | 0,03 | 1,761 |
6. АНАЛИЗ
НАДЕЖНОСТИ МОДЕЛИ
Анализ полученной предварительной модели проводится на предмет соответствия ее параметров ряду статистических критериев. Этот анализ, как правило, приводит к выбрасыванию из правой части модели ряда слабо влияющих на величину затрат факторов. После этого модель следует построить заново. Основные шаги такого анализа:
- первый критерий – коэффициент множественной корреляции («Множественный R»). Коэффициент оценивает силу совокупного влияния всех факторов правой части модели на прогнозируемый показатель (в нашем примере - КЭ).
В дальнейшем прогнозируемый показатель для общности будем обозначать как Y. Факторы правой части модели - как X1, X2, ….
Возможные пределы изменения коэффициента множественной корреляции (от 0 до +1) делятся «плавающей» границей на две области: несущественного (от 0 до приблизительно +0,75) и существенного (от приблизительно +0,75 до +1) влияния факторов правой части модели на Y. Местоположение этой границы зависит как от числа факторов, включаемых в модель, так и от количества используемых наблюдений факторов. Более точно эта граница может быть определена с помощью специальных критериев математической статистики. В моем примере коэффициент множественной корреляции достаточно высок (0.99192938), поэтому нет необходимости использовать данные критерии.
Если значение коэффициента множественной корреляции соответствует, напротив, несущественной области – это означает, что факторы, включенные исследователем в правую часть модели, в совокупности слабо влияют на Y. Практические следствия: в такой ситуации надо продолжить работу по выявлению факторов, которые действительно оказывают влияние на Y путем углубления теоретических поисков, проведения дополнительного экспертного опроса, проведения специальных экспериментов и т.д.;
- второй критерий – «R –квадрат» или «коэффициент детерминации», который позволяет ответить на вопрос: сколько процентов изменчивости Y объясняется изменчивостью всех X1, X2, ….? Критерий является модификацией первого критерия. Считается, что минимальный процент объясненной изменчивости Y – 60, т. е. коэффициент детерминации должен быть больше хотя бы 0,6. Если его значение меньше – следует предпринять те же действия, что и в случае не существенности коэффициента множественной корреляции;
- Проведя анализ полученного коэффициента, можно сделать вывод о том, что почти 99% изменчивости прогнозируемого показателя Кэ объясняется изменчивостью используемых факторов правой части модели.
R –квадрат 0,983923894
- третий критерий – «Нормированный R –квадрат». Этот критерий отвечает на вопрос: достаточна ли выборка (число выбранных наблюдений факторов)? Критерий сопоставляет число факторов правой части модели и число наблюдений. Если значение данного критерия меньше приблизительно 0,5, то следует соответственно увеличить число наблюдений. Смысл нормированного R – квадрата (R2НОРМ) ясен из формулы его расчета:
где n – число наблюдений;
N – число факторов правой части модели;
R – коэффициент множественной корреляции.
В моём примере значение этого коэффициента велико, что вполне достаточно выбранных наблюдений факторов (достаточно выборка).
Нормированный R-квадрат 0,981731698
- четвертый критерий – («критерий SS»). Критерий соотносит объясненную регрессию-(зависимость Y от Х1, Х2,…) с необъясненной. На примере соотношение цифр объясненной регрессии (0,485547706) и остатка (0,007933252) свидетельствует: необъясненная регрессия (остаток) – крайне незначительна. Она составляет менее одного процента (0,90%). Если бы остаток составлял существенную величину, тогда следовало бы или вернуться к поиску новых факторов, действительно влияющих на Y, или в соответствии с полученным соотношением объясненной регрессии и остатка в дальнейшем в такой же пропорции доверять результатам прогноза Y;
- пятый критерий – «критерий F», или критерий Фишера. Этот критерий представляет собой отношение двух дисперсий (мер разброса исходных данных ряда Y : в числителе - разброс их вокруг среднего по выборке значения, а в знаменателе – разброс их относительно рассчитываемых по модели значений. Критерий Фишера должен быть больше хотя бы 2,5. Иными словами, согласно этому критерию модель должна уменьшать разброс данных хотя бы в 2,5 раза по сравнению с ситуацией, когда плановый работник пользовался бы не прогнозными, а просто средними по выборке значениями Y. В нашем примере критерий F имеет достаточно высокое значение (448,830207). Критерий Фишера может подсказать необходимость перехода от линейной модели (все факторы-«иксы» в первой степени и нет произведений факторов) к более сложной модели, например, параболе второго порядка. При этом значение критерия Фишера, как правило, увеличивается;
- шестой критерий – «Стандартная ошибка» каждого из коэффициентов модели. Стандартная ошибка коэффициентов оценивает надежность полученных коэффициентов модели и измеряется в тех же единицах измерения, что и переменные (факторы) модели. Для такой оценки следует попарно сопоставить цифры столбца «Стандартная ошибка» со значениями самих коэффициентов, т.е. с цифрами соседнего слева столбца (по их абсолютному значению). Стандартная ошибка, конечно же, не должна превышать значения соответствующего коэффициента. Соотношение ошибки и коэффициента говорит о надежности или ненадежности коэффициента. Если это соотношение составляет, например, 30 и 70% - это, очевидно, крайний предел. Понятно, что чем меньше стандартная ошибка в сравнении со значением коэффициента, тем надежнее модель. Надежность модели в целом определяется совокупностью подобных соотношений. Если в некоторой модели с двумя факторами в правой части одно такое соотношение 1 и 99%, а другое – 45 и 65%, то такая модель, видимо, менее надежна, чем модель с соотношениями 5 - 95% и 10 и 90%;