Построение и анализ надежности моделей

Автор работы: Пользователь скрыл имя, 20 Декабря 2010 в 18:04, контрольная работа

Краткое описание

Цели контрольной работы: овладение навыками построения экономико-математических моделей статистическими методами; навыками объективного анализа надежности построенных моделей; навыками совершенствования моделей.

Содержание

1. Цели выполнения контрольной работы 3
2. Алгоритм выполнения контрольной работы 3
3. Методы отбора факторов правых частей моделей 4
4. Сбор исходной информации 13
5. Построение модели 16
6. Анализ надежности модели 18
7. Повторное построение модели 25
8. Методы совершенствования моделей 25
Библиографический список 26

Вложенные файлы: 1 файл

Курсовая мат методы1.doc

— 311.50 Кб (Скачать файл)

      4. СБОР  ИСХОДНОЙ ИНФОРМАЦИИ 

      Задача  этапа - собрать исходную отчетную информацию по всем отобранным на предыдущем этапе факторам  X,  а также по выбранному на втором этапе  функции - Y,  например, в помесячном разрезе. Минимальное число используемых при этом наблюдений определяется ориентировочной формулой математической статистики:  20-30 (N + 1), где N – количество факторов, включаемых в правую часть будущей модели. При этом следует «нейтрализовать» инфляцию для приведения некоторых стоимостных показателей разных временных периодов в сопоставимый вид. Кроме того, желательно с помощью манипулирования размерностью факторов исходную информацию по всем факторам формировать как информацию приблизительно одного порядка. С учетом учебных целей построения модели число наблюдений может быть существенно уменьшено (например, до 20-25).

      В табл.3 приведен пример [2] заполнения электронных таблиц EXCEL исходной информацией для построения модели коэффициента отнесения затрат на электроэнергию (КЭ). 

Исходная  информация для построения модели 

 
 
 

   

    

Таблица

EXCEL

A B C G
1 ЭВ (X1) Q  (X2) QОТ(X3) КЭ (Y)
2 млн.кВт*ч  в месяц тыс. Гкал

в месяц

% -
3
4 40,126 192,56 68,48 0,3902
5 38,668 161,5 78,09 0,3851
6 39,888 127,5 97,11 0,4282
7 26,272 83,052 100 0,4236
8 16,344 60,7 98,7 0,406
9 6,49 33,6 100 0,3832
10 0,104 29 1,88 0,0535
11 0 35,7 0 0,0468
12 6,362 47,9 41,06 0,2161
13 18,085 98,3 67,28 0,3131
14 32,645 116 87,66 0,3922
15 32,678 147 71,3 0,3358
16 40,268 200,21 64,06 0,3234
17 35,814 156,65 74,92 0,3407
18 36,241 119,3 95,37 0,4159
19 27,317 84,42 99,38 0,4292
20 13,274 48,8 99,95 0,4084
21 1,348 23,4 29,65 0,1086
22 0 18,15 0 0,0609
23 0 21,06 0 0,0624
24 0,743 33,415 8,19 0,0456
25 17,36 59,2 89,09 0,3929
26 29,055 139,8 70,04 0,3311
27 38,757 182,105 73,26 0,3824
28 36,504 165,18 76,54 0,3758
29 31,641 164,8 66,56 0,3721

        

5. ПОСТРОЕНИЕ  МОДЕЛИ 

       Следует обработать подготовленный массив исходной информации с помощью компьютерной программы (например, EXCEL) [3, 4]:

      • EXCEL;
      • внести в рабочий лист исходную информацию: столбец с рядом наблюдений  и столбцы рядов наблюдений всех  X;
      • Сервис/ Анализ данных/ Регрессия; ОК/;
      • выделить «входной интервал Y», т.е. интервал наблюдений текущих затрат и «входной интервал X1, X2,….», т.е. интервал наблюдений факторов правой части модели;
      • отметить «константа – ноль» (если для модели необходимо уравнение без свободного члена). В большинстве случаев это не требуется;
      • отметить «уровень надежности», например 95%;
      • предусмотреть показ программой «остатков»;
      • предусмотреть показ «стандартных остатков»; ОК;
      • выходная информация: 1) числовые параметры модели-зависимости затрат  (Y)  от отобранных факторов  X; 2) критерии, позволяющие оценить надежность полученной модели;

      В результате получаем «Вывод итогов»: параметры модели и целый ряд критериев, позволяющих оценить ее надежность с разных сторон. Для рассматриваемого примера этот «Вывод итогов» приведен в табл.4. Параметры модели, т.е. числовой материал правой части модели (в «чисто» математической литературе они обычно называются «коэффициентами»), для рассматриваемого примера для наглядности затенены. В табл.4 фактор (или переменная Х1 это крайний левый столбец исходных данных табл.3, т.е. фактор  ЭВ. Фактор  Х2 - следующий, второй слева столбец исходных данных, т.е. фактор  Q и т.д. Далее: Y – пересечение - это свободный член модели. Таким образом, для нашего примера получена модель: 

КЭ = - 0,50485 + 0,127873ЭВ + 0,000787Q + 0,003297QОТ -

           - 0,00638ТТ  - 0,00004ТК + 0,005994КПД  
 
 
 
 
 
 
 
 
 

Модель  и критерии ее надежности

Регрессионная статистика
Множественный R 0,99192938
R-квадрат 0,983923894
Нормированный R-квадрат 0,981731698
Стандартная ошибка 0,018989533
Наблюдения 26
 
 
 
 
 
Дисперсионный анализ          
  df SS MS F Значимость F
Регрессия 3 0,485547706 0,161849235 448,830207 7,11686E-20
Остаток 22 0,007933252 0,000360602    
Итого 25 0,493480958      
  Коэффи-циенты Стандарт-

ная ошибка

t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 0,033403 0,01 2,893 0,008441 0,00946 0,06 0,00946 0,057
Переменная X 1 0,000321 0 0,278 0,783766 -0,00207 0 -0,00207 0,003
Переменная X 2 0,000406 0 1,651 0,112959 -0,0001 0 -0,0001 9E-04
Переменная X 3 0,00346 0 17,63 1,83E-14 0,00305 0 0,00305 0,004
 
ВЫВОД ОСТАТКА      
       
Наблюдение Предсказанное Y Остатки Стандартные остатки
1 0,361361 0,03 1,619
2 0,381537 0 0,2
3 0,433936 -0 -0,322
4 0,421529 0 0,116
5 0,404776 0 0,069
6 0,395115 -0 -0,669
7 0,051711 0 0,1
8 0,047893 -0 -0,061
9 0,196949 0,02 1,075
10 0,311884 0 0,068
11 0,39425 -0 -0,115
12 0,350238 -0 -0,811
13 0,349219 -0 -1,449
14 0,367685 -0 -1,515
15 0,423418 -0 -0,422
16 0,420274 0,01 0,501
17 0,403286 0,01 0,287
18 0,14592 -0 -2,095
19 0,04077 0,02 1,13
20 0,041951 0,02 1,148
21 0,07554 -0 -1,681
22 0,371243 0,02 1,216
23 0,341795 -0 -0,6
24 0,373217 0,01 0,515
25 0,376974 -0 -0,066
26 0,34073 0,03 1,761
 

6. АНАЛИЗ  НАДЕЖНОСТИ МОДЕЛИ 

       Анализ полученной предварительной модели проводится на предмет соответствия ее параметров ряду статистических критериев. Этот анализ, как правило, приводит к выбрасыванию из правой части модели ряда слабо влияющих на величину затрат факторов. После этого модель следует построить заново. Основные шаги такого анализа:

      • первый критерий – коэффициент множественной корреляции («Множественный R»). Коэффициент оценивает силу совокупного влияния всех факторов правой части модели на прогнозируемый показатель (в нашем примере -  КЭ).

        В дальнейшем прогнозируемый показатель для общности будем обозначать как  Y. Факторы правой части модели - как  X1X2, ….

        Возможные пределы изменения коэффициента множественной корреляции (от  0  до  +1)  делятся «плавающей»  границей на две области: несущественного  (от  0  до приблизительно  +0,75) и существенного (от  приблизительно +0,75  до +1) влияния факторов правой части модели на  Y. Местоположение этой границы зависит как от числа факторов, включаемых в модель, так и от количества используемых наблюдений факторов. Более точно эта граница может быть определена с помощью специальных критериев математической статистики. В моем примере коэффициент множественной корреляции достаточно высок (0.99192938), поэтому нет необходимости использовать данные критерии.

        Если  значение коэффициента множественной  корреляции соответствует, напротив, несущественной области – это означает, что факторы, включенные исследователем в правую часть модели, в совокупности слабо влияют на  Y. Практические следствия: в такой ситуации надо продолжить работу по выявлению факторов, которые действительно оказывают влияние на  Y  путем углубления теоретических поисков, проведения дополнительного экспертного опроса, проведения специальных экспериментов и т.д.;

      • второй критерий – «R –квадрат» или «коэффициент детерминации», который позволяет ответить на вопрос: сколько процентов изменчивости  объясняется изменчивостью всех  X1X2, ….? Критерий является модификацией первого критерия. Считается, что минимальный процент объясненной изменчивости  Y – 60, т. е. коэффициент детерминации должен быть больше хотя бы  0,6. Если его значение меньше – следует предпринять те же действия, что и в случае не существенности коэффициента множественной корреляции;
      • Проведя анализ полученного коэффициента, можно сделать вывод о том, что почти 99% изменчивости прогнозируемого показателя Кэ объясняется изменчивостью используемых факторов правой части модели.

                          R –квадрат 0,983923894

      • третий критерий – «Нормированный  R –квадрат». Этот критерий отвечает на вопрос: достаточна ли выборка (число выбранных наблюдений факторов)? Критерий сопоставляет число факторов правой части модели и число наблюдений. Если значение данного критерия меньше приблизительно 0,5, то следует соответственно увеличить число наблюдений. Смысл нормированного  R – квадрата  (R2НОРМ) ясен из формулы его расчета:
 

         

                где  n – число наблюдений;

                      N – число факторов правой части модели;

                      R – коэффициент множественной корреляции. 

                           В моём примере значение этого коэффициента  велико, что   вполне достаточно выбранных наблюдений факторов (достаточно выборка).

                           Нормированный R-квадрат 0,981731698

      •       четвертый критерий – («критерий  SS»). Критерий соотносит объясненную регрессию-(зависимость  Y  от  Х1, Х2,…) с необъясненной. На примере соотношение цифр объясненной регрессии (0,485547706) и остатка (0,007933252) свидетельствует: необъясненная регрессия (остаток) – крайне незначительна. Она составляет менее одного процента (0,90%).  Если бы остаток составлял существенную величину, тогда следовало бы или вернуться к поиску новых факторов, действительно влияющих на  Y, или в соответствии с полученным соотношением объясненной регрессии и остатка в дальнейшем в такой же пропорции доверять результатам прогноза  Y;
      • пятый критерий – «критерий F», или критерий Фишера. Этот критерий представляет собой отношение двух дисперсий (мер разброса исходных данных ряда  Y : в числителе - разброс их вокруг среднего по выборке значения, а в знаменателе – разброс их относительно рассчитываемых по модели значений. Критерий Фишера должен быть больше хотя бы  2,5. Иными словами, согласно этому критерию модель должна уменьшать разброс данных хотя бы в 2,5 раза по сравнению с ситуацией, когда плановый работник пользовался бы не прогнозными, а просто средними по выборке значениями  Y. В нашем примере критерий  F имеет достаточно высокое значение (448,830207). Критерий Фишера может подсказать необходимость перехода от линейной модели (все факторы-«иксы» в первой степени и нет произведений факторов) к более сложной модели, например, параболе второго порядка. При этом значение критерия Фишера, как правило, увеличивается;
      •    шестой критерий – «Стандартная ошибка» каждого из коэффициентов модели. Стандартная ошибка коэффициентов оценивает надежность полученных коэффициентов модели и измеряется в тех же единицах измерения, что и переменные (факторы) модели. Для такой оценки следует попарно сопоставить цифры столбца «Стандартная ошибка» со значениями самих коэффициентов, т.е. с цифрами соседнего слева столбца (по их абсолютному значению). Стандартная ошибка, конечно же, не должна превышать значения соответствующего коэффициента. Соотношение ошибки и коэффициента говорит о надежности или ненадежности коэффициента. Если это соотношение составляет, например, 30 и 70% - это, очевидно, крайний предел. Понятно, что чем меньше стандартная ошибка в сравнении со значением коэффициента, тем надежнее модель. Надежность модели в целом определяется совокупностью подобных соотношений. Если в некоторой модели с двумя факторами в правой части одно такое соотношение 1 и 99%, а другое – 45 и 65%, то такая модель, видимо, менее надежна, чем модель с соотношениями 5 - 95% и 10 и 90%;

Информация о работе Построение и анализ надежности моделей