Построение и анализ надежности моделей

Автор работы: Пользователь скрыл имя, 20 Декабря 2010 в 18:04, контрольная работа

Краткое описание

Цели контрольной работы: овладение навыками построения экономико-математических моделей статистическими методами; навыками объективного анализа надежности построенных моделей; навыками совершенствования моделей.

Содержание

1. Цели выполнения контрольной работы 3
2. Алгоритм выполнения контрольной работы 3
3. Методы отбора факторов правых частей моделей 4
4. Сбор исходной информации 13
5. Построение модели 16
6. Анализ надежности модели 18
7. Повторное построение модели 25
8. Методы совершенствования моделей 25
Библиографический список 26

Скачать в ZIP архиве (64.01 Кб) Сколько стоит заказать работу?

Вложенные файлы: 1 файл

Курсовая мат методы1.doc

— 311.50 Кб (Скачать файл)

4. СБОР ИСХОДНОЙ ИНФОРМАЦИИ

Задача этапа - собрать исходную отчетную информацию по всем отобранным на предыдущем этапе факторам X, а также по выбранному на втором этапе функции - Y, например, в помесячном разрезе. Минимальное число используемых при этом наблюдений определяется ориентировочной формулой математической статистики: 20-30 (N + 1), где N – количество факторов, включаемых в правую часть будущей модели. При этом следует «нейтрализовать» инфляцию для приведения некоторых стоимостных показателей разных временных периодов в сопоставимый вид. Кроме того, желательно с помощью манипулирования размерностью факторов исходную информацию по всем факторам формировать как информацию приблизительно одного порядка. С учетом учебных целей построения модели число наблюдений может быть существенно уменьшено (например, до 20-25).

В табл.3 приведен пример [2] заполнения электронных таблиц EXCEL исходной информацией для построения модели коэффициента отнесения затрат на электроэнергию (К_Э).

Исходная информация для построения модели

*Таблица* EXCEL	A	B	C	G
1	Э_В (X₁)	Q (X₂)	Q_ОТ(X₃)	К_Э (Y)
2	млн.кВт*ч в месяц	тыс. Гкал в месяц	%	-
3	млн.кВт*ч в месяц	тыс. Гкал в месяц	%	-
4	40,126	192,56	68,48	0,3902
5	38,668	161,5	78,09	0,3851
6	39,888	127,5	97,11	0,4282
7	26,272	83,052	100	0,4236
8	16,344	60,7	98,7	0,406
9	6,49	33,6	100	0,3832
10	0,104	29	1,88	0,0535
11	0	35,7	0	0,0468
12	6,362	47,9	41,06	0,2161
13	18,085	98,3	67,28	0,3131
14	32,645	116	87,66	0,3922
15	32,678	147	71,3	0,3358
16	40,268	200,21	64,06	0,3234
17	35,814	156,65	74,92	0,3407
18	36,241	119,3	95,37	0,4159
19	27,317	84,42	99,38	0,4292
20	13,274	48,8	99,95	0,4084
21	1,348	23,4	29,65	0,1086
22	0	18,15	0	0,0609
23	0	21,06	0	0,0624
24	0,743	33,415	8,19	0,0456
25	17,36	59,2	89,09	0,3929
26	29,055	139,8	70,04	0,3311
27	38,757	182,105	73,26	0,3824
28	36,504	165,18	76,54	0,3758
29	31,641	164,8	66,56	0,3721

5. ПОСТРОЕНИЕ МОДЕЛИ

Следует обработать подготовленный массив исходной информации с помощью компьютерной программы (например, EXCEL) [3, 4]:

EXCEL;
внести в рабочий лист исходную информацию: столбец с рядом наблюдений Y и столбцы рядов наблюдений всех X;
Сервис/ Анализ данных/ Регрессия; ОК/;
выделить «входной интервал Y», т.е. интервал наблюдений текущих затрат и «входной интервал X₁, X₂,….», т.е. интервал наблюдений факторов правой части модели;
отметить «константа – ноль» (если для модели необходимо уравнение без свободного члена). В большинстве случаев это не требуется;
отметить «уровень надежности», например 95%;
предусмотреть показ программой «остатков»;
предусмотреть показ «стандартных остатков»; ОК;
выходная информация: 1) числовые параметры модели-зависимости затрат (Y) от отобранных факторов X; 2) критерии, позволяющие оценить надежность полученной модели;

В результате получаем «Вывод итогов»: параметры модели и целый ряд критериев, позволяющих оценить ее надежность с разных сторон. Для рассматриваемого примера этот «Вывод итогов» приведен в табл.4. Параметры модели, т.е. числовой материал правой части модели (в «чисто» математической литературе они обычно называются «коэффициентами»), для рассматриваемого примера для наглядности затенены. В табл.4 фактор (или переменная) Х₁ – это крайний левый столбец исходных данных табл.3, т.е. фактор Э_В. Фактор Х₂ - следующий, второй слева столбец исходных данных, т.е. фактор Q и т.д. Далее: Y – пересечение - это свободный член модели. Таким образом, для нашего примера получена модель:

К_Э = - 0,50485 + 0,127873Э_В + 0,000787Q + 0,003297Q_ОТ -

- 0,00638Т_Т - 0,00004Т_К + 0,005994К_ПД

Модель и критерии ее надежности

Регрессионная статистика
Множественный R	0,99192938
R-квадрат	0,983923894
Нормированный R-квадрат	0,981731698
Стандартная ошибка	0,018989533
Наблюдения	26

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	3	0,485547706	0,161849235	448,830207	7,11686E-20
Остаток	22	0,007933252	0,000360602
Итого	25	0,493480958

	Коэффи-циенты	Стандарт- ная ошибка	t-статистика	P-Значение	Нижние 95%		Верхние 95%	Нижние 95,0%	Верхние 95,0%
Y-пересечение	0,033403	0,01	2,893	0,008441	0,00946	0,06		0,00946	0,057
Переменная X 1	0,000321	0	0,278	0,783766	-0,00207	0		-0,00207	0,003
Переменная X 2	0,000406	0	1,651	0,112959	-0,0001	0		-0,0001	9E-04
Переменная X 3	0,00346	0	17,63	1,83E-14	0,00305	0		0,00305	0,004

ВЫВОД ОСТАТКА

Наблюдение	Предсказанное Y	Остатки	Стандартные остатки
1	0,361361	0,03	1,619
2	0,381537	0	0,2
3	0,433936	-0	-0,322
4	0,421529	0	0,116
5	0,404776	0	0,069
6	0,395115	-0	-0,669
7	0,051711	0	0,1
8	0,047893	-0	-0,061
9	0,196949	0,02	1,075
10	0,311884	0	0,068
11	0,39425	-0	-0,115
12	0,350238	-0	-0,811
13	0,349219	-0	-1,449
14	0,367685	-0	-1,515
15	0,423418	-0	-0,422
16	0,420274	0,01	0,501
17	0,403286	0,01	0,287
18	0,14592	-0	-2,095
19	0,04077	0,02	1,13
20	0,041951	0,02	1,148
21	0,07554	-0	-1,681
22	0,371243	0,02	1,216
23	0,341795	-0	-0,6
24	0,373217	0,01	0,515
25	0,376974	-0	-0,066
26	0,34073	0,03	1,761

6. АНАЛИЗ НАДЕЖНОСТИ МОДЕЛИ

Анализ полученной предварительной модели проводится на предмет соответствия ее параметров ряду статистических критериев. Этот анализ, как правило, приводит к выбрасыванию из правой части модели ряда слабо влияющих на величину затрат факторов. После этого модель следует построить заново. Основные шаги такого анализа:

первый критерий – коэффициент множественной корреляции («Множественный R»). Коэффициент оценивает силу совокупного влияния всех факторов правой части модели на прогнозируемый показатель (в нашем примере - К_Э).

В дальнейшем прогнозируемый показатель для общности будем обозначать как Y. Факторы правой части модели - как X₁, X₂, ….

Возможные пределы изменения коэффициента множественной корреляции (от 0 до +1) делятся «плавающей» границей на две области: несущественного (от 0 до приблизительно +0,75) и существенного (от приблизительно +0,75 до +1) влияния факторов правой части модели на Y. Местоположение этой границы зависит как от числа факторов, включаемых в модель, так и от количества используемых наблюдений факторов. Более точно эта граница может быть определена с помощью специальных критериев математической статистики. В моем примере коэффициент множественной корреляции достаточно высок (0.99192938), поэтому нет необходимости использовать данные критерии.

Если значение коэффициента множественной корреляции соответствует, напротив, несущественной области – это означает, что факторы, включенные исследователем в правую часть модели, в совокупности слабо влияют на Y. Практические следствия: в такой ситуации надо продолжить работу по выявлению факторов, которые действительно оказывают влияние на Y путем углубления теоретических поисков, проведения дополнительного экспертного опроса, проведения специальных экспериментов и т.д.;

второй критерий – «R –квадрат» или «коэффициент детерминации», который позволяет ответить на вопрос: сколько процентов изменчивости Y объясняется изменчивостью всех X₁, X₂, ….? Критерий является модификацией первого критерия. Считается, что минимальный процент объясненной изменчивости Y – 60, т. е. коэффициент детерминации должен быть больше хотя бы 0,6. Если его значение меньше – следует предпринять те же действия, что и в случае не существенности коэффициента множественной корреляции;
Проведя анализ полученного коэффициента, можно сделать вывод о том, что почти 99% изменчивости прогнозируемого показателя Кэ объясняется изменчивостью используемых факторов правой части модели.

R –квадрат 0,983923894

третий критерий – «Нормированный R –квадрат». Этот критерий отвечает на вопрос: достаточна ли выборка (число выбранных наблюдений факторов)? Критерий сопоставляет число факторов правой части модели и число наблюдений. Если значение данного критерия меньше приблизительно 0,5, то следует соответственно увеличить число наблюдений. Смысл нормированного R – квадрата (R²_НОРМ) ясен из формулы его расчета:

где n – число наблюдений;

N – число факторов правой части модели;

R – коэффициент множественной корреляции.

В моём примере значение этого коэффициента велико, что вполне достаточно выбранных наблюдений факторов (достаточно выборка).

Нормированный R-квадрат 0,981731698

четвертый критерий – («критерий SS»). Критерий соотносит объясненную регрессию-(зависимость Y от Х₁, Х₂,…) с необъясненной. На примере соотношение цифр объясненной регрессии (0,485547706) и остатка (0,007933252) свидетельствует: необъясненная регрессия (остаток) – крайне незначительна. Она составляет менее одного процента (0,90%). Если бы остаток составлял существенную величину, тогда следовало бы или вернуться к поиску новых факторов, действительно влияющих на Y, или в соответствии с полученным соотношением объясненной регрессии и остатка в дальнейшем в такой же пропорции доверять результатам прогноза Y;
пятый критерий – «критерий F», или критерий Фишера. Этот критерий представляет собой отношение двух дисперсий (мер разброса исходных данных ряда Y : в числителе - разброс их вокруг среднего по выборке значения, а в знаменателе – разброс их относительно рассчитываемых по модели значений. Критерий Фишера должен быть больше хотя бы 2,5. Иными словами, согласно этому критерию модель должна уменьшать разброс данных хотя бы в 2,5 раза по сравнению с ситуацией, когда плановый работник пользовался бы не прогнозными, а просто средними по выборке значениями Y. В нашем примере критерий F имеет достаточно высокое значение (448,830207). Критерий Фишера может подсказать необходимость перехода от линейной модели (все факторы-«иксы» в первой степени и нет произведений факторов) к более сложной модели, например, параболе второго порядка. При этом значение критерия Фишера, как правило, увеличивается;
шестой критерий – «Стандартная ошибка» каждого из коэффициентов модели. Стандартная ошибка коэффициентов оценивает надежность полученных коэффициентов модели и измеряется в тех же единицах измерения, что и переменные (факторы) модели. Для такой оценки следует попарно сопоставить цифры столбца «Стандартная ошибка» со значениями самих коэффициентов, т.е. с цифрами соседнего слева столбца (по их абсолютному значению). Стандартная ошибка, конечно же, не должна превышать значения соответствующего коэффициента. Соотношение ошибки и коэффициента говорит о надежности или ненадежности коэффициента. Если это соотношение составляет, например, 30 и 70% - это, очевидно, крайний предел. Понятно, что чем меньше стандартная ошибка в сравнении со значением коэффициента, тем надежнее модель. Надежность модели в целом определяется совокупностью подобных соотношений. Если в некоторой модели с двумя факторами в правой части одно такое соотношение 1 и 99%, а другое – 45 и 65%, то такая модель, видимо, менее надежна, чем модель с соотношениями 5 - 95% и 10 и 90%;

Построение и анализ надежности моделей

Краткое описание

Содержание

Вложенные файлы: 1 файл

Курсовая мат методы1.doc

Информация о работе Построение и анализ надежности моделей