Построение регрессионной модели эффективности управления деятельностью производственной компании

Автор работы: Пользователь скрыл имя, 25 Апреля 2014 в 23:05, курсовая работа

Краткое описание

В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи.

Содержание

Введение………………………………………………………………………….....
1.Регрессионная модель……………………………………………………………
2.Виды регрессионных моделей…………………………………………………...
2.1. Вывод уравнения простой линейной регрессии…………………………..
2.2.Метод наименьших квадратов………………………………………………
2.3.Прогнозирование в регрессионном анализе: интерполяция и экстраполяция………………………………………………………………………
2.4. Оценки изменчивости. Вычисление сумм квадратов…………………….
2.5.Коэффициент смешанной корреляции……………………………………...
2.6.Среднеквадратичная ошибка оценки………………………………………
2.7.Предположения………………………………………………………………
2.8.Анализ остатков………………………………………………………………
2.9.Оценка пригодности эмпирической модели………………………………..
2.10.Проверка условий…………………………………………………………...
2.11.Измерение автокорреляции: статистика Дурбина–Уотсона……………..
2.12. Распознавание автокорреляции с помощью графика остатков………….
2.13.Статистика Дурбина-Уотсона……………………………………………...
2.14.Проверка гипотез о наклоне и коэффициенте корреляции………………
2.15. Применение t-критерия для наклона……………………………………...
2.16. Применение F-критерия для наклона……………………………………..
2.17. Доверительный интервал, содержащий наклон β1………………………
2.18. Использование t-критерия для коэффициента корреляции……………..
2.19. Оценка математического ожидания и предсказание индивидуальных значений…………………………………………………………………………….
2.20. Построение доверительного интервала…………………………………..
2.21. Вычисление доверительного интервала для предсказанного значения…………………………………………………………………………….
2.22. Подводные камни и этические проблемы, связанные с применением регрессии……………………………………………………………………………
3. Построение регрессионной модели эффективности управления деятельностью производственной компании…………………………………….
Заключение………………………………………………………………………….
Список используемой литературы……………………………………………….
Приложения…………………………………………………………………...........

Вложенные файлы: 1 файл

эконометрикаа.docx

— 2.10 Мб (Скачать файл)

Предположим, что, выбирая место для торговой точки, мы хотим построить 95%-ный доверительный интервал для предсказанного годового объема продаж в магазине, площадь которого равна 4000 кв. футов:

Следовательно, предсказанный годовой объем продаж в магазине, площадь которого равна 4000 кв. футов, с 95%-ной вероятностью лежит в интервале от 5,433 до 9,854 млн. долл. Как видим, доверительный интервал для предсказанного значения отклика намного шире, чем доверительный интервал для его математического ожидания. Это объясняется тем, что изменчивость при прогнозировании индивидуальных значений намного больше, чем при оценке математического ожидания.

 

2.22.Подводные камни и этические проблемы, связанные с применением регрессии

 

Трудности, связанные с регрессионным анализом:

  • Игнорирование условий применимости метода наименьших квадратов.
  • Ошибочная оценка условий применимости метода наименьших квадратов.
  • Неправильный выбор альтернативных методов при нарушении условий применимости метода наименьших квадратов.
  • Применение регрессионного анализа без глубоких знаний о предмете исследования.
  • Экстраполяция регрессии за пределы диапазона изменения объясняющей переменной.
  • Путаница между статистической и причинно-следственной зависимостями.

Широкое распространение электронных таблиц и программного обеспечения для статистических расчетов ликвидировало вычислительные проблемы, препятствовавшие применению регрессионного анализа. Однако это привело к тому, что регрессионный анализ стали применять пользователи, не обладающие достаточной квалификацией и знаниями. Откуда пользователям знать об альтернативных методах, если многие из них вообще не имеют ни малейшего понятия об условиях применимости метода наименьших квадратов и не умеют проверять их выполнение?

Исследователь не должен увлекаться перемалыванием чисел — вычислением сдвига, наклона и коэффициента смешанной корреляции. Ему нужны более глубокие знания10. Проиллюстрируем это классическим примером, взятым из учебников. Анскомб показал, что все четыре набора данных, приведенных на рис. 23, имеют одни и те же параметры регрессии (рис. 24,приложение 13).

 

Рис. 23. Четыре набора искусственных данных

 

Итак, с точки зрения регрессионного анализа все эти наборы данных совершенно идентичны. Если бы анализ был на этом закончен, мы потеряли бы много полезной информации. Об этом свидетельствуют диаграммы разброса (рис. 25,приложение 14) и графики остатков (рис. 26,приложение 15), построенные для этих наборов данных.

Диаграммы разброса и графики остатков свидетельствуют о том, что эти данные отличаются друг от друга. Единственный набор, распределенный вдоль прямой линии, — набор А. График остатков, вычисленных по набору А, не имеет никакой закономерности. Этого нельзя сказать о наборах Б, В и Г. График разброса, построенный по набору Б, демонстрирует ярко выраженную квадратичную модель. Этот вывод подтверждается графиком остатков, имеющим параболическую форму. Диаграмма разброса и график остатков показывают, что набор данных В содержит выброс. В этой ситуации необходимо исключить выброс из набора данных и повторить анализ. Метод, позволяющий обнаруживать и исключать выбросы из наблюдений, называется анализом влияния. После исключения выброса результат повторной оценки модели может оказаться совершенно иным. Диаграмма разброса, построенная по данным из набора Г, иллюстрирует необычную ситуацию, в которой эмпирическая модель значительно зависит от отдельного отклика (Х8 = 19, Y8 = 12,5). Такие регрессионные модели необходимо вычислять особенно тщательно. Итак, графики разброса и остатков являются крайне необходимым инструментом регрессионного анализа и должны быть его неотъемлемой частью. Без них регрессионный анализ не заслуживает доверия.

Как избежать подводных камней при регрессионном анализе:

  • Анализ возможной взаимосвязи между переменными X и Y всегда начинайте с построения диаграммы разброса.
  • Прежде чем интерпретировать результаты регрессионного анализа, проверяйте условия его применимости.
  • Постройте график зависимости остатков от независимой переменной. Это позволит определить, насколько эмпирическая модель соответствует результатам наблюдения, и обнаружить нарушение постоянства дисперсии.
  • Для проверки предположения о нормальном распределении ошибок используйте гистограммы, диаграммы «ствол и листья», блочные диаграммы и графики нормального распределения.
  • Если условия применимости метода наименьших квадратов не выполняются, используйте альтернативные методы (например, модели квадратичной или множественной регрессии).
  • Если условия применимости метода наименьших квадратов выполняются, необходимо проверить гипотезу о статистической значимости коэффициентов регрессии и построить доверительные интервалы, содержащие математическое ожидание и предсказанное значение отклика.
  • Избегайте предсказывать значения зависимой переменной за пределами диапазона изменения независимой переменной.
  • Имейте в виду, что статистические зависимости не всегда являются причинно-следственными. Помните, что корреляция между переменными не означает наличия причинно-следственной зависимости между ними11.

 

 

 

 

 

 

 

3 Построение регрессионной модели эффективности управления деятельностью производственной компании

 

Как правило, модели связи описывают реальные, объективно существующие между социально-экономическими явлениями причинно-следственные зависимости, возникающие под действием множества внешних и внутренних факторов.

"Моделирование на основе  уравнений регрессии может быть  сведено или к построению одного  уравнения с включением в него  большого числа факторных признаков, или к построению системы уравнений. В последнем случае получают  систему статистически не связанных  уравнений, однако, вся система связана  единой цепью причинно-следственных  связей"12.

Важным этапом построения модели связи является отбор факторных признаков. Это происходит из-за того, что факторы, обуславливающие социально-экономические процессы, находятся в той или иной зависимости друг от друга. Задача построения модели регрессии заключается не только в том, чтобы правильно определить совокупность факторов, влияющих на моделируемый показатель, но и чтобы включить в модель, насколько это возможно, не связанные между собой факторные признаки.

После того, как выбран дифференциальный показатель эффективности деятельности производственной компании, выделены наиболее существенные факторы, влияющие на ее уровень, исходные данные очищены от аномальных наблюдений, следует проверить предпосылки возникновения явления мультиколлинеарности. Это явление часто представляет собой ощутимую угрозу для правильного определения и эффективной оценки взаимосвязей13.

Для выявления данного эффекта, по нашему мнению, целесообразно использовать метод, основанный на анализе парных коэффициентов корреляции. Для этого в диссертации с использованием пакета MESOSAUR была построена корреляционная матрица.

Анализ матрицы коэффициентов парной корреляции, рассчитанных для факторных показателей за 2002 г., указал на наличие коллинеарных факторных показателей, а именно показатель Х1(рентабельность производства) имеет сильную функциональную связь с факторным показателем Х18 (прибыльность затрат), показатель Х4 (чистая прибыль) имеет сильную функциональную связь с факторным показателем Х5 (балансовая прибыль), показатель Х15 (затраты на производство продукции) имеет сильную функциональную связь с факторным показателем Х16 (выручка от реализации продукции). Сильная связь, между этими показателями логически легко объясняется.

Считается, что два показателя коллинеарные, если парный коэффициент корреляции не менее 0,8.

Таким образом, в целях устранения мультиколлинеарности в регрессионную модель включим по одному из представителей указанных групп. Для этого в регрессионной модели мы оставили Х18, так как, изменяя прибыльность затрат, по нашему мнению, можно влиять на результативные показатели эффективности деятельности производственной компании, а также Х4 и Х16, так как эти показатели имеют более сильную связь с результативными показателями эффективности деятельности производственной компании.

После того как на стадии априорного анализа произведен отбор факторов, влияющих на эффективность деятельности производственной компании, и определена форма связи, затем собрана и проанализирована исходная статистическая информация, можно перейти непосредственно к построению модели эффективности деятельности производственной компании. Для построения таких моделей использовался многошаговый регрессионный анализ, основанный на отсеве несущественных факторов по t-критерию Стьюдента.

По этому критерию проверяется гипотеза, существенно ли отличен от нуля коэффициент регрессии aj при некотором заданном уровне значимости ¤, который показывает вероятность отвергнуть правильную гипотезу. При этом, чем меньше уровень значимости, тем меньше указанная вероятность. В нашем исследовании принимаем ¤ = 0,05.

В качестве основных показателей эффективности деятельности производственной компании была взята общая рентабельность производственной компании (YРо) и общая стоимость владения информационной системой (YTCO).

Расчеты велись по данным за 2002 г. для однородной совокупности, состоящей из 50 подразделений производственной компании.

После отсева статистически незначимых факторных показателей уравнения множественной регрессии моделей общей рентабельности и общей стоимости владения информационной системой прибрели следующий вид:

YРо=11,327 – 1,5226 Х7 – 0,013326 Х11 + 0,06907 Х13 – 0,0011371 Х18;

YTCO = 13840 + 1878,7 Х7 + 40,945 Х11 + 67,583 Х13 + 3,1147 Х18.

Статистическая проверка показала адекватность моделей. Расчетная величина F-критерия Фишера для модели общей стоимости владения информационной системой составила 21,536, а для общей рентабельности 39,383, при табличном значении для TCO и Ро Fкр: (0,05; 5; 50) = 2,42.

Коэффициент множественной корреляции равен соответственно для ТСО и Ро 0,8425 и 0,9041, что указывает на то, что указанные факторные показатели сравнительно тесно связаны с результативным показателем.

Коэффициент множественной детерминации R2, равный соответственно, 0,7099 и 0,8174 свидетельствует о том, что вариация результативного показателя в исследуемой совокупности подразделений на 70,99% и 81,74% – результат колеблемости всех включенных в модель факторных показателей. Перейдем к экономической интерпретации моделей, используя систему соответствующих коэффициентов.

Коэффициенты линейного уравнения множественной регрессии (ai) показывают степень влияния фактора Хi на анализируемый показатель Y (при зафиксированном на постоянном уровне влиянии других вошедших в модель факторов и среднем уровне влияния неучтенных факторов). Коэффициент регрессии, интерпретируемый таким образом, используется в экономико-статистическом анализе как средняя оценка эффективности влияния i-го фактора-аргумента на функцию.

Расчеты по рассматриваемой совокупности производственной компании показали, что для общей рентабельности наиболее значимыми оказались факторные показатели:

Х7 – средняя фондовооруженность;

Х11 – использование производственных площадей;

Х13 – коэффициент использования персонала, в процентах;

Х18 – прибыльность затрат.

В соответствии с полученным уравнением регрессии можно сделать следующие выводы: направление влияния включенных в модель факторов не противоречат экономическому смыслу. С увеличением средней фондовооруженности работников на 1 тыс. руб. общая рентабельность увеличивается на 1,8 тыс. руб., с увеличением использования производственных площадей на 1 м2 она увеличивается на 3,11 долл., с увеличением коэффициента использования персонала на 1% – на 67,58 долл., с увеличением прибыльности затрат 1% – на 40,95 долл.

Расчеты показали, что для общей стоимости владения информационными ресурсами наиболее значимые факторные показатели оказались те же, что и для общей рентабельности.

Направление влияния включенных в модель факторов не противоречат экономическому смыслу. С увеличением среднего срока использования программного обеспечения на 1 год общая стоимость владения уменьшается на 1,5226%. С увеличением заработной платы ИТ-персонала на 1 руб. она уменьшается на 0,0011%, с увеличением коэффициента использования персонала на 1% – увеличивается на 0,06907%, с увлечением доли сотрудников работающих в режиме суммированного рабочего дня в общей численности персонала на 1% – уменьшается на 0,0133%.

Прямое сравнение коэффициентов регрессии в уравнении множественной регрессии дает представление о степени влияния факторных признаков на результативный показатель только тогда, когда они выражаются в одинаковых единицах и имеют примерно одинаковую колеблемость. Для этого некоторые экономисты предлагают использовать целую систему показателей: средние частотные коэффициенты эластичности, бета – коэффициенты и дельта –коэффициенты14.

Для данного исследования, мы предлагаем использовать средний частный коэффициент эластичности15. Он позволяет измерять в процентах изменение результативного показателя при увеличении каждого фактора на одну и ту же относительную величину – на 1%. Такая интерпретация очень удобна и понятна каждому экономисту. Только при этом не следует забывать, что средний частотный коэффициент эластичности не учитывает степень колеблемости факторов.

Для устранения различий в измерении и степени колеблемости, можно использовать другой показатель – бета-коэффициент. Однако для данного исследования, по нашему мнению, достаточно оценить модель с помощью средних частотных коэффициентов эластичности (Эi).

Коэффициенты эластичности выражаются следующими величинами:

Информация о работе Построение регрессионной модели эффективности управления деятельностью производственной компании