Автор работы: Пользователь скрыл имя, 25 Апреля 2014 в 23:05, курсовая работа
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.
Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи.
Введение………………………………………………………………………….....
1.Регрессионная модель……………………………………………………………
2.Виды регрессионных моделей…………………………………………………...
2.1. Вывод уравнения простой линейной регрессии…………………………..
2.2.Метод наименьших квадратов………………………………………………
2.3.Прогнозирование в регрессионном анализе: интерполяция и экстраполяция………………………………………………………………………
2.4. Оценки изменчивости. Вычисление сумм квадратов…………………….
2.5.Коэффициент смешанной корреляции……………………………………...
2.6.Среднеквадратичная ошибка оценки………………………………………
2.7.Предположения………………………………………………………………
2.8.Анализ остатков………………………………………………………………
2.9.Оценка пригодности эмпирической модели………………………………..
2.10.Проверка условий…………………………………………………………...
2.11.Измерение автокорреляции: статистика Дурбина–Уотсона……………..
2.12. Распознавание автокорреляции с помощью графика остатков………….
2.13.Статистика Дурбина-Уотсона……………………………………………...
2.14.Проверка гипотез о наклоне и коэффициенте корреляции………………
2.15. Применение t-критерия для наклона……………………………………...
2.16. Применение F-критерия для наклона……………………………………..
2.17. Доверительный интервал, содержащий наклон β1………………………
2.18. Использование t-критерия для коэффициента корреляции……………..
2.19. Оценка математического ожидания и предсказание индивидуальных значений…………………………………………………………………………….
2.20. Построение доверительного интервала…………………………………..
2.21. Вычисление доверительного интервала для предсказанного значения…………………………………………………………………………….
2.22. Подводные камни и этические проблемы, связанные с применением регрессии……………………………………………………………………………
3. Построение регрессионной модели эффективности управления деятельностью производственной компании…………………………………….
Заключение………………………………………………………………………….
Список используемой литературы……………………………………………….
Приложения…………………………………………………………………...........
Предположим, что, выбирая место для торговой точки, мы хотим построить 95%-ный доверительный интервал для предсказанного годового объема продаж в магазине, площадь которого равна 4000 кв. футов:
Следовательно, предсказанный годовой объем продаж в магазине, площадь которого равна 4000 кв. футов, с 95%-ной вероятностью лежит в интервале от 5,433 до 9,854 млн. долл. Как видим, доверительный интервал для предсказанного значения отклика намного шире, чем доверительный интервал для его математического ожидания. Это объясняется тем, что изменчивость при прогнозировании индивидуальных значений намного больше, чем при оценке математического ожидания.
2.22.Подводные камни и этические проблемы, связанные с применением регрессии
Трудности, связанные с регрессионным анализом:
Широкое распространение электронных таблиц и программного обеспечения для статистических расчетов ликвидировало вычислительные проблемы, препятствовавшие применению регрессионного анализа. Однако это привело к тому, что регрессионный анализ стали применять пользователи, не обладающие достаточной квалификацией и знаниями. Откуда пользователям знать об альтернативных методах, если многие из них вообще не имеют ни малейшего понятия об условиях применимости метода наименьших квадратов и не умеют проверять их выполнение?
Исследователь не должен увлекаться перемалыванием чисел — вычислением сдвига, наклона и коэффициента смешанной корреляции. Ему нужны более глубокие знания10. Проиллюстрируем это классическим примером, взятым из учебников. Анскомб показал, что все четыре набора данных, приведенных на рис. 23, имеют одни и те же параметры регрессии (рис. 24,приложение 13).
Рис. 23. Четыре набора искусственных данных
Итак, с точки зрения регрессионного анализа все эти наборы данных совершенно идентичны. Если бы анализ был на этом закончен, мы потеряли бы много полезной информации. Об этом свидетельствуют диаграммы разброса (рис. 25,приложение 14) и графики остатков (рис. 26,приложение 15), построенные для этих наборов данных.
Диаграммы разброса и графики остатков свидетельствуют о том, что эти данные отличаются друг от друга. Единственный набор, распределенный вдоль прямой линии, — набор А. График остатков, вычисленных по набору А, не имеет никакой закономерности. Этого нельзя сказать о наборах Б, В и Г. График разброса, построенный по набору Б, демонстрирует ярко выраженную квадратичную модель. Этот вывод подтверждается графиком остатков, имеющим параболическую форму. Диаграмма разброса и график остатков показывают, что набор данных В содержит выброс. В этой ситуации необходимо исключить выброс из набора данных и повторить анализ. Метод, позволяющий обнаруживать и исключать выбросы из наблюдений, называется анализом влияния. После исключения выброса результат повторной оценки модели может оказаться совершенно иным. Диаграмма разброса, построенная по данным из набора Г, иллюстрирует необычную ситуацию, в которой эмпирическая модель значительно зависит от отдельного отклика (Х8 = 19, Y8 = 12,5). Такие регрессионные модели необходимо вычислять особенно тщательно. Итак, графики разброса и остатков являются крайне необходимым инструментом регрессионного анализа и должны быть его неотъемлемой частью. Без них регрессионный анализ не заслуживает доверия.
Как избежать подводных камней при регрессионном анализе:
3 Построение регрессионной модели эффективности управления деятельностью производственной компании
Как правило, модели связи описывают реальные, объективно существующие между социально-экономическими явлениями причинно-следственные зависимости, возникающие под действием множества внешних и внутренних факторов.
"Моделирование на основе
уравнений регрессии может
Важным этапом построения модели связи является отбор факторных признаков. Это происходит из-за того, что факторы, обуславливающие социально-экономические процессы, находятся в той или иной зависимости друг от друга. Задача построения модели регрессии заключается не только в том, чтобы правильно определить совокупность факторов, влияющих на моделируемый показатель, но и чтобы включить в модель, насколько это возможно, не связанные между собой факторные признаки.
После того, как выбран дифференциальный показатель эффективности деятельности производственной компании, выделены наиболее существенные факторы, влияющие на ее уровень, исходные данные очищены от аномальных наблюдений, следует проверить предпосылки возникновения явления мультиколлинеарности. Это явление часто представляет собой ощутимую угрозу для правильного определения и эффективной оценки взаимосвязей13.
Для выявления данного эффекта, по нашему мнению, целесообразно использовать метод, основанный на анализе парных коэффициентов корреляции. Для этого в диссертации с использованием пакета MESOSAUR была построена корреляционная матрица.
Анализ матрицы коэффициентов парной корреляции, рассчитанных для факторных показателей за 2002 г., указал на наличие коллинеарных факторных показателей, а именно показатель Х1(рентабельность производства) имеет сильную функциональную связь с факторным показателем Х18 (прибыльность затрат), показатель Х4 (чистая прибыль) имеет сильную функциональную связь с факторным показателем Х5 (балансовая прибыль), показатель Х15 (затраты на производство продукции) имеет сильную функциональную связь с факторным показателем Х16 (выручка от реализации продукции). Сильная связь, между этими показателями логически легко объясняется.
Считается, что два показателя коллинеарные, если парный коэффициент корреляции не менее 0,8.
Таким образом, в целях устранения мультиколлинеарности в регрессионную модель включим по одному из представителей указанных групп. Для этого в регрессионной модели мы оставили Х18, так как, изменяя прибыльность затрат, по нашему мнению, можно влиять на результативные показатели эффективности деятельности производственной компании, а также Х4 и Х16, так как эти показатели имеют более сильную связь с результативными показателями эффективности деятельности производственной компании.
После того как на стадии априорного анализа произведен отбор факторов, влияющих на эффективность деятельности производственной компании, и определена форма связи, затем собрана и проанализирована исходная статистическая информация, можно перейти непосредственно к построению модели эффективности деятельности производственной компании. Для построения таких моделей использовался многошаговый регрессионный анализ, основанный на отсеве несущественных факторов по t-критерию Стьюдента.
По этому критерию проверяется гипотеза, существенно ли отличен от нуля коэффициент регрессии aj при некотором заданном уровне значимости ¤, который показывает вероятность отвергнуть правильную гипотезу. При этом, чем меньше уровень значимости, тем меньше указанная вероятность. В нашем исследовании принимаем ¤ = 0,05.
В качестве основных показателей эффективности деятельности производственной компании была взята общая рентабельность производственной компании (YРо) и общая стоимость владения информационной системой (YTCO).
Расчеты велись по данным за 2002 г. для однородной совокупности, состоящей из 50 подразделений производственной компании.
После отсева статистически незначимых факторных показателей уравнения множественной регрессии моделей общей рентабельности и общей стоимости владения информационной системой прибрели следующий вид:
YРо=11,327 – 1,5226 Х7 – 0,013326 Х11 + 0,06907 Х13 – 0,0011371 Х18;
YTCO = 13840 + 1878,7 Х7 + 40,945 Х11 + 67,583 Х13 + 3,1147 Х18.
Статистическая проверка показала адекватность моделей. Расчетная величина F-критерия Фишера для модели общей стоимости владения информационной системой составила 21,536, а для общей рентабельности 39,383, при табличном значении для TCO и Ро Fкр: (0,05; 5; 50) = 2,42.
Коэффициент множественной корреляции равен соответственно для ТСО и Ро 0,8425 и 0,9041, что указывает на то, что указанные факторные показатели сравнительно тесно связаны с результативным показателем.
Коэффициент множественной детерминации R2, равный соответственно, 0,7099 и 0,8174 свидетельствует о том, что вариация результативного показателя в исследуемой совокупности подразделений на 70,99% и 81,74% – результат колеблемости всех включенных в модель факторных показателей. Перейдем к экономической интерпретации моделей, используя систему соответствующих коэффициентов.
Коэффициенты линейного уравнения множественной регрессии (ai) показывают степень влияния фактора Хi на анализируемый показатель Y (при зафиксированном на постоянном уровне влиянии других вошедших в модель факторов и среднем уровне влияния неучтенных факторов). Коэффициент регрессии, интерпретируемый таким образом, используется в экономико-статистическом анализе как средняя оценка эффективности влияния i-го фактора-аргумента на функцию.
Расчеты по рассматриваемой совокупности производственной компании показали, что для общей рентабельности наиболее значимыми оказались факторные показатели:
Х7 – средняя фондовооруженность;
Х11 – использование производственных площадей;
Х13 – коэффициент использования персонала, в процентах;
Х18 – прибыльность затрат.
В соответствии с полученным уравнением регрессии можно сделать следующие выводы: направление влияния включенных в модель факторов не противоречат экономическому смыслу. С увеличением средней фондовооруженности работников на 1 тыс. руб. общая рентабельность увеличивается на 1,8 тыс. руб., с увеличением использования производственных площадей на 1 м2 она увеличивается на 3,11 долл., с увеличением коэффициента использования персонала на 1% – на 67,58 долл., с увеличением прибыльности затрат 1% – на 40,95 долл.
Расчеты показали, что для общей стоимости владения информационными ресурсами наиболее значимые факторные показатели оказались те же, что и для общей рентабельности.
Направление влияния включенных в модель факторов не противоречат экономическому смыслу. С увеличением среднего срока использования программного обеспечения на 1 год общая стоимость владения уменьшается на 1,5226%. С увеличением заработной платы ИТ-персонала на 1 руб. она уменьшается на 0,0011%, с увеличением коэффициента использования персонала на 1% – увеличивается на 0,06907%, с увлечением доли сотрудников работающих в режиме суммированного рабочего дня в общей численности персонала на 1% – уменьшается на 0,0133%.
Прямое сравнение коэффициентов регрессии в уравнении множественной регрессии дает представление о степени влияния факторных признаков на результативный показатель только тогда, когда они выражаются в одинаковых единицах и имеют примерно одинаковую колеблемость. Для этого некоторые экономисты предлагают использовать целую систему показателей: средние частотные коэффициенты эластичности, бета – коэффициенты и дельта –коэффициенты14.
Для данного исследования, мы предлагаем использовать средний частный коэффициент эластичности15. Он позволяет измерять в процентах изменение результативного показателя при увеличении каждого фактора на одну и ту же относительную величину – на 1%. Такая интерпретация очень удобна и понятна каждому экономисту. Только при этом не следует забывать, что средний частотный коэффициент эластичности не учитывает степень колеблемости факторов.
Для устранения различий в измерении и степени колеблемости, можно использовать другой показатель – бета-коэффициент. Однако для данного исследования, по нашему мнению, достаточно оценить модель с помощью средних частотных коэффициентов эластичности (Эi).
Коэффициенты эластичности выражаются следующими величинами: