Специфика моделей регрессии

Автор работы: Пользователь скрыл имя, 26 Июля 2014 в 10:26, реферат

Краткое описание

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии:

Содержание

1. Множественная регрессия.Условия применения метода и его ограничения……………………………………………………………….…….2-3
2. Мультиколлинеарность………………………………………………….…4-5
3. Выбор типа многофакторной модели и факторных признаков………….6-8
4. Системы показателей многофакторной корреляции и регрессии….…....9-12
5. Включение в многофакторную модель неколичественных факторов…13-16
6. Применение многофакторных регрессионных моделей для анализа деятельности предприятий и прогнозирования………………………...…17-21

Вложенные файлы: 1 файл

специфика моделей регрессии.docx

— 50.04 Кб (Скачать файл)

 

 

Содержание:

 

1.   Множественная регрессия.Условия применения метода и его ограничения……………………………………………………………….…….2-3 
2.   Мультиколлинеарность………………………………………………….…4-5

3.   Выбор типа многофакторной  модели и факторных признаков………….6-8 
4. Системы показателей многофакторной корреляции и регрессии….…....9-12

5. Включение в многофакторную  модель неколичественных факторов…13-16

6. Применение многофакторных  регрессионных моделей для анализа деятельности  предприятий и прогнозирования………………………...…17-21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                                           Множественная регрессия 
                        Условия применения метода и его ограничения 
Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии: 
 
 
 
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает два круга вопросов: отбор факторов и выбор вида уравнения регрессии. 
 
Требования к факторам: 
 
1.     Должны быть количественно измеримы. Если необходимо, включить в модель качественный фактор, не имеющий количественного измерения, ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов). 
 
2.     Не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, когда  
 
 
 
для зависимости 
 
 
 
может привести к нежелательным последствиям, повлечь неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель, поэтому параметры уравнения регрессии оказываются неинтерпретированными. 
 

 

 

 

 

 

 

 

 

 

 

                                           

 

                                     

 

 

 

                                     Мультиколлинеарность 
Специфическим для многофакторных систем является условие недопустимости слишком тесной связи между факторными признаками. Это условие часто именуется проблемой коллинеарности факторов. Коллинеарность означает достаточно тесную неслучайную линейную корреляцию одних факторов с другими. Часто рекомендуют исключить фактор, связанный с другим фактором при . Из двух тесно связанных друг с другом факторов рационально исключить фактор, слабее связанный с результативным признаком. 
Более сложная методика требуется для нахождения и исключения фактора, не имеющего тесной связи с каким-либо отдельным фактором, но имеющего тесную многофакторную связь с комплексом остальных факторов. Это положение называют мультиколлинеарностью. Для ее измерения следует вычислить последовательно коэффициенты множественной корреляции (или детерминации) каждого фактора  (в роли результата) со всеми прочими факторами (в роли объясняющих переменных). Обнаружив мультиколлинеарный фактор либо несколько таковых, следует рассмотреть возможность исключения наиболее зависимого от комплекса остальных фактора, если это не приведет к потере экономического смысла модели. 
Коллинеарность и мультиколлинеарность факторов в экономических системах возникают неслучайно. В совокупности однородных предприятий или регионов, как правило, в силу законов экономики возникает параллельная вариация факторных признаков: те предприятия, которые имеют лучшие значения одних факторов, например, лучшие природные условия, одновременно имеют и более высокую фондо- и энерговооруженность, более высокую квалификацию персонала, лучшую технологию и т.п. Отсюда и неизбежная большая или меньшая коллинеарность всех факторов производства либо социально-экономических условий жизни.  
 
Наличие в системе коллинеарности ухудшает математические качества модели, может привести к неустойчивости результативных параметров, резко меняющихся при небольшом изменении значений факторов. 
Специфичной проблемой многофакторного анализа является вопрос о возможности замены фактора, по которому отсутствует информация, на другой фактор и последствия такой замены.  
Следует по возможности найти другую переменную, значения которой известны и которая находится в достаточно тесной связи с отсутствующим фактором. Например, если нет данных по региону о средней заработной плате, то их можно заменить величиной валового регионального продукта на душу населения, имея в виду, что между этими экономическими признаками должна быть тесная (хотя и неизвестная точно) связь. 
Важно учитывать, с какой целью строится модель. Если целью является только прогнозирование результативного признака, то замена фактора другой пременной при ее тесной связи с заменяемым фактором не приведет к существенным ошибкам. Но если целью модели являлось принятие менеджером решений о своей экономической политике, то замена управляемого фактора на тесно с ним связанный, однако неуправляемый заменяющий фактор лишает модель смысла, несмотря на высокую детерминацию. 
 

 

        

 

 

 

 

        Выбор типа многофакторной модели и факторных признаков 
Связь результативного признака y 
с факторами x 
1, x 
2, …, xk 
выражается уравнением: 
 
                       (22) 
 
   где a – свободный член уравнения; 
 
k – число факторов; 
 
j – номер фактора; 
 
i – номер единицы совокупности; 
 
bj – коэффициент условно-чистой регрессии при факторе xj, измеряющий изменение результата при изменении фактора на его единицу, и при постоянстве прочих факторов, входящих в модель; 
 
εi – случайная вариация yi, не объясненная моделью. 
 
Модель в форме (22) является аддитивной. Это означает, что в основе модели лежит гипотеза о том, что каждый фактор что-то добавляет или что-то отнимает от значения результативного признака. Такая гипотеза о типе связи причин и следствия вполне отражает ряд экономических систем взаимосвязанных признаков. Например, если y – это урожайность сельскохозяйственной культуры, а x 
1, x 
2, …, xk – агротехнические факторы: дозы разных видов удобрений, число прополок, поливов, доля потерь при уборке, то действительно, каждый из этих факторов либо повышает, либо снижает величину урожайности, причем результат может существовать и без любых из перечисленных факторов. 
1.   Факторы должны являться причинами, а результативный признак – их следствием. Недопустимо в число факторов включать признак, занимающий в реальной экономике место на «выходе» системы, т.е. зависимый от моделируемого. Например, строится модель себестоимости центнера зерна. Факторами взяты урожайность зерновых культур и трудоемкость центнера, но коэффициент детерминации невелик, модель плохая. Для ее «улучшения» в число факторов добавили рентабельность производства зерна. Коэффициент детерминации сразу подскочил до 0,88. Но модель не стала лучше, она стала бессмысленной, так как рентабельность зависит от себестоимости, а не наоборот. 
2.   Факторный признаки не должны быть составными частями результативного признака. В ту же модель себестоимости нельзя вводить факторами зарплату в расчете на центнер зерна, затраты на перевозку центнера зерна и т.п. связь целого с ее структурными частями следует анализировать не с помощью корреляционного анализа, а с помощью систем индексов. 
3.   Следует избегать дублирования факторов. Каждый реальный фактор должен быть представлен одним показателем. Например, трудовой фактор в модели объема продукции может быть представлен либо среднесписочным числом работников, либо затратами человеко-дней (человеко-часов) на производство продукции, но не обоими показателями. Дублирование факторов ведет к раздроблению влияния фактора, и он может оказаться ненадежным из-за такого раздробления. 
4.  Следует по возможности избегать факторов, тесно связанных с другими. 
 
5.  Следует включать факторы одного уровня иерархии, не следует включать и факторы вышележащего уровня и их субфакторы. Например, в модель себестоимости зерна включаем урожайность, трудоемкость, но не добавляем еще балл плодородия, дозу удобрений, энерговооруженность работников, т.е. субфакторы – причины, влияющие на урожайность и трудоемкость. Включение субфакторов тоже дублирование  фактора. 
 
6.  Есть логика в таком построении модели, при котором все признаки отнесены на одну и ту же единицу совокупности, как результативный признак, так и факторы. Например, если моделируется объем продукции предприятия, то и факторы должны относиться к предприятию: число работников, площадь угодий, основные фонды и т.д. Если строится модель заработной платы работника, то и факторы должны относиться к работнику: его стаж, возраст, образование, разряд тарифной сетки (шкалы), энерговооруженность и т.д.  
 
7.   Действует принцип простоты модели. Если возможно построить хорошую модель с пятью факторами, то не следует гнаться за идеальной моделью с десятью факторами, обычно лишние факторы ухудшают модель. 
 

 

 

 

 

 

            

 

 

      Системы показателей многофакторной корреляции и регрессии 
Рассмотрим данную систему показателей на примере  связи урожайности зерновых культур в 51 агрофирме Орловской области. Первоначально были отобраны 8 факторных признаков, которые могут влиять на вариацию урожайности: 
 

1 – размер посевной площади зерновых, га; 
 

2 – удельный вес зерновых в общей площади, %; 
 

3 – затраты на 1 га посева зерновых, тыс. руб./га; 
 

4 – затраты труда на 1 га, чел.-ч;. 
 

5 – уровень оплаты труда, руб./чел.-ч.; 
 

6 – энергообеспеченность, л.с./100 га пашни; 
 

7 – число комбайнов на 1000 га зерновых, шт.; 
 

8 – число трактористов-машинистов на 100 га пашни, чел. 
 
Первоначальное уравнение регрессии имеет вид: 
 
 
 
Однако надежно отличными от нуля оказались только коэффициенты при x 
3 (t-критерий равен 10,5) и при x 
8 (t-критерий равен 2,72). Большую надежность, чем другие факторы имеет и x 
5. 
 
После отсева ненадежных факторов, т.е. исключения их из уравнения, окончательное уравнение регрессии таково: 
 
 
 
Таким образом, на различие урожайности в данных 51 агрофирмы сильнее всего и надежно повлияли различия между предприятиями в затратах на 1 га, в уровне оплаты труда и в обеспеченности квалифицированными работниками. 
Каждый из коэффициентов, называемых коэффициентами чистой регрессии, интерпретируются как величина изменения урожайности при условии, что данный фактор изменяется на принятую единицу измерения, а два других фактора остаются постоянными на средних уровнях. Например, b 
3 означает, что при увеличении затрат на 1 га зерновых и при неизменности оплаты труда и обеспеченности трактористами-машинистами урожайность в среднем увеличивалась в среднем на 4, 6 ц/га. Термин «условно чистая регрессия» означает, что влияние отдельного фактора очищено от сопутствующей вариации только тех факторов, которые входят в уравнение, но не очищено от возможной сопутствующей вариации других факторов.  
 
Величина коэффициентов условно чистой регрессии зависит от принятых единиц измерения. Если бы фактор x 
3 измерялся не в тысячах рублей на гектар, а в рублях на гектар, то коэффициент b 
3 был бы равен 0,00461 руб./га. Следовательно, сравнивать между собой коэффициенты условно чистой регрессии нельзя. Чтобы получить сравнимые коэффициенты влияния вариации факторов на вариацию результата, следует избавиться от единиц измерения, привести к одной условной единице. Для этого можно применить два способа. 
Первый способ называется стандартизацией. Этот термин возник из английского названия среднего квадратического отклонения (Standard deviation). Стандартизированные коэффициенты регрессии выражаются в долях или величинах, если они превышают единицу – в величинах σy. Стандартизированные коэффициенты обозначают греческой буквой β и называют бета-коэффициентами. Интерпретация бета-коэффициентов такова: при изменении фактора x 
3 на одно его среднее квадратическое отклонение от средней величины и при постоянстве других факторов результативный признак (урожайность) отклонится от своего среднего уровня на 0,772 его среднего квадратического отклонения. Так как все стандартизированные коэффициенты выражены в одинаковых единицах измерения, в σy 
, они сравнимы между собой, и можно сделать вывод, что на вариацию урожайности сильнее всего повлияла в изучаемой совокупности предприятий вариация затрат на гектар посева. 
Другой способ приведения коэффициентов регрессии к сравнимому виду – их преобразование в коэффициенты эластичности. Формула коэффициента эластичности ℓj: 
 
                                                      
 
Интерпретируется коэффициент эластичности следующим образом: при изменении фактора xj на его среднюю величину и при постоянстве других входящих в уравнение факторов результативный признак в среднем изменится на ℓj части его средней величины (или на ℓj 
 средних, если ℓj>1, что бывает реже). Часто говорят, «изменится на ℓj процентов на 1% изменения фактора». 
 

 

 

 

 

 

 

 

 

 

 

 

            

 

 

 

 

 

     Включение в многофакторную модель неколичественных факторов 
Неколичественными являются такие факторы аграрного производства, как природная зона, форма собственности предприятий, преобладающее производственное направление (отрасль) и другие. Предпочтительно не смешивать в исходной совокупности предприятия или регионы, различающиеся по этим качественным признакам. Но может возникнуть и необходимость построения модели с неоднородными единицами совокупности, например, если число единиц, однородных по качественному признаку, слишком мало для надежной связи. Иногда может быть поставлена цель измерения чистого влияния неколичественного фактора, например, формы собственности на результаты производства, а это требует включения качественного фактора в многофакторную модель. 
В таких случаях качественные градации признака можно закодировать специальными переменными, часто называемыми «фиктивными» или «структурными» переменными. Они отражают неоднородность качественной структуры совокупности. Предположим, необходимо построить регрессионную модель рентабельности продукции предприятий, причем в регионе имеется 16 государственных предприятий, 28 частных, 13 кооперативной формы собственности. 
Если игнорировать различия, связанные с формой собственности, то они или уйдут в остаточную вариацию, ухудшив модель рентабельности, либо в неизвестной пропорции станут смешиваться с влиянием тех или иных качественных факторов, искажая меру их влияния. 
Необходимо для m 
неколичественных факторов или градаций такового фактора ввести m 
-1 структурную переменную, обозначим которую Uj. Данные для расчета будут иметь следующий вид при m 
=3 (табл. 2). 
Таблица 2. Исходные данные со структурными переменными

 
Форма собственности

 
Единица совокупности

 
Количественные признаки

 
Структурные переменные

 
y

 
X1

 
X2

 

 
Xk

 
U1

 
U2

 
Государственная

 

 

 

 

 
16

 
Значения этих признаков

 

 

 

 

 
0

 

 

 

 

 
0

 
Частная

 
17 
 
18 
 

 

 
43 
 
44

 
Значения этих признаков

 

 

 

 

 

 
1

 

 

 

 

 

 
0

 
Кооперативная

 
45 
 
46 
 

 

 
57 
 
58

 
Значения этих признаков

 

 

 

 

 

 
0

 

 

 

 

 

 
1

                 

Информация о работе Специфика моделей регрессии