Классическая модель линейной регрессии

Автор работы: Пользователь скрыл имя, 18 Декабря 2012 в 12:24, лабораторная работа

Краткое описание

1) рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.
2) дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
3) оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
4) оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.
5) оцените качество уравнения через среднюю ошибку аппроксимации.
6) рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
7) постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
8) постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

Вложенные файлы: 1 файл

лабораторная работа №1.doc

— 998.50 Кб (Скачать файл)

 

Таким образом, фактические значения результативного  признака отличаются от теоретических  значений на 1,16 %. Следовательно, построенная модель является удовлетворительной.

 

6. Рассчитаем матрицу парных коэффициентов корреляции и отберем информативные факторы в модели. Укажем коллинеарные факторы.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении  множественной регрессии.

Парные коэффициенты корреляции рассчитываются по формулам:

 

;          
.

 

Матрицу парных коэффициентов  корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция.

Результаты вычислений – матрица коэффициентов парной корреляции – представлены на рисунке 1.3.

 

Рисунок 1.3 – Матрица коэффициентов парной корреляции

 

Из матрицы  можно заметить, что факторы  и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи  с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и . Построим новое уравнение множественной регрессии с информативными факторами.

 

7. Строим модель  в естественной форме только с информативными факторами и оцениваем ее параметры.

Построим уравнение  множественной линейной регрессии  следующего вида:

 

.

 

Параметры вычисляем аналогично пункту 1 (рисунок 1.4).

 

Рисунок 1.4 – Результат применения инструмента Регрессия

Получаем уравнение  следующего вида: .

Уравнение в  целом, а также его параметры  являются статистически значимыми.

 

8. Построим модель в стандартизованном масштабе и проинтерпретируем ее параметры.

Уравнение в  стандартизованном масштабе имеет  вид: .

Расчет β  – коэффициентов выполним по формулам

;            
.

Парные коэффициенты корреляции берутся из матрицы (рисунок 1.6):

Получим уравнение  .

Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем  результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.

В нашем случае:

– для  при увеличении использования капитала на 1 сигму чистый доход увеличится на 0,34 сигм, при условии, что численность служащих остаются на прежнем уровне;

– для при увеличении использования капитала на 1 сигму чистый доход увеличится на 0,59 сигм, при условии, что численность служащих остаются на прежнем уровне.

 

9. Рассчитаем прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

Рассчитаем  ожидаемое прогнозное значение чистого  дохода как точечный прогноз путем  подстановки в уравнение регрессии  прогнозные значения факторов:

    1. найдем максимальное значение для фактора (рисунок 1.2):
    2. найдем максимальное значение для фактора (рисунок 1.2):
    3. найдем прогнозные значения факторов:

для фактора  :

для фактора  :

    1. подставим прогнозные значения факторов в уравнение

В результате получим:

Таким образом, при прогнозных значениях использованного капитала 285,12 млдр. долл. и численности служащих 172,88 тыс. чел. чистый доход крупнейших компаний США составит 50,72 млрд. долл.

 

10. Рассчитайте  ошибки и доверительный интервал  прогноза для уровня значимости  .

Доверительный интервал прогноза имеет следующий  вид:

 

где - средняя ошибка прогнозируемого значения ;

- вектор-столбец прогнозных  значений факторов;

- стандартная ошибка  .

Рассчитаем  доверительный интервал прогноза по следующим этапам:

    1. составим вектор-столбец
    2. найдем транспонируемый вектор-столбец
    3. из рисунка 1.2 ; из рисунка 1.4 R2 =0,75
    4. найдем стандартную ошибку
    5. составим матрицу X - 25 наблюдаемых значений независимых переменных и , размер которой 25 3 (добавлен единичный столбец для определения a0)

 

Матрица X

1

68

12,5

1

49,3

18,8

1

66,6

7

1

17,3

14,6

1

78,5

30,7

1

20,9

28

1

356,4

100,6

1

72,4

24,8

1

218,2

216,1

1

5

1,2

1

28,8

7,8

1

68

12,4

1

47,5

17,9

1

45,4

61,5

1

43,9

30,5

1

11,5

9,7

1

46,8

41,2

1

24,8

27,8

1

54

40,6

1

42,8

17,2

1

5,8

38

1

31

20,5

1

41,4

19

1

6,8

6,7

1

20,9

23,4


 

Транспонированная матрица XТ

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

68

49

67

17

79

21

356

72

218

5

29

68

48

45

44

12

47

25

54

43

5,8

31

41

6,8

21

13

19

7

15

31

28

101

25

216

1,2

7,8

12

18

62

31

9,7

41

28

41

17

38

21

19

6,7

23


 

    1. найдем произведение

 

 

    1. найдем 

 

 

    1. найдем выражение 
    2. вычислим среднюю ошибку прогнозируемого значения

    1. по таблицам распределения Стьюдента находим табличное значение при уровне значимости 0,05 и числе степеней свободы 22.

    1. составляем доверительный интервал:

Значит, с вероятностью 95 % можно сказать, что чистый доход будет колебаться от 49,575 до 51,865 млрд. долл. при использованном капитале в 285,12 млрд. долл. и численности служащих 172,88 тыс. чел.

 

11. Экономические выводы по полученным результатам.

Анализ коэффициентов уравнения множественной регрессии:

позволяет сделать вывод  о степени влияния каждого  из двух факторов на показатель чистого дохода. Так, параметр b2=0,0067 свидетельствует  о том, что с увеличением используемого капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,0067 млрд. долл. (прямая связь). Увеличением численности служащих на 1 тыс. чел. чистый доход увеличится в среднем на 0,019 млрд. долл. Отсюда можно сделать соответствующие практические выводы и осуществить мероприятия, направленные на повышение чистого дохода.

Однако на основе коэффициентов  регрессии нельзя сказать, какой  из факторных признаков оказывает  наибольшее влияние на результативный признак, так как коэффициенты регрессии  между собой несопоставимы, поскольку они измерены разными единицами. На их основе нельзя также установить, в развитии каких факторных признаков заложены наиболее крупные резервы изменения результативного показателя, потому что в коэффициентах регрессии не учтена вариация факторных признаков.

Чтобы иметь возможность  судить о сравнительной силе влияния  отдельных факторов и о тех  резервах, которые в них заложены, должны быть вычислены частные коэффициенты эластичности , а также бета-коэффициенты .  

Частный коэффициент эластичности  показывает,  на  сколько  процентов  в среднем изменяется признак-результат Y с изменением признака-фактора Х на один процент от своего среднего уровня при фиксированном положении других факторов модели. В случае линейной зависимости Э рассчитываются по формуле:

Средний коэффициент эластичности , показывает, что с увеличением используемого капитала на 1 %, чистый доход увеличивается в среднем на 0,0085 %, при условии, что другие факторы остаются постоянными. Аналогично, средний коэффициент эластичности , показывает, что с увеличением численности служащих на 1 %, чистый доход увеличивается в среднем на 0,0135 %, при условии, что другие факторы остаются постоянными.

Для определения факторов,  в развитии которых заложены наиболее крупные резервы улучшения изучаемого показателя, необходимо учесть различия в степени варьирования вошедших в уравнение факторов. Стандартизированные частные коэффициенты регрессии - β-коэффициенты (b) показывают, на какую часть своего среднего квадратического отклонения изменится признак-результат Y с изменением соответствующего фактора  на величину своего среднего квадратического отклонения (sх) при неизменном влиянии прочих факторов (входящих в уравнение). Покажем это с помощью β-коэффициентов, которые мы получили в расчетах (берутся из матрицы рисунок 1.6):

Откуда видно, что для  при увеличении использования капитала на 1 сигму чистый доход увеличится на 0,34 сигм, при условии, что численность служащих остаются на прежнем уровне. Аналогично для при увеличении использования капитала на 1 сигму чистый доход увеличится на 0,59 сигм, при условии, что численность служащих остаются на прежнем уровне.

Следует иметь ввиду, что по коэффициентам эластичности и β-коэффициентам могут быть сделаны противоположные выводы. Причины этого: а) вариация одного фактора очень велика; б) разнонаправленное воздействие факторов на результат.

Кроме того, коэффициент a может интерпретироваться как показатель прямого (непосредственного) влияния фактора (Х) на результат (Y). Во множественной регрессии    фактор оказывает не только прямое, но и косвенное (опосредованное) влияние на результат (т.е. влияние через другие факторы модели).

 

 

 

 

 

 

 

 

 


Информация о работе Классическая модель линейной регрессии