Статистическая обработка данных

Автор работы: Пользователь скрыл имя, 31 Мая 2013 в 12:29, контрольная работа

Краткое описание

Имеются данные выборки о работе 30 предприятий (стоимость ОПФ и выпуск продукции). Рассматриваются способы построения вариационного ряда, группировки, оценка корреляции факторного и результативного признаков.
Группировка 30 предприятий по стоимости основных фондов с разбивкой на пять групп с равными интервалами показала, что изучаемая совокупность не имеет нормальной формы распределения.
Был построен ряд распределения, найдены его числовые характеристики, приведены графики. Рассчитан коэффициент вариации, равный 30%, что характеризует совокупность как однородную.

Содержание

Проверить первичную информацию по факторному признаку (средняя стоимость основных фондов) на однородность и нормальность распределения. Исключить резко выделяющиеся единицы.
Постройте статистический ряд распределения организаций по факторному признаку. Число групп определить по формуле Стерджесса.
Построить графики полученного ряда распределения (гистограмму, кумуляту).
Рассчитайте характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, определить значения моды и медианы.
Построить график кривой Лоренца. Сделать выводы о степени концентрации единиц по изучаемому признаку.
Полагая, что данные представляют собой 10% простую случайную выборку, с вероятностью 0,954 определить доверительные интервалы, в которых будет находиться средняя величина факторного признака в генеральной совокупности.
Проанализировать зависимость результативного признака от факторного. Анализ выполнить в следующей последовательности:
установить факт наличия корреляционной зависимости и ее направление с использованием групповой корреляционной таблицы, дать графическое изображение эмпирической линии связи;
проверить правило сложения дисперсий. Сформулировать вывод о степени влияния факторного признака на величину результативного с помощью эмпирического корреляционного отношения;
измерить степень тесноты связи с помощью линейного коэффициента корреляции. Проверить возможность использования линейной функции в качестве формы уравнения;
рассчитать параметры уравнения парной зависимости, оценить возможность ее практического применения с использованием средней квадратической ошибки. Дать оценку результатов исследования взаимосвязи в целом.

Вложенные файлы: 1 файл

СТАТИСТИКА.doc

— 596.00 Кб (Скачать файл)

По условию выборка 10%, значит

Выборочная  дисперсия определена ранее: S2 = 3914,2.

Найдем  ошибку выборки (для средней):

Предельная ошибка:

Доверительный интервал для генеральной  средней:

210,4±21,6 = 188,8..232,0

Таким образом, с вероятностью 0,954 можно утверждать, что генеральная средняя выпуска продукции на указанных предприятиях лежит в пределах 188,8..232,0 млн.руб.

Установим наличие и характер связи между признаками среднегодовая стоимость основных фондов и выпуск продукции, образовав пять групп с равными интервалами по обоим признакам, методами:

а) аналитической группировки;

б) корреляционной таблицы.

 

Примем объем среднегодовой стоимости основных фондов  за факторный признак (х),  по  которому будем группировать предприятия, а выпуск продукции будет результативным признаком (у). Используем полученную ранее разбивку предприятий на группы по величине ОФ.

Для определения наличия зависимости  между факторным признаком– х, и результативным признаком – у, проведем аналитическую группировку, образовав пять групп с равными интервалами.

По каждой группе и всей совокупности в целом определим: число предприятий, среднегодовую стоимость основных фондов – всего и в среднем на одно предприятие, объем выпуска продукции – всего и в среднем на одно предприятие. Результаты оформим в рабочей (табл.5) и в аналитической (табл.6) таблицах.

 

                                                                          Таблица 5

Рабочая таблица группировки предприятий по среднегодовой стоимости

основных фондов

 

 

№№

групп

 

Величина

интервалов,

млн.руб.

 

 

№№

предпр.

Среднегодовая стоимость ОПФ, млн.руб..

Объем выпуска  продукции, млн.руб.

всего

в ср.на 1

предпр.

всего

в ср.на 1 предпр.

   

1

108

 

336

 
   

25

111

 

374

 
   

4

114

 

363

 

I

108-156

7

126

 

426

 
   

27

129

 

420

 
   

9

138

 

450

 
   

22

147

 

525

 
   

18

150

 

540

 

Итого по I группе

8

1023,0

127,9

3434,0

429,3

 
   

14

165

 

600

 
   

2

174

 

660

 
   

24

174

 

600

 

II

156-204

20

186

 

693

 
   

28

195

 

765

 
   

10

198

 

771

 

Итого по II группе

6

1092,0

182,0

4089,0

681,5

 
   

12

210

 

846

 
   

30

210

 

897

 
   

26

216

 

849

 
   

15

222

 

906

 

III

204-252

3

234

 

930

 
   

17

234

 

939

 
   

5

240

 

1068

 
   

21

249

 

1083

 

Итого по III группе

8

1815,0

226,9

7518,0

939,8

 
   

23

210

 

897

 
   

8

285

 

1200

 

IV

252-300

13

234

 

939

 
   

19

150

 

540

 
   

29

297

 

1431

 

Итого по IV группе

5

1176,0

235,2

5007,0

1001,4

 
   

11

315

 

1404

 

V

Более 300

6

330

 

1464

 
   

16

345

 

1509

 

Итого по V группе

3

990,0

330,0

4377,0

1459,2

Всего

30

6354,0

211,8

25854,0

861,8


 

 

 

Таблица 6

Аналитическая таблица группировка предприятий 

 

№№

групп

 

Величина

интервалов,

млн.руб.

 

Число

предпр.

Среднегодовая стоимость  ОФ, млн.руб..

Объем выпуска продукции, млн.руб.

всего

в ср.на 1

предпр.

всего

в ср.на 1 предпр.

I

108-156

8

1023,0

127,9

3434,0

429,3

II

156-204

6

1092,0

182,0

4089,0

681,5

III

204-252

8

1815,0

226,9

7518,0

939,8

IV

252-300

5

1176,0

235,2

5007,0

1001,4

V

Более 300

3

990,0

330,0

4377,0

1459,2

Итого

 

30

6354,0

211,8

25854,0

861,8


 

Аналитическая группировка показала наличие прямой связи между  среднегодовой стоимостью ОФ и объемом выпуска продукции  (в расчете на одно предприятие) – чем больше среднегодовая стоимость ОФ, тем больше объем выпуска продукции: от 127,9 до 330,0 млн.руб. основных фондов и от 429,3 до 1459,2 млн.руб. объема выпуска продукции.

Для проверки наличия корреляционной связи между этими признаками, составим рабочую (табл.7) и корреляционную таблицу (табл.7а). Для составления рабочей таблицы используем полученные интервалы разбивки предприятий по среднегодовой стоимости ОФ, а величину интервалов по объему выпуска продукции рассчитаем по формуле:

hОВП = (ОВПmax  - ОВПmin )/5 = (1509 – 336)/5 = 235 (млн.руб.)

 

        Таблица 7

Рабочая таблица

у

х

336-571

571-806

806-1041

1041-1276

более 1276

108-156

********

       

156-204

 

******

     

204-252

   

******

**

 

252-300

     

***

*

Более 300

       

****


 

Заполним таблицу следующим  образом: просматривая показатели всех 30 предприятий, будем отмечать «*», если данные какого-то предприятия попадают в соответствующую клетку табл.7. Обозначим количество предприятий, отмеченных в клетках, цифрами (табл.7а).

 

 

 

 

 

Таблица 7а

Корреляционная таблица

у

х

336-571

571-806

806-1041

1041-1276

более 1276

Итого:

108-156

8

       

8

156-204

 

6

     

6

204-252

   

6

2

 

8

252-300

     

3

1

4

Более 300

       

4

4

Итого:

8

6

6

5

5

30


Характер расположения количества предприятий в клетках табл.7а позволяет утверждать, что между факторами Х и Y имеется прямая корреляционная связь.

  1. Измерим тесноту корреляционной связи между названными признаками с использованием коэффициента детерминации и эмпирического корреляционного отношения.

4. Для определения тесноты связи  между среднегодовой стоимостью ОПФ и объемом выпуска продукции  найдем эмпирическое корреляционное отношение по формуле:

 где

sх2 - межгрупповая дисперсия результативного признака Y (стоимости ОФ), характеризующая его вариацию за счет группировочного признака Х (объема выпуска продукции) и определяемая по данным таблицы 8 по формуле:

 где

групповая средняя результативного  признака Y;

общая средняя (по всем группам) результативного признака Y;

  ¦ - число предприятий в группе;

 

sу2 - общая дисперсия результативного признака Y, определяемая по формуле:

 где

 объем выпуска продукции на каждом предприятии, млн.руб.;

 объем выпуска продукции по всем предприятиям, млн.руб.;

n - общее число предприятий.

Для нахождения межгрупповой дисперсии  составим расчетную таблицу (табл.8). Значения групповых средних и общей средней результативного признака у возьмем из таблицы 6.

Таблица 8

Расчетная таблица для  нахождения межгрупповой дисперсии s2х

Интервалы стоимости ОФ,

млн.руб.,

Число предприятий, f

Средний объем выпуска продукции на 1 предприятие, млн.руб., yi_cp

 

yi_cp - ycp

 

(yi_cp - ycp)2

 

(yi_cp - ycp)2*f

108-156

8

429,3

-432,50

187056,25

1496450,00

156-204

6

681,5

-180,30

32508,09

195048,54

204-252

8

939,8

78,00

6084,00

48672,00

252-300

5

1001,4

139,60

19488,16

97440,80

Более 300

3

1459,2

597,40

356886,76

1070660,28

 

30

861,8

   

2908271,62


 

Расчет межгрупповой дисперсии  результативного признака.

 

Для расчета общей дисперсии  результативного признака составим расчетную таблицу 9.

 

      Таблица 9

Расчет общей дисперсии  результативного признака

№ орга-низации

уi, млн.руб

y2

1

336

112896,00

2

660

435600,00

3

930

864900,00

4

363

131769,00

5

1068

1140624,00

6

1464

2143296,00

7

426

181476,00

8

1161

1347921,00

9

450

202500,00

10

771

594441,00

11

1404

1971216,00

12

846

715716,00

13

1200

1440000,00

14

600

360000,00

15

906

820836,00

16

1509

2277081,00

17

939

881721,00

18

540

291600,00

19

1431

2047761,00

20

693

480249,00

21

1083

1172889,00

22

525

275625,00

23

1194

1425636,00

24

600

360000,00

25

374

139876,00

26

849

720801,00

27

420

176400,00

28

765

585225,00

29

1450

2102500,00

30

897

804609,00

Итого

25854,00

26205164,00


 

 

Общая дисперсия результативного  признака равна:

 

Находим коэффициент детерминации:

Найдем эмпирическое корреляционное соотношение:

 

 

 

Анализ показателей группировочной таблицы и выводы.

 

   1. В результате разбивки  предприятий по среднегодовой стоимости ОФ на 5 групп с равными интервалами  получены следующие данные:

  • корреляционная таблица указывает на наличие прямой корреляционной связи между факторным и результативным признаками;
  • величина эмпирического корреляционного отношения довольно близка к 1,0, что свидетельствует о достаточно высокой тесноте связи между группировочным и результативным признаками, т.е. между среднегодовой стоимостью ОПФ и объемом выпуска продукции (связь считается тесной при величине этого показателя в пределах 0,7..1,0.

 

Линейный коэффициент корреляции  может принимать любые значения в пределах от –1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи – прямой зависимости соответствует плюс, а обратной зависимости – знак минус. Считают, что если коэффициент корреляции более 0,9, то связь между исследуемыми признаками тесная. Степень тесноты связи определяется шкалой Чеддока:

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 1,0

 

слабая

умеренная

заметная

высокая

тесная


 

Расчет линейного коэффициента корреляции производится по следующей  формуле:

 

,

где ,  – индивидуальные значения факторного и результативного признаков; ,  – средние значения признаков.

Расчет значений для определения  линейного коэффициента корреляции будем вести в табличной форме, табл.10.

Таблица 10

Определение линейного коэффициента корреляции

№№

х

у

(x-xcp)

(x-xcp)2

(y-ycp)

(y-ycp)2

4*6

   

1

2

3

4

5

6

7

8

9

10

1

108

336

-103,8

10774,4

-525,8

276465,6

54578,0

   

2

174

660

-37,8

1428,8

-201,8

40723,2

7628,0

   

3

234

930

22,2

492,8

68,2

4651,2

1514,0

   

4

114

363

-97,8

9564,8

-498,8

248801,4

48782,6

   

5

240

1068

28,2

795,2

206,2

42518,4

5814,8

   

6

330

1464

118,2

13971,2

602,2

362644,8

71180,0

   

7

126

426

-85,8

7361,6

-435,8

189921,6

37391,6

   

8

282

1161

70,2

4928,0

299,2

89520,6

21003,8

   

9

138

450

-73,8

5446,4

-411,8

169579,2

30390,8

   

10

198

771

-13,8

190,4

-90,8

8244,6

1253,0

   

11

315

1404

103,2

10650,2

542,2

293980,8

55955,0

   

12

210

846

-1,8

3,2

-15,8

249,6

28,4

   

13

285

1200

73,2

5358,2

338,2

114379,2

24756,2

   

14

165

600

-46,8

2190,2

-261,8

68539,2

12252,2

   

15

222

906

10,2

104,0

44,2

1953,6

450,8

   

16

345

1509

133,2

17742,2

647,2

418867,8

86207,0

   

17

234

939

22,2

492,8

77,2

5959,8

1713,8

   

18

150

540

-61,8

3819,2

-321,8

103555,2

19887,2

   

19

297

1431

85,2

7259,0

569,2

323988,6

48495,8

   

20

186

693

-25,8

665,6

-168,8

28493,4

4355,0

   

21

249

1083

37,2

1383,8

221,2

48929,4

8228,6

   

22

147

525

-64,8

4199,0

-336,8

113434,2

21824,6

   

23

270

1194

58,2

3387,2

332,2

110356,8

19334,0

   

24

174

600

-37,8

1428,8

-261,8

68539,2

9896,0

   

25

111

374

-100,8

10160,6

-487,8

237948,8

49170,2

   

26

216

849

4,2

17,6

-12,8

163,8

-53,8

   

27

129

420

-82,8

6855,8

-441,8

195187,2

36581,0

   

28

195

765

-16,8

282,2

-96,8

9370,2

1626,2

   

29

300

1450

88,2

7779,2

588,2

345979,2

51879,2

   

30

210

897

-1,8

3,2

35,2

1239,0

-63,4

   

Сумма

6354,0

25854,0

0,0

138736,8

0,0

3924186,8

732061,8

   
                   
                   

Информация о работе Статистическая обработка данных