Статистическая обработка данных

Автор работы: Пользователь скрыл имя, 31 Мая 2013 в 12:29, контрольная работа

Краткое описание

Имеются данные выборки о работе 30 предприятий (стоимость ОПФ и выпуск продукции). Рассматриваются способы построения вариационного ряда, группировки, оценка корреляции факторного и результативного признаков.
Группировка 30 предприятий по стоимости основных фондов с разбивкой на пять групп с равными интервалами показала, что изучаемая совокупность не имеет нормальной формы распределения.
Был построен ряд распределения, найдены его числовые характеристики, приведены графики. Рассчитан коэффициент вариации, равный 30%, что характеризует совокупность как однородную.

Содержание

Проверить первичную информацию по факторному признаку (средняя стоимость основных фондов) на однородность и нормальность распределения. Исключить резко выделяющиеся единицы.
Постройте статистический ряд распределения организаций по факторному признаку. Число групп определить по формуле Стерджесса.
Построить графики полученного ряда распределения (гистограмму, кумуляту).
Рассчитайте характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации, определить значения моды и медианы.
Построить график кривой Лоренца. Сделать выводы о степени концентрации единиц по изучаемому признаку.
Полагая, что данные представляют собой 10% простую случайную выборку, с вероятностью 0,954 определить доверительные интервалы, в которых будет находиться средняя величина факторного признака в генеральной совокупности.
Проанализировать зависимость результативного признака от факторного. Анализ выполнить в следующей последовательности:
установить факт наличия корреляционной зависимости и ее направление с использованием групповой корреляционной таблицы, дать графическое изображение эмпирической линии связи;
проверить правило сложения дисперсий. Сформулировать вывод о степени влияния факторного признака на величину результативного с помощью эмпирического корреляционного отношения;
измерить степень тесноты связи с помощью линейного коэффициента корреляции. Проверить возможность использования линейной функции в качестве формы уравнения;
рассчитать параметры уравнения парной зависимости, оценить возможность ее практического применения с использованием средней квадратической ошибки. Дать оценку результатов исследования взаимосвязи в целом.

Вложенные файлы: 1 файл

СТАТИСТИКА.doc

— 596.00 Кб (Скачать файл)

 

 

Коэффициент парной корреляции очень близок к 1,0, поэтому можно говорить об очень тесной связи исследуемых признаков.

Уравнение модели линейной парной регрессии  имеет вид

 =
 
+
 
+

где

,
 
– выборочные значения факторного и результативного признаков;
,
 
– параметры уравнения регрессии;
 
– ошибки. Оценкой модели по выборке является выборочное уравнение регрессии:

 ( – теоретические значения результативного признака). Коэффициенты ,  определяются на основе метода наименьших квадратов и имеют вид 

, где

sx, sy – средние квадратические отклонения признаков.

В нашем случае:

Найдем значения коэффициентов  регрессии  

 

На основе выборочного уравнения  регрессии получим явный вид  зависимости признака  от фактора

По этому уравнению рассчитаем значения у, найдем отклонения от статистических значений, среднюю относительную  ошибку.

 

Таблица 10

Определение линейного коэффициента корреляции

№№

х

у

урасч

Е=у-урасч

отн|

Е2

1

2

3

4

5

6

7

1

108

336

314,1

21,9

0,07

480,2

2

174

660

662,3

-2,3

0,00

5,5

3

234

930

978,9

-48,9

0,05

2395,2

4

114

363

345,7

17,3

0,05

297,7

5

240

1068

1010,6

57,4

0,05

3294,7

6

330

1464

1485,5

-21,5

0,01

462,1

7

126

426

409,1

16,9

0,04

286,8

8

282

1161

1232,2

-71,2

0,06

5072,1

9

138

450

472,4

-22,4

0,05

501,1

10

198

771

789,0

-18,0

0,02

323,4

11

315

1404

1406,3

-2,3

0,00

5,5

12

210

846

852,3

-6,3

0,01

39,7

13

285

1200

1248,0

-48,0

0,04

2308,7

14

165

600

614,9

-14,9

0,02

220,6

15

222

906

915,6

-9,6

0,01

92,6

16

345

1509

1564,6

-55,6

0,04

3096,5

17

234

939

978,9

-39,9

0,04

1595,3

18

150

540

535,7

4,3

0,01

18,4

19

297

1431

1311,4

119,6

0,08

14311,7

20

186

693

725,7

-32,7

0,05

1066,9

21

249

1083

1058,1

24,9

0,02

620,5

22

147

525

519,9

5,1

0,01

26,3

23

270

1194

1168,9

25,1

0,02

630,0

24

174

600

662,3

-62,3

0,10

3886,7

25

111

374

329,9

44,1

0,12

1943,4

26

216

849

884,0

-35,0

0,04

1222,3

27

129

420

424,9

-4,9

0,01

24,0

28

195

765

773,2

-8,2

0,01

66,5

29

300

1450

1327,2

122,8

0,08

15080,3

30

210

897

852,3

44,7

0,05

1997,9

Сумма

6354,0

25854,0

 

0,0

1,2

61372,6


 

Средняя квадратическая ошибка уравнения  регрессии:

 

 

 

 

Средняя по модулю относительная ошибка аппроксимации:

Допускается не более 10%.

 

Выводы в целом:

        1. Группировка 30 предприятий по стоимости основных фондов с разбивкой на пять групп с равными интервалами показала, что изучаемая совокупность не имеет  нормальной формы распределения.
        2. Был построен ряд распределения, найдены его числовые характеристики, приведены графики. Рассчитан коэффициент вариации, равный 30%, что характеризует совокупность как однородную.
        3. С вероятностью 0,954 определены доверительные интервалы средней величины основных фондов в генеральной совокупности.
        4. Рассчитано эмпирическое корреляционное отношение, равное 0,943, свидетельствующее о тесной корреляционной связи между стоимостью ОФ и выпуском продукции.
        5. Рассчитаны параметры линейного уравнения регрессии и линейный коэффициент корреляции, равный 0,992, что также характеризует тесную корреляционную связь факторного и результативного признаков. Средняя по модулю ошибка аппроксимации не превышает 10%.



Информация о работе Статистическая обработка данных