Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 25 Июня 2013 в 10:40, лабораторная работа

Краткое описание

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Вложенные файлы: 1 файл

laba_statistika.doc

— 605.50 Кб (Скачать файл)

 

Величина дисперсии генеральной совокупности может быть оценена непосредственно по выборочной дисперсии .

В математической статистике доказано, что при малом числе  наблюдений (особенно при n 40-50) для вычисления генеральной дисперсии по выборочной дисперсии следует использовать формулу

.

При достаточно больших n значение поправочного коэффициента близко к единице (при n=100 его значение равно 1,101, а при n=500 - 1,002 и т.д.). Поэтому при достаточно больших n можно приближено считать, что обе дисперсии совпадают:

.

Рассчитаем отношение для двух признаков:

Для первого признака =1,03, для второго признака =1,03.

Вывод: Степень расхождения между признаками отсутствует.

Для нормального распределения  справедливо равенство RN=6sN.

В условиях близости распределения  единиц генеральной совокупности к  нормальному это соотношение  используется для прогнозной оценки размаха вариации признака в генеральной  совокупности.

Ожидаемый размах вариации признаков RN:

- для первого признака RN =1451,22, Rn=1000;

- для второго признака RN  =1731,24, Rn=1200.

Величина расхождения между показателями RN и Rn:

- для первого признака |RN -Rn|=451,22;

- для второго признака |RN -Rn| =531,24.

 

Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.

Как правило, статистические характеристики выборочной и генеральной совокупностей  не совпадают, а отклоняются на некоторую  величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность

= |
-
|

определяет ошибку репрезентативности для средней величины признака.

Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой)  выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[ ] генеральной средней .

Для изучаемых признаков  средние ошибки выборки  даны в табл. 3:

- для признака Среднегодовая стоимость основных производственных фондов

=44,16,

- для признака Выпуск продукции

=52,68.

Предельная  ошибка выборки  определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1,  гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.

Для уровней надежности P=0,954; P=0,997; P=0,683 оценки предельных ошибок выборки даны в табл. 3, табл. 4а и табл. 4б.

Для генеральной средней  предельные значения и доверительные  интервалы определяются выражениями:

,

Предельные ошибки выборки и ожидаемые границы для генеральных средних представлены в табл. 11.

Таблица 11

Предельные ошибки выборки  и ожидаемые границы для генеральных  средних

Доверительная

вероятность

Р

Коэффициент

доверия

t

Предельные ошибки выборки

Ожидаемые границы для средних

для первого

признака

для второго

признака

для первого

признака

для второго

признака

0,683

1

44,96

53,64

1345,04

1434,96

1250,69

1357,97

0,954

2

92,07

109,83

1297,93

1482,07

1194,5

1414,16

0,997

3

143,05

170,65

1246,95

1533,05

1133,68

1474,98


 

Задача 3 Значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.

Показатель  асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака. (среднее значение больше серединного Me и модального Mo).

Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака (среднее значение меньше серединного Me и модального Mo).

Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:

|As|  0,25  - асимметрия незначительная;

0,25<|As| 0.5 - асимметрия заметная (умеренная);

|As|>0,5  - асимметрия существенная.

Вывод: Для признака Среднегодовая стоимость основных производственных фондов наблюдается незначительная левосторонняя асимметрия. Для признака Выпуск продукции наблюдается незначительная правосторонняя асимметрия.

Показатель  эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.

Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.

Если Ek>0, то вершина кривой распределения располагается выше  вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.

Если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

Для нормального распределения Ek=0. При незначительном отклонении Ek от нуля форма кривой эмпирического распределения незначительно отличается от формы нормального распределения. Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.

Вывод: Для признака Среднегодовая стоимость основных производственных фондов Ek<0, что свидетельствует о том, что вершина кривой лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

Для признака Выпуск продукции Ek<0, что свидетельствует о том, что вершина кривой лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

 

III. Экономическая интерпретация результатов статистического исследования предприятий2

Задача 1.

Вывод: Предприятия с резко выделяющимися характеристиками: №11, №30

 

 

Задача 2.

Вывод: -Для показателя «Среднегодовая стоимость основных производственных фондов: Xср.=1390 млн.руб., σ=237,81 млн.руб;        

-Для показателя «Выпуск  продукции»: Xср.=1304,33 млн.руб., σ=283,69 млн.руб;

-Для показателя «Среднегодовая стоимость основных производственных фондов» предприятия, входящие в диапазон ( ): №2, 3,4, 6, 7, 9, 10, 13, 14, 17, 18, 19, 20, 22, 24, 25, 26, 28, 29, 31.

-Для показателя «Выпуск продукции» предприятия, входящие в диапазон  ( ): №1, 2, 3, 4, 6, 8, 9, 13, 14, 17, 18, 20, 24, 25, 26, 28, 29, 31, 32.

 

Задача 3.

Вывод: Коэффициенты вариации: для показателя «Среднегодовая стоимость основных производственных фондов» =17,11, для показателя «Выпуск продукции» =21,75. Из значений коэффициентов видно, что предприятия по этим характеристикам однородны. Максимальное расхождение в значениях показателей для признака «Среднегодовая стоимость основных производственных фондов»-1000 млн.руб.; для показателя «Выпуск продукции» -1200 млн.руб.

 

Задача 4.

Вывод: Модальный интервал - /1290-1490\.

    • Типичные предприятия, входящие в интервал: № 3, 4, 6, 7, 9, 13, 14, 17, 25, 26, 28;
    • Предприятия, входящие в группу с наибольшей стоимостью основных фондов: № 12, 16, 21;
    • Предприятия, входящие в группу с наименьшей стоимостью основных фондов: № 1, 5, 23, 27;
    • Удельный вес предприятий модального интервала: P=11/30=0,367 или 36,7%;
    • Удельный вес предприятий с наибольшими значениями: P=3/30=0,1 или 10%;
    • Удельный вес предприятий с наименьшими значениями: P=4/30=0,133 или 13,3%;

 

 

Задача 5.

Вывод: AsП =-0,21, распределение близко к нормальному. В совокупности  доминируют предприятия с более низкой стоимостью основных фондов.

Задача 6.

Вывод: Для признака «Среднегодовая стоимость основных производственных фондов»: R=1451,22; для признака «Выпуск продукции»: R=1731,24. Прогнозные оценки размаха вариации для обоих признаков расходятся на незначительную величину.

Для показателя «Среднегодовая стоимость основных производственных фондов» 

 

доверительная вероятность:                    предельные ошибки средней:

0,683        1345,04-1434,96                                               44,96

          0,954         1297,93-1482,07                                               92,07

0,997         1246,95-1533,05                                               143,05

  Для показателя  «Выпуск продукции» 

 

доверительная вероятность:                    предельные ошибки средней:

0,683         1250,69-1357,97                                                53,64

0,954          1194,5-1414,16                                                 109,83

0,997           1133,68-1474,98                                               170,65

 

 

 

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ  ИНСТИТУТ

 

КАФЕДРА СТАТИСТИКИ

 

 

 

 

 

 

О Т  Ч Е Т 

о результатах  выполнения

компьютерной  лабораторной работы №2

Автоматизированный  корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel

 

Вариант №18

 

 

 

 

 

 

   Выполнил: Веретенникова О.Н.

                                                    Курс   2  группа № 1б-мн100

 Личное дело № 11млд11218  

                                                      Преподаватель: Зелепухина Е.Н.

 

 

 

 

 

 

 

Новороссийск-2013

 

 

 

 

 

 

 

 

 

 

1. Постановка  задачи

Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.

В Лабораторной работе № 2 изучается взаимосвязь между  факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

1070,00

1030,00

2

1260,00

1130,00

3

1300,00

1260,00

4

1370,00

1400,00

5

890,00

700,00

6

1440,00

1200,00

7

1480,00

1620,00

8

1110,00

1100,00

9

1360,00

1290,00

10

1570,00

1610,00

12

1720,00

1700,00

13

1310,00

1340,00

14

1440,00

1460,00

15

1650,00

1770,00

16

1890,00

1900,00

17

1410,00

1280,00

18

1560,00

1520,00

19

1240,00

950,00

20

1580,00

1300,00

21

1760,00

1750,00

22

1210,00

990,00

23

960,00

930,00

24

1610,00

1490,00

25

1440,00

1300,00

26

1340,00

1230,00

27

1040,00

800,00

28

1400,00

1250,00

29

1620,00

1370,00

31

1540,00

1300,00

32

1130,00

1160,00

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel