Контрольная работа по "Теории статистике"

Автор работы: Пользователь скрыл имя, 20 Июня 2013 в 12:04, контрольная работа

Краткое описание

Задание.
В таблице №1 «Макроэкономические показатели европейских стран» найдите данные (графу), соответствующие вашему варианту (последняя цифра зачетной книжки). По данным таблицы №1 построить структурную (вариационную) группировку. Количество групп взять равным 6.
По этим же данным построить графики распределения (кумуляту и гистограмму).

Вложенные файлы: 1 файл

статистика контрольная работа.doc

— 1.17 Мб (Скачать файл)

КОНТРОЛЬНАЯ РАБОТА 1.

ТЕОРИЯ СТАТИСТИКИ

 

ТЕМА №3. ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ1

 

Задание.

  1. В таблице №1 «Макроэкономические показатели европейских стран» найдите данные (графу), соответствующие вашему варианту (последняя цифра зачетной книжки). По данным таблицы №1 построить структурную (вариационную) группировку. Количество групп взять равным 6.
  2. По этим же данным построить графики распределения (кумуляту и гистограмму).

В таблице №1 представлена совокупность из 32 европейских стран (по горизонтали).

Варианты соответствуют следующим макроэкономическим показателям (по вертикали):

ВВП на душу населения (евро).

Таблица №1. «Макроэкономические показатели европейских стран»

Страна

Вариант

7

Бельгия

31500

Болгария

3800

Чехия

12300

Дания

41500

Германия

29500

Эстония

11400

Ирландия

43700

Греция

20400

Испания

23400

Франция

29800

Италия

25900

Кипр

20000

Латвия

8800

Литва

8400

Люксембург

75600

Венгрия

10100

Нидерланды

34600

Австрия

32600

Польша

8100

Португалия

15400

Румыния

5800

Словения

17100

Словакия

10200

Финляндия

34000

Швеция

36200

Великобрит.

33700

Хорватия

8600

Македония

2700

Турция

6500

Исландия

46900

Норвегия

60400

Швейцария

42075


 

Решение:

Ширина интервала составит:

 

 

Xmax - максимальное значение  группировочного признака в совокупности.

Xmin - минимальное значение  группировочного признака.

Определим границы группы.

Номер группы

Нижняя граница

Верхняя граница

1

2700

14850

2

14850

27000

3

27000

39150

4

39150

51300

5

51300

63450

6

63450

75600


 

Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.

Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или  иной интервал. Для этого сортируем ряд по возрастанию.

 

2700

2700 - 14850

1

3800

2700 - 14850

2

5800

2700 - 14850

3

6500

2700 - 14850

4

8100

2700 - 14850

5

8400

2700 - 14850

6

8600

2700 - 14850

7

8800

2700 - 14850

8

10100

2700 - 14850

9

10200

2700 - 14850

10

11400

2700 - 14850

11

12300

2700 - 14850

12

15400

14850 - 27000

1

17100

14850 - 27000

2

20000

14850 - 27000

3

20400

14850 - 27000

4

23400

14850 - 27000

5

25900

14850 - 27000

6

29500

27000 - 39150

1

29800

27000 - 39150

2

31500

27000 - 39150

3

32600

27000 - 39150

4

33700

27000 - 39150

5

34000

27000 - 39150

6

34600

27000 - 39150

7

36200

27000 - 39150

8

41500

39150 - 51300

1

42075

39150 - 51300

2

43700

39150 - 51300

3

46900

39150 - 51300

4

60400

51300 - 63450

1

75600

63450 - 75600

1


Результаты группировки  оформим в виде таблицы:

 

Группы

№ совокупности

Частота fi

Частность

То же накопленным итогом

2700 - 14850

1,2,3,4,5,6,7,8,9,10,11,12

12

37,50%

37,50%

14850 - 27000

13,14,15,16,17,18

6

18,75%

56,25%

27000 - 39150

19,20,21,22,23,24,25,26

8

25,00%

81,25%

39150 - 51300

27,28,29,30

4

12,50%

93,75%

51300 - 63450

31

1

3,13%

96,88%

63450 - 75600

32

1

3,13%

100,00%


 

 


Рис.1. Гистограмма ВВП на душу населения (евро)


Рис.2. Кумулята ВВП на душу населения. (евро)

 

 

ТЕМА №4. ОБОБЩАЮЩИЕ ХАРАКТЕРИСТИКИ СОВОКУПНОСТИ

Задание.

  1. По равноинтервальной группировке (результат выполнения задания темы №3) рассчитайте среднее арифметическое, медиану и моду

Таблица для расчета  показателей.

 

Группы

Середина интервала, xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср) * f

(x - xср)2 * f

Частота, fi/n

2700 - 14850

8775

12

105300

12

195918.75

3198679716.8

0.38

14850 - 27000

20925

6

125550

18

25059.38

104662045.9

0.19

27000 - 39150

33075

8

264600

26

63787.5

508605644.53

0.25

39150 - 51300

45225

4

180900

30

80493.75

1619810947.27

0.13

51300 - 63450

57375

1

57375

31

32273.44

1041574768.07

0.0313

63450 - 75600

69525

1

69525

32

44423.44

1973441799.32

0.0313

 

 

 

 

32

803250

 

 

441956.25

8446774921.88

1


 

Средняя взвешенная

 

 

Мода

Мода - наиболее часто встречающееся  значение признака у единиц данной совокупности.

 

где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.

Выбираем в качестве начала интервала 2700, так как именно на этот интервал приходится наибольшее количество.

 

Наиболее часто встречающееся  значение ряда – 10800

Медиана

В интервальном ряду распределения  сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует  варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером:

Находим середину ранжированного ряда: h = (n+1)/2 = (32+1)/2 = 17.

Медианным является интервал 2700 - 14850, т.к. в этом интервале накопленная  частота S, больше медианного номера.

Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

 

 

Таким образом, 50% единиц совокупности будут меньше по величине 22950

  1. По этим же данным измерьте вариацию при помощи показателей размаха вариации, дисперсии, среднего квадратического отклонения и коэффициента вариации.

Размах вариации - разность между максимальным и минимальным  значениями признака первичного ряда.

R = Xmax - Xmin

R = 75600 - 2700 = 72900

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

 

 

Среднее квадратическое отклонение (средняя ошибка выборки).

 

Каждое значение ряда отличается от среднего значения 25101.56 не более, чем  на 16246.9

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

 

Поскольку v>30% ,но v<70%, то вариация умеренная.

 

 

 

 

ТЕМА №5. ВЫБОРОЧНОЕ ИССЛЕДОВАНИЕ.

Задание.

По данным таблицы  №1 «Макроэкономические показатели европейских стран», соответствующим вашему варианту с вероятностью 0,95 определите доверительный интервал для генеральной средней, считая эти данные собственно-случайной повторной выборкой.

Доверительный интервал для  генерального среднего.

 

Поскольку n>30, то определяем значение tkp по таблицам функции Лапласа.

В этом случае 2Ф(tkp) = 1 - γ

Ф(tkp) = (1 - γ)/2 = 0.95/2 = 0.475

По таблице функции  Лапласа найдем, при каком tkp значение Ф(tkp) = 0.475

tkp(γ) = (0.475) = 1.96

Несмещенная оценка дисперсии - состоятельная оценка дисперсии.

 

 

Оценка среднеквадратического  отклонения.

 

 

(25101.56 - 5719.34;25101.56 + 5719.34) = (19382.22;30820.9)

С вероятностью 0.95 можно  утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Как изменится доверительный  интервал, если вероятность увеличится до 0,99? Сделайте необходимый расчет.

В этом случае 2Ф(tkp) = 1 - γ

Ф(tkp) = (1 - γ)/2 = 0.99/2 = 0.495

По таблице функции  Лапласа найдем, при каком tkp значение Ф(tkp) = 0.495

tkp(γ) = (0.495) = 2.58

 

(25101.56 - 7528.52;25101.56 + 7528.52) = (17573.04;32630.08)

С вероятностью 0.99 можно  утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Какую по объему выборку  надо иметь, чтобы погрешность (ошибку) в доверительном интервале можно  было бы уменьшить в 2 раза относительно её первоначального значения (вероятность 0,95).

 

 

  

 

 

ТЕМА № 7. СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА СВЯЗИ2

Задание.

    1. Из таблицы №1 «Макроэкономические показатели европейских стран» выберите две графы (признаки) данных, соответствующих вашему варианту (см. таблицу №2).
    2. Построить аналитическую группировку.
    3. Построить парное линейное уравнение связи между признаками.
    4. Оценить тесноту связи с помощью эмпирического корреляционного отношения и коэффициента корреляции.
    5. Проверить на значимость найденные параметры и регрессионную модель.
    6. По полученному уравнению рассчитать прогноз значения У при условии, что величина Х будет на 20% выше своего максимального выборочного значения. (Вероятность 0,95).

Таблица №2.

вариант

7

№ графы

7,9


 

Y

X

31500

30

3800

3

12300

7

41500

27

29500

37

11400

7

43700

45

20400

27

23400

24

29800

30

25900

28

20000

31

8800

13

8400

5

75600

53

10100

6

34600

30

32600

30

8100

6

15400

17

5800

3

17100

18

10200

6

34000

29

36200

30

33700

35

8600

2

2700

1

6500

14

46900

5

60400

10

42075

12

Информация о работе Контрольная работа по "Теории статистике"