Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 14:32, контрольная работа

Краткое описание

В течении трех лет использовались 4 различные технологии по выращиванию сельскохозяйственной культуры. Установить на уровне значимости 0,05 влияние различных технологий на урожайность культуры.

Вложенные файлы: 1 файл

ДисКорРегр.doc

— 686.50 Кб (Скачать файл)

Контрольная работа 2.

 

Задача 1.

В течении трех лет  использовались 4 различные технологии по выращиванию сельскохозяйственной культуры. Данные по эксперименту ( в  ц/га) приведены в таблице:

Год

Технология (фактор А)

А1

А2

А3

А4

1

6,7

5,9

6,2

5,9

2

6,4

6,0

6,4

6,3

3

6,6

6,1

6,0

6,0


Установить на уровне значимости 0,05 влияние различных  технологий на урожайность культуры.

 

Решение

 

Находим групповые средние:

 

N

А1

А2

А3

А4

1

6.7

5.9

6.2

5.9

2

6.4

6

6.4

6.3

3

6.6

6.1

6

6

xср

6.57

6

6.2

6.07


 

Обозначим р - количество уровней фактора (р=4). Число измерений на каждом уровне одинаково и равно q=3.

В последней строке помещены групповые  средние для каждого уровня фактора.

Общую среднюю можно получить как  среднее арифметическое групповых средних:

 

На разброс групповых средних  процента отказа относительно общей  средней влияют как изменения  уровня рассматриваемого фактора, так  и случайные факторы.

Для того чтобы учесть влияние данного  фактора, общая выборочная дисперсия разбивается на две части, первая из которых называется факторной S2ф, а вторая - остаточной S2ост.

С целью учета этих составляющих вначале рассчитывается общая сумма  квадратов отклонений вариант от общей средней:

 

и факторная сумма  квадратов отклонений групповых  средних от общей средней, которая  и характеризует влияние данного  фактора:

 

Последнее выражение  получено путем замены каждой варианты в выражении Rобщ групповой средней для данного фактора.

Остаточная сумма квадратов  отклонений получается как разность:

Rост = Rобщ - Rф

Для определения общей  выборочной дисперсии необходимо Rобщ разделить на число измерений pq:

 

а для получения несмещенной общей выборочной дисперсии это выражение нужно умножить на pq/(pq-1):

 

Соответственно, для несмещенной  факторной выборочной дисперсии:

 

где p-1 - число степеней свободы несмещенной факторной  выборочной дисперсии.

С целью оценки влияния  фактора на изменения рассматриваемого параметра рассчитывается величина:

 

Так как отношение  двух выборочных дисперсий S2ф и S2ост распределено по закону Фишера-Снедекора, то полученное значение fнабл сравнивают со значением функции распределения

 

в критической точке fкр, соответствующей выбранному уровню значимости a.

Если fнабл>fкр, то фактор оказывает существенное воздействие и его следует учитывать, в противном случае он оказывает незначительное влияние, которым можно пренебречь.

Для расчета Rнабл и Rф могут быть использованы также формулы:

 

 

Находим общую среднюю  по формуле (1):

Для расчета Rобщ по формуле (4) составляем таблицу 2 квадратов вариант:

N

П21

П22

П23

П24

1

44.89

34.81

38.44

34.81

2

40.96

36

40.96

39.69

3

43.56

37.21

36

36

129.41

108.02

115.4

110.5


Общая средняя вычисляется  по формуле (1):

 

Rобщ  = 129.41 + 108.02 + 115.4 + 110.5 - 3 • 4 • 6.212 = 0.81

Находим Rф по формуле (5):

Rф = 3(6.572 + 62 + 6.22 + 6.072) - 4 • 6.212 = 0.58

Получаем Rост: Rост = Rобщ - Rф = 0.81 - 0.58 = 0.23

Определяем факторную и остаточную дисперсии:

 

 

Если средние значения случайной величины, вычисленные  по отдельным выборкам одинаковы, то оценки факторной и остаточной дисперсий  являются несмещенными оценками генеральной  дисперсии и различаются несущественно.

Тогда сопоставление  оценок этих дисперсий по критерию Фишера должно показать, что нулевую  гипотезу о равенстве факторной  и остаточной дисперсий отвергнуть нет оснований.

Оценка факторной дисперсии  больше оценки остаточной дисперсии, поэтому можно сразу утверждать не справедливость нулевой гипотезы о равенстве математических ожиданий по слоям выборки.

Иначе говоря, в данном примере фактор Ф оказывает существенное влияния на случайную величину.

Проверим нулевую гипотезу H0: равенство средних значений х.

Находим fнабл

 

Для уровня значимости α=0.05, чисел степеней свободы 3 и 8 находим fкр из таблицы распределения Фишера-Снедекора.

fкр(0.05; 3; 8) = 4.07

В связи с тем, что  fнабл > fкр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов принимаем.

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2.

Распределение 100 предприятий  по уровню механизации х (в %) и выпуску  продукции У (млн.руб.) дано в таблице:

 

У\Х

4

9

14

19

24

29

Итого

30

3

3

       

6

40

 

5

4

     

9

50

   

40

2

8

 

50

60

   

5

10

6

 

21

70

     

4

7

3

14

Итого

3

8

49

16

21

3

100


 

Необходимо:

  1. построить эмпирические линии регрессии
  2. найти уравнения прямых регрессии, построить их графики
  3. вычислить выборочный коэффициент корреляции и оценить его значимость
  4. найти интервальные оценки для генеральных коэффициентов регрессии.

 

Решение

 

Найдем условные средние  воспользовавшись формулами:

Получаем:

Для Х:

Оценка тесноты линейной связи между признаками X и Y производится с помощью коэффициента линейной корреляции r:

С помощью таблиц находим  общие средние, средние квадратов, среднюю произведения и среднеквадратические отклонения:

Х

nx

x*nx

x2*nx

yx

x*nx*yx

4

3

12

48

30

360

9

8

72

648

36,25

2610

14

49

686

9604

50,2

34437,2

19

16

304

5776

61,25

18620

24

21

504

12096

59,52

29998,08

29

3

87

2523

70

6090

сумма

100

1665

30695

 

92115,28


 

 

 

 

 

Y

ny

y*ny

y2*ny

xy

y*ny*xy

30

6

180

5400

6,50

1170

40

9

360

14400

11,22

4039,2

50

50

2500

125000

15,8

39500

60

21

1260

75600

19,24

24242,4

70

14

980

68600

23,64

23167,2

 

100

5280

289000

 

92118,8


 

Тогда коэффициент корреляции равен:

Связь является высокой, прямой.

 

Находим линейное уравнение регрессии У на Х:

 

Аналогично находим  уравнение регрессии X поY:

 

 

 

 

 

Графики уравнений регрессии:

 

 

 

 

Задание 3.

Имеются данные о младенческой смертности Х1, заболеваемости злокачественными новообразованиями Х2 (на 100000 чел.населения) и уровне техногенной нагрузки У (в %) по 6 районам:

Х1

Х2

У

1

8

206

10

2

11

210

12

3

12

212

15

4

9

184

11

5

20

302

30

6

22

230

25


 

Необходимо:

  1. найти парные, частные и множественный R коэффициенты корреляции между переменными
  2. оценить их значимость.

 

Решение

 

Матрица парных коэффициентов корреляции.

Число наблюдений n = 6. Число  независимых переменных в модели равно 2, а число регрессоров с  учетом единичного вектора равно  числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 4. Матрица, независимых переменных Х имеет размерность (6 х 4). Матрица ХT Х определяется непосредственным умножением или по следующим предварительно вычисленным суммам.

Матрица составленная из Y и X

 

1

10

8

206

1

12

11

210

1

15

12

212

1

11

9

184

1

30

20

302

1

25

22

230

Информация о работе Контрольная работа по "Статистике"