Исследование возможностей статистических пакетов для дисперсионного анализа данных (на примере ИС Statistica и ПК SPSS)

Автор работы: Пользователь скрыл имя, 29 Апреля 2014 в 18:14, курсовая работа

Краткое описание

Цель анализа различий – выявление групп респондентов, статистически значимо различающихся между собой. Все статистические процедуры, позволяющие выявить такие различия (t-тесты и дисперсионный анализ), сравнивают респондентов на основании средних значений переменных.
В практике маркетинговых и статистических исследований достаточно часто встречаются ситуации, когда в ходе предварительного анализа (на основании опыта исследователя или статистического анализа) появляется гипотеза о разделении всей выборочной совокупности на определенные группы на основании одного или нескольких признаков. Линейное распределение может показывать, что данные группы респондентов действительно различаются, однако, визуального различия между категориями недостаточно для того, чтобы с уверенностью констатировать наличие статистически значимого различия. На установление статистической значимости различий между целевыми группами респондентов и направлены процедуры, объединенные под названием анализ различий.

Вложенные файлы: 1 файл

Курсовая.doc

— 663.00 Кб (Скачать файл)

После таблицы Tests of Between-Subjects Effects следую расчеты средних значений для переменной «Пол» и для взаимодействия «Возраст»*«Пол». В этом примере ни переменная «Пол», ни ее взаимодействие с переменной «Возраст» не являются статистически значимыми, поэтому данные таблицы бесполезны. Однако, если бы переменная «Пол» была бы значима (т.е. различие между мужчинами и женщинами существовало), на основании первой таблицы можно бы было сделать заключение о том, какая именно половая группа покупает больше диетических хлебцев.

Завершают вывод результатов двухфакторного анализа таблицы с расчетами апостериорных тестов. В этом примере они практически такие же, как в предыдущем примере, поскольку переменная «Возраст» сохранила свою значимость. Однако при интерпретации таблицы Multiple Comparisons следует помнить о неравенстве дисперсий. Поэтому значимость различий между отдельными возрастными группами надо устанавливать на основании второй части таблицы Tamhane.

 

 

    1. Однофакторный одномерный дисперсионный анализ  в Statistica

 

 

Для того, чтобы решить ту же задачу, в меню Statistics я выбираю модуль ANOVA  и в появившемся окне General ANOVA/MANOVA нажимаю Variables и определяю зависимые и независимые переменные (рис.4).

Рис.4 Диалоговое окно Select dependent variables and a categorical predictor

 

На появившемся экране ANOVA Results нажимаю All effects:

 

Полученные данные позволяют осуществить оценку степени влияния фактора «Возраст» на фактор «Кратность покупок»:

 

 

Вывод:

Т.к. значение  р=0,000303, т.е.  р < 0,001 в этой задаче имеет место статистически высоко значимое различие между различными возрастными группами респондентов по кратности покупок диетических хлебцев.

Чтобы проанализировать зависимость между факторами наглядно, я строю график с помощью меню Graphs:

 

 

 

Получаю графики на которых отображено среднее значение кратности покупок, ошибка и стандартное отклонение:

 

 

Но на графике четко видно, что респонденты в возрасте старше 55 лет делают покупки значительно реже, чем в возрасте до 55 лет, что полностью подтверждает анализ, проведенный в «SPSS» и «Statistica».

 

 

1.4 Двухфакторный одномерный дисперсионный анализ в «Statistica»:

 

 

В меню Statistics я выбираю модуль ANOVA  и в появившемся окне General ANOVA/MANOVA: Factoral ANOVA нажимаю Variables и определяю зависимые и независимые переменные (рис.1.6  , рис. 1.7 ).

 

Рис.1.6  Диалоговое окно General ANOVA/MANOVA

 

Рис.1.7   Диалоговое окно Select dependent variables and a categorical predictor

 

Анализ влияния двух факторов («Возраст» и «Пол») на кратность покупок дает результаты, полностью соответствующие проведенному анализу в SPSS. Переменная «Возраст» сохранила свою значимость (р=0,000224), а  переменная «Пол», и ее взаимодействие с переменной «Возраст» не являются статистически значимыми (превышают порог значимости р=0,001), т.е. не оказывают значимого влияния на переменную «Кратность покупок».

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ЗАКЛЮЧЕНИЕ

 

 

Проведя однофакторный и двухфакторный одномерный дисперсионный анализ с помощью двух программ:  StatSoft Statistica  и  SPSS (Statistical Package for the Social Science), я установила, что респонденты старше 55 лет,  в независимости от пола, покупают меньшее количество диетических хлебцев, чем остальные опрошенные группы. Причин этого может быть несколько:

    •  возможно, эти респонденты уделяют меньшее внимание своему    здоровью и полезному рациону питания;
    • возможно, такой продукт как диетические хлебцы не привычен для людей старшего возраста;
    • цены на диетические хлебцы более высокие, чем на другие  хлебобулочные изделия.

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Информация о работе Исследование возможностей статистических пакетов для дисперсионного анализа данных (на примере ИС Statistica и ПК SPSS)