Обзор статистических пакетов

Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 21:59, реферат

Краткое описание

Математические методы статистики становятся всё более популярными в психологии. Объясняется это просто: математическая статистика даёт специалистам-практикам мощный, хорошо разработанный аппарат для объективного анализа результатов педагогического, медицинского, психологического обследований и выработки практических рекомендаций.
Стандартные статистические методы включены в состав популярных электронных таблиц, таких как Excel, Lotus 1-2-3, Quattro Pro, а также в математические пакеты общего назначения, например Mathcad, Maple и др. Однако гораздо большими возможностями обладает специализированное программное обеспечение – статистические программные продукты (СПП).
В настоящее время международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2.

Содержание

1. Обзор статистических пакетов 6
1.1. SAS 8
1.2. SPSS для Windows 11
1.3. SYSTAT 12
1.4. MINITAB 15
1.5. STATISTICA 16
2. Расчетная часть 20
Задание № 1 20
Задание №2 22
Задание №3 23
Задание №4 25
Заключение 26
Список использованных источников 27

Вложенные файлы: 1 файл

IT в экономикеке.docx

— 73.66 Кб (Скачать файл)

Достоинства и недостатки пакета    

Основными достоинствами SAS считают мощное интеллектуальное ядро, поддержку архитектур клиент-сервер, возможность доступа и интеграции данных из любых источников и наличие объектно-ориентированной технологии быстрой разработки приложений. При этом благодаря высокой гибкости и переносимости системы приложение, созданное в одной из ОС, может быть перенесено на любую из платформ, поддерживаемых SAS/IDS, начиная от суперЭВМ типа CRAY до Mainframe или рабочей станции (правда, при этом оно будет требовать для работы системную часть SAS). 

Главными недостатками системы считают громоздкость, трудности  в освоении, высокие требования к  статистической квалификации пользователя, жесткие требования к аппаратной части ПЭВМ, большой объем занимаемого  дискового пространства и дороговизну.

    1. SPSS для Windows

Общие сведения     

Пакет SPSS предназначен в первую очередь для статистиков-профессионалов. Он включает развитый аппарат статистического  анализа, соизмеримый по мощности с SAS. Программу SPSS для Windows считают в  настоящее время одним из лидеров  среди универсальных статистических пакетов. 

Вместе с тем, как и все мощные универсальные  пакеты, SPSS "любит хорошее железо": процессор должен быть 486DX-2 и выше, для его использования рекомендуется 16 Мбайт оперативной памяти, а  на винчестере модули Base и Professional Statistics для управления данными и с алгоритмами классификации требуют как минимум 65-80 Мбайт (вместе с файлами подкачки). Кроме того, цена полного комплекта системы SPSS (SPSS Base + набор из 7 модулей) достаточно внушительна.

Особенности.     

SPSS имеет удобные графические средства (более 50 типов диаграмм), а также развитые средства подготовки отчетов. Эта версия отличается производительностью, скоростью вычислений и расширенным функциональным наполнением. Аналитические параметры отображаются на экране в виде простых и понятных меню и диалоговых окон. 

Усовершенствование  в процедуре обучения достигается  введением специального средства Навигатор. Навигатор выполняет в SPSS интеллектуальную функцию, объясняя пользователю, какую  статистику лучше применить в  каждом конкретном случае или как  ввести данные в данном подразделе. Во многом за счет этого средства можно  сфокусировать свое внимание собственно на анализе данных, не заботясь о  механизме его выполнения. Новая  контекстно-ориентированная справочная система содержит пошаговые инструкции для наиболее важных операций. 

Для эффективного применения пакета для классификации и снижения размерности, как минимум, нужны  методы из модулей SPSS BASE и Profess. Statistics. Существенно же повысить точность и/или эффективность классификации и прогноза может применение части (или всех) из модулей Advanced Statistics, CHAID и Neural Connection. 

Первый модуль содержит, в частности, модели логистической  регрессии, а также ряд методов, смежных с классификацией. Модуль CHAID строит деревья решений. Последний  модуль реализует классификацию  с помощью нейросетей. 

На основе DDE- и OLE-технологий фирмы Microsoft, а также стандарта ODBC в SPSS также решены вопросы обмена с другими Windows-приложениями и выполняется  связь с большинством форматов баз  данных. Так, можно, не выходя из среды WinWord, одновременно работать в среде SPSS и, наоборот, очень легко переносить полученные тестовые или графические  результаты из SPSS в документ системы Word.

Достоинства и недостатки. 

По мнению разработчиков  пакета, после SAS, в своей полной конфигурации SPSS для Windows является пакетом с наиболее высоким значением параметрамощность: он обладает весьма полным набором статистических (всего их более 60) и графических процедур, а также процедур создания отчетов. Также создатели пакета гордятся интерфейсом SPSS с пользователем, считая его очень простым и удобным. Кроме того, традиционно пакет отличается высокой точностью вычислений. 

    1. SYSTAT

Общая информация     

Универсальная статистическая система SYSTAT разработана одноименной  фирмой, которая с сентября 1994 года "поглощена" корпорацией SPSS. Она  отличается от других универсальных  систем типа SAS, SPSS, BMDP тем, что изначально спроектирована под платформу IBM PC. Главное достоинство пакета - исключительно  широкий диапазон и глубина проработки функционального наполнения. Здесь  есть широкие возможности и для слабо подготовленного в статистике пользователя, и для достаточно искушенного статистика. 

Фирма SYSTAT была совсем недавно одним из лидеров в  области производства высококачественного  статистического программного обеспечения. Поэтому сегодня более 150 учебных  заведений во всем мире готовят у  себя специалистов на основе наукоемких продуктов этой фирмы. 

Ряд лет пакет  считался одним из лучших среди универсальных  пакетов углубленного статистического  анализа. Однако с современных позиций  просматривается его определенное отставание в графике в режиме "высокого разрешения".

Документация SYSTAT

Документация пакета включает в себя четыре тома. Это  ясно и хорошо написанное руководство "Как начать работу", а также  руководства по разделам "Графика", "Статистика". Есть также небольшое "Руководство по данным". Второй и третий тома дают читателю углубленный взгляд на то, что можно делать и как это можно выполнить в среде пакета. Второй том описывает, как работать с графикой в пакете. Руководство по статистике начинается с обзора методов и включает ссылки на хорошо подобранную библиографию. В методическом плане руководство не уступает добротному учебному курсу по статистическому анализу данных. Инструкции по пошаговой работе, как правило, полезны и точно ведут к цели, а указатель очень полезен для пользователя, начинающего работу с SYSTAT.

Возможности SYSTAT по управлению данными

Пакет использует затабулированное окно для ввода данных и их редактирования. Верхняя строка таблицы с данными  задает имена переменных, которые  должны иметь не более чем 8 символов и оканчиваться на символ $, если данная переменная (признак) имеет неусловную природу. Ввод данных осуществляется без  каких-либо ухищрений. 

Имеются хорошие  возможности по преобразованиям  данных. Однако результаты таких преобразований являются статичными. Функциональные имена в окне преобразований являются кодами, например, XDF и XCF обозначают плотность и кумулятивную функцию распределения случайной величины хи-квадрат. Пропущенные символьные значения кодируются пробелами; пропуски в числовых признаках кодируются отрицательными числами и появляются в редакторе как периодические вещественные числа.

Графика в пакете SYSTAT

Пакет обладает прекрасными  возможностями отображения на экране исходных данных и полученных результатов  разведочного анализа, имея в своем  распоряжении около 30 различных способов графического отображения: гистограммы, ящики с "усами", стебли с листьями, значки, 2D- и 3D-диаграммы рассеяния и т. д. Кроме того, имеются матрицы диаграмм рассеяния, графики функций и географических карт. 

Кроме того, пакет  позволяет порождать и изображать сложные поверхности, что полезно  для визуализации сложных функций. В версии 6.0 нажатием кнопки мыши легко  вращать даже сложные 3D-графики с  координатными осями по отношению к плоскости экрана. Эта же возможность сохраняется и при обработке данных в режиме "реального времени". 

Для многих графиков имеются специальные средства типа стрелки для исследования точек-выбросов, ключи с диапазонами для режима "лупа" или "лассо", для исследования выделенного фрагмента данных. Графика  пакета достаточно гибкая, легко управляемая  и объектно-ориентированная. Есть возможности  интерактивных графических преобразований данных, что очень удобно при разведочном  анализе. Также имеются средства разработки презентаций.

Функциональные  достоинства SYSTAT

SYSTAT обладает хорошей  и заслуженной репутацией в  плане корректности применяемых  алгоритмов. Он имеет обширное  меню с функциональными алгоритмами,  включая описательную и непараметрическую  статистику, корреляцию, кластерный  анализ, проверку многомерных гипотез для общей линейной модели (MGLH) и таблицы сопряженности. Пакет особенно силен в областях дисперсионного анализа и планирования экспериментов. 

В програме имеется множество дополнительных процедур для дискриминантного анализа, матричной алгебры, логлинейных моделей, планирования экспериментов, структурного анализа и карт контроля качества. Также были добавлены робастные (устойчивые) алгоритмы, дающие точные и корректные результаты при почти вырожденных данных. Кроме того, эта версия предоставляет пользователю наиболее широкие возможности анализа общей линейной статистической модели.

    1. MINITAB

Пакет MINITAB развивается  более 20 лет и широко известен в  США, где он является одним из основных учебных пакетов. Во многом, правда, это объясняется не его исключительными  свойствами, а тем, что пакет в  свое время захватил определенный сегмент  рынка.

MINITAB хорошо продуман  по разделу описательной (дескриптивной)  статистики, хорошо сконструирован  и управляется с помощью удобного  меню или, по желанию пользователя, через команды, составлять которые  помогают диалоговые окна пакета. Часто используемые команды можно  запускать по их первой букве.  Общее число команд превышает  200. Можно составлять специальные  макросы для выполнения последовательностей  команд.  Импорт/экспорт данных из других Windows-приложений делается через стандартный буфер обмена. В пакете имеются разнообразные возможности по управлению данными. 

Документация пакета включает в себя три тома: 28-страничное руководство для быстрого освоения, 240-страничное руководство пользователя и справочное руководство. Последнее  содержит множество примеров и продуманные  указатели. 

Пользователь Minitab может легко и быстро научиться  решать практически все типовые  задачи, в основном из области одномерного  анализа и анализа временных  рядов. Фирмой Minitab, Inc. хорошо налажены поддержка пользователей и обмен  опытом через Группу пользователей MINITAB. Кроме того, фирма весьма недорого продает мини-руководство по пакету для тех студентов, которые, возможно, его не имеют, но хотят больше о  нем узнать в рамках своих учебных  курсов. 

В области многомерного анализа 8-я версия пакета явно не являлась лидером. Тем не менее, она позволяет  находить главные компоненты или  же проводить стандартный линейный или даже квадратичный дискриминантный  анализ. Однако многомерный анализ был усилен в более поздних  версиях. 

Так, в версии 10.0 были добавлены алгоритмы факторного и кластерного анализа. Кроме  того, эта версия позволяет получать множество хороших и сложных  полноцветных графиков. В плане характеристики мощности MINITAB-10.0 достаточно силен и  разнообразен, поэтому говорят, что  первые четыре буквы пакета скорее надо поменять на Maxi. 

Недостатком пакета является отсутствие формул для статистик  в справочном руководстве, что затрудняет анализ значимости влияния различных  факторов на принимаемые решения. Но, с другой стороны, этот справочник изобилует  ссылками на стандартные статистические учебники. 

Полагают, что недостатки MINITAB не очень существенны и что  он является пакетом с умеренным  соотношением "качество/цена".

    1. STATISTICA

Общая информация     

Пакет STATISTICA/W (ниже Statistica) не стоит использовать пользователю-новичку в статистике, так как он предполагает владение статистической терминологией. Тем не менее, на отечественном рынке этот пакет пользуется популярностью, по-видимому, благодаря высокой активности фирмы-разработчика Statsoft и дилера в России - Softline, способствующих популяризации пакета.

О мощности пакета Statistica/W    

Ряд авторов считает, что пакет Statistica является хорошо сбалансированным по соотношению "мощность/удобство». Наличие достаточно широкого спектра функциональных алгоритмов делает его достаточно привлекательным для статистиков-профессионалов. Однако существует точка зрения, что удобство работы с этим пакетом является невысоким. В частности, Statistica по своей структуре как бы состоит из нескольких связанных между собой "мини-пакетов". Эти "мини-пакеты" взаимодействуют друг с другом, имея одинаковый формат системных файлов. Так, если нужен раздел линейной регрессии, то приходится покинуть окружение главного модуля СПП и выходить в окружение модуля ("мини-пакета") линейной регрессии. 

В плане функционального  наполнения пакет, например, по сравнению  с программой STATGRAPHICS, о которой  будет сказано ниже, более разнообразен, включая в себя и разделы анализа, которые STATGRAPHICS содержит лишь в дополнительных модулях (поставляемых за дополнительную цену). В частности, он включает в  себя ряд непараметрических методов  анализа, методы многомерного анализа: дискриминантного, факторного кластерного  логлинейного и др. 

Вместе с тем, в пакете Statistica отсутствуют методы планирования экспериментов, графика  по методам контроля качества. В  целом пакет Statistica по мощности уступает пакетам SAS, SPSS и SYSTAT.

Особенности управления пакетом

Средства манипулирования  исходными данными в пакете Statistica хорошо развиты. Данные относительно легко  отредактировать, можно создавать  новые переменные ("признаки"), выбирать отдельные наблюдения или "вырезать" подмножество данных по строкам и/или по столбцам таблицы "объект-признак". Благодаря обширной панели инструментов для выполнения большинства манипуляций достаточно несколько щелчков мыши, так как почти для всех функций пакета здесь имеются пиктограммы. Кроме того, щелчком правой кнопки мыши вызываются дополнительные подменю, которые существенно ускоряют работу с пакетом. 

Информация о работе Обзор статистических пакетов