Автор работы: Пользователь скрыл имя, 15 Июня 2014 в 14:35, реферат
"Кластерный анализ – совокупность математических методов, предназначенных для формирования относительно "отдаленных" друг от друга групп "близких" между собой объектов по информации о расстояниях или связях (мерах близости) между ними. По смыслу аналогичен терминам: автоматическая классификация, таксономия, распознавание образов без учителя." Такое определение кластерного анализа дано в последнем издании "Статистического словаря". Фактически "кластерный анализ" - это обобщенное название достаточно большого набора алгоритмов, используемых при создании классификации. В ряде изданий используются и такие синонимы кластерного анализа, как классификация и разбиение. Кластерный анализ широко используется в науке как средство типологического анализа. В любой научной деятельности классификация является одной из фундаментальных составляющих, без которой невозможны построение и проверка научных гипотез и теорий.
Аналитическая обработка экономической информации очень трудоемка сама по себе и требует большого объема разнообразных вычислений. С переходом к рыночным отношениям потребность в аналитической информации значительно увеличивается. Это связано прежде всего с потребностью разработки и обоснования перспективных планов предприятий, комплексной оценки эффективности краткосрочных и долгосрочных управленческих решений. В связи с этим автоматизация аналитических расчетов стала объективной необходимостью.
Современные информационные технологии позволяют целиком автоматизировать обработку всех экономических данных, в том числе и по анализу хозяйственной деятельности. Роль автоматизации аналитических расчетов заключается в следующем.
Во-первых, повышается продуктивность работы экономистов-аналитиков. Они освобождаются от технической работы и больше занимаются творческой деятельностью, что позволяет делать более глубокие исследования, вести постановку более сложных экономических задач.
Во-вторых, более глубоко и всесторонне исследуются экономические явления и процессы, более полно изучаются факторы и выявляются резервы повышения эффективности производства.
В-третьих, повышаются оперативность и качество анализа, его общий уровень и действенность.
Автоматизация аналитических расчетов и сам АХД поднялись на более высокий уровень с применением ПЭВМ, для которых характерны высокая производительность, надежность и простота эксплуатации, наличие развитого программного обеспечения, диалогового режима работы, низкая стоимость и другие. На их базе создаются автоматизированные рабочие места (АРМ) бухгалтера, экономиста, финансиста, аналитика и так далее. ПЭВМ, соединенные в единую вычислительную сеть, позволяют перейти к комплексной автоматизации АХД.
Автоматизированное рабочее
место экономиста-аналитика — это совокупность
информационно-программно-
Необходимым условием создания АРМ аналитика является наличие технической базы (персональных ЭВМ), базы данных о хозяйственной деятельности предприятия, базы знаний (методов и методик анализа) и программных средств, позволяющих автоматизировать решение аналитических задач.
Создание АРМ аналитика требует решения многих организационных вопросов, связанных с методическим, техническим, программным и информационным обеспечением.
Методическое обеспечение представляет собой систему общих и частных методик проведения анализа.
Техническое обеспечение включает комплекс технических средств, предназначенных для работы информационной системы: компьютеры любых моделей, устройства сбора, накопления, обработки, передачи и вывода информации, устройства передачи данных и линий связи и другие.
В состав программного обеспечения входят общесистемные и специальные программные продукты. К общесистемному программному обеспечению относятся универсальные программы, предназначенные для обработки любой информации, например пакеты для статистической обработки данных, для решения оптимизационных задач. Специальное программное обеспечение включает совокупность программ, разработанных для конкретной предметной области (в данном случае для решения конкретных аналитических задач). Это могут быть программы локальные и комплексные.
Локальные программы предназначены для многократного решения однотипных задач.
Программа комплексного анализа, охватывающая все стороны деятельности предприятия, включает целую систему взаимосвязанных задач. Для ее разработки требуются:
Эффективность АРМ аналитика во многом зависит от совершенства методик анализа, от того, в какой степени они соответствуют современным запросам управления, а также от технических возможностей ПЭВМ. Достижения в отрасли интегральной электроники, расширение ресурсной возможности и функционального совершенства ПЭВМ создают реальные условия для углубления экономических исследований, позволяют шире использовать оптимизационные методы решения аналитических задач с целью выработки оптимальных управленческих решений, направленных на повышение эффективности бизнеса и конкурентных преимуществ предприятия.[8]
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.
Большинство исследователей склоняются к тому, что впервые термин «кластерный анализ» (англ. cluster — гроздь, сгусток, пучок) был предложен математиком Р. Трионом. Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология.
Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии и других дисциплинах. Однако универсальность применения привела к появлению большого количества несовместимых терминов, методов и подходов, затрудняющих однозначное использование и непротиворечивую интерпретацию кластерного анализа.
Кластерный анализ выполняет следующие основные задачи:
Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:
Можно встретить описание двух фундаментальных требований предъявляемых к данным — однородность и полнота. Однородность требует, чтобы все кластеризуемые сущности были одной природы, описываться сходным набором характеристик. Если кластерному анализу предшествует факторный анализ, то выборка не нуждается в «ремонте» — изложенные требования выполняются автоматически самой процедурой факторного моделирования (есть ещё одно достоинство — z-стандартизация без негативных последствий для выборки; если её проводить непосредственно для кластерного анализа, она может повлечь за собой уменьшение чёткости разделения групп). В противном случае выборку нужно корректировать.
Типы входных данных:
В современной науке применяется несколько алгоритмов обработки входных данных. Анализ путём сравнения объектов, исходя из признаков, (наиболее распространённый в биологических науках) называется Q-типом анализа, а в случае сравнения признаков, на основе объектов — R-типом анализа. Существуют попытки использования гибридных типов анализа (например, RQ-анализ), но данная методология ещё должным образом не разработана.
Цели кластеризации:
В первом случае число кластеров стараются сделать поменьше. Во втором случае важнее обеспечить высокую степень сходства объектов внутри каждого кластера, а кластеров может быть сколько угодно. В третьем случае наибольший интерес представляют отдельные объекты, не вписывающиеся ни в один из кластеров.
Во всех этих случаях может применяться иерархическая кластеризация, когда крупные кластеры дробятся на более мелкие, те в свою очередь дробятся ещё мельче, и т. д. Такие задачи называются задачами таксономии. Результатом таксономии является древообразная иерархическая структура. При этом каждый объект характеризуется перечислением всех кластеров, которым он принадлежит, обычно от крупного к мелкому.[4]
При анализе и прогнозировании социально-экономических явлений исследователь довольно часто сталкивается с многомерностью их описания. Это происходит при решении задачи сегментирования рынка, построении типологии стран по достаточно большому числу показателей, прогнозирования конъюнктуры рынка отдельных товаров, изучении и прогнозировании экономической депрессии и многих других проблем.
Методы многомерного
анализа - наиболее действенный
Кластерный анализ
наиболее ярко отражает черты
многомерного анализа в
Иногда подход кластерного анализа называют в литературе численной таксономией, численной классификацией, распознаванием с самообучением и т.д.
Первое применение
кластерный анализ нашел в
социологии. Название кластерный
анализ происходит от
Большое достоинство
кластерного анализа в том, что
он позволяет производить
Кластерный анализ
позволяет рассматривать
Важное значение кластерный анализ имеет применительно к совокупностям временных рядов, характеризующих экономическое развитие (например, общехозяйственной и товарной конъюнктуры). Здесь можно выделять периоды, когда значения соответствующих показателей были достаточно близкими, а также определять группы временных рядов, динамика которых наиболее схожа.
Кластерный анализ
можно использовать циклически.
В этом случае исследование
производится до тех пор, пока
не будут достигнуты
В задачах социально-
Как и любой другой
метод, кластерный анализ имеет
определенные недостатки и