Автор работы: Пользователь скрыл имя, 02 Июня 2012 в 11:15, лекция
СЕГМЕНТИРОВАНИЕ – это разбивка рынка на четкие группы покупателей, для каждого из которых могут потребоваться специальные комплексы маркетинга. По мнению Beane (1987) при сегментировании главной целью является получение новых знаний об изучаемом объекте. А по мнению Федяева 1(1998) – аналитик может создать последовательность моделей, каждая из которых призвана пополнить его знания и раскрыть новые грани изучаемых явлений.
Сегментация позволяет:
1. Обеспечивать сбор информации о характере поведения основных групп потребителей.
2. Исследуются рынки конкурентов и определяются рыночные ниши.
3. Деятельность фирмы, и производственная, и маркетинговая, и сбытовая, и рекламная, направляется на освоение наиболее перспективных сегментов
1. Ключевые понятия сегментирования рынка 1
2. Организация процесса сегментации с точки зрения управления процессом сегментации 5
3. Декомпозиция целей бизнеса при сегментировании ЛПР-ом 6
4. Сегментирование с позиций системного моделирования 8
4.1. Свойства сегментов 8
4.2. Принципы системного подхода к сегментированию 11
4.3. Классификация моделей сегментирования 12
5. Выбор переменных сегментирования 13
6. Методы выбора переменных 14
7. Типы измерений переменных 15
8. Критерии (переменные) сегментации (микросегментирования) 17
9. Критерии (переменные) сегментации рынка ТПН 20
10. Выделение сегментов 22
10.1. Методы выделения сегментов 22
10.2. Представление данных сегментирования 24
10.3. Концепция выделения сегментов 24
11. Основы кластерного анализа 25
11.1. Суть кластерного анализа 25
11.2. Нормирование значений переменных 26
11.3. Определение меры сходства при кластерном анализе 28
11.4. Взвешивание переменных сегментирования 29
11.5. Параметры выделяемых кластеров 30
11.6. Методы кластеризации 33
12. Анализ кластеров 35
12.1. Дисперсионный анализ сегментов – проверка результатов кластеризации 36
12.2. Анализ перекрытий сегментов 40
13. Интерпретация сегментов 42
13.1. Профили сегментов (профили потребителей) 44
13.2. Факторный анализ 46
13.3. Функции полезности 56
14. Поиск рыночного окна путем макросегментации 59
15. Выбор целевых сегментов рынка 64
Пример логической последовательности выделения переменных для сегментирования 66
Пример сегментирования, основанная на последовательном анализе свойств потребителей 66
69
ЛЕКЦИЯ № 10
Рынок в системе маркетинга. Теоретические и практические аспекты сегментирования рынков.
План
1. Ключевые понятия сегментирования рынка
2. Организация процесса сегментации с точки зрения управления процессом сегментации
3. Декомпозиция целей бизнеса при сегментировании ЛПР-ом
4. Сегментирование с позиций системного моделирования
4.1. Свойства сегментов
4.2. Принципы системного подхода к сегментированию
4.3. Классификация моделей сегментирования
5. Выбор переменных сегментирования
6. Методы выбора переменных
7. Типы измерений переменных
8. Критерии (переменные) сегментации (микросегментирования)
9. Критерии (переменные) сегментации рынка ТПН
10. Выделение сегментов
10.1. Методы выделения сегментов
10.2. Представление данных сегментирования
10.3. Концепция выделения сегментов
11. Основы кластерного анализа
11.1. Суть кластерного анализа
11.2. Нормирование значений переменных
11.3. Определение меры сходства при кластерном анализе
11.4. Взвешивание переменных сегментирования
11.5. Параметры выделяемых кластеров
11.6. Методы кластеризации
12. Анализ кластеров
12.1. Дисперсионный анализ сегментов – проверка результатов кластеризации
12.2. Анализ перекрытий сегментов
13. Интерпретация сегментов
13.1. Профили сегментов (профили потребителей)
13.2. Факторный анализ
13.3. Функции полезности
14. Поиск рыночного окна путем макросегментации
15. Выбор целевых сегментов рынка
Пример логической последовательности выделения переменных для сегментирования
Пример сегментирования, основанная на последовательном анализе свойств потребителей
Дифференцированный и целевой маркетинг предполагают проведение трех основных мероприятий.
СЕГМЕНТИРОВАНИЕ – это разбивка рынка на четкие группы покупателей, для каждого из которых могут потребоваться специальные комплексы маркетинга. По мнению Beane (1987) при сегментировании главной целью является получение новых знаний об изучаемом объекте. А по мнению Федяева 1(1998) – аналитик может создать последовательность моделей, каждая из которых призвана пополнить его знания и раскрыть новые грани изучаемых явлений.
Сегментация позволяет:
1. Обеспечивать сбор информации о характере поведения основных групп потребителей.
2. Исследуются рынки конкурентов и определяются рыночные ниши.
3. Деятельность фирмы, и производственная, и маркетинговая, и сбытовая, и рекламная, направляется на освоение наиболее перспективных сегментов рынка.
Виды сегментации:
1. макросегментация – обеспечивает определение архитектуры системы маркетинга, построенное по принципам сегментного функционирования. В рамках макросегментации решается проблема определения базового рынка (исходя из фундаментального понятия базовой потребности покупателей на выбранном фирмой рынке. (Котрлер, 1990. Ламбен, 1996) Базовый рынок наполняется совокупностью товаров, которые фирма считает целесообразным продвигать.
2. микросегментация определяет параметры сегментов и их взаимосвязи через свойства отдельных потребителей (LaTour, 1979; Dominique, 1998; Aaker, 1982; Алешина, 1999; Peter, 1995$ Boote, 1981). Микросегментирвоание анализирует особенности удовлетворения потребностей в пределах ограниченного набора товаров со схожими функциями.
3. группы потребителей в рамках одной страны;
4. В зависимости от объектов сегментирования:
Сегменты потребителей
Сегменты товаров (Smith, 1956; Mahajan, 1992; Boote, 1981)
Сегменты конкурентов (Портер, 2000)
5. вертикальная сегментация - сегментация с точки зрения углубления - рынок часов для мужчин ;
6. горизонтальная сегментация расширение сегментов рынка;
7. комбинированная;
8. предельная
9. Гиперсегментация (товары на заказ, отвечающие индивидуальным потребностям и имеющие помимо базовой функции множество опций и вторичных функций) и контрсегментация – фирма предлагает базовый товар без каких-либо изысков и дополнений с небольшим набором опций по гораздо более низкой цене.
РЫНОЧНЫЙ СЕГМЕНТ - это группа потребителей, характеризующаяся однотипной реакцией на товар и другие элементы комплекса маркетинга. Исходя из того, что сегмент имеет однородную структуру, он может рассматриваться как бизнес-единица (Meyers, 1977; Ансофф, 1989).
РЫНОЧНАЯ НИША – небольшой рыночный сегмент с высокой степенью специализации. Существуют также «ложные» ниши (искусственно созданные посредством агрессивной рекламы и полученные в результате нерепрезентативных научных исследований).
Этапы сегментации:
1. Проведение маркетинговых исследований
2. Проведение макросегментации;
3. Выбор критериев сегментации и вида сегментации
4. Проведение микросегментации
5. Выделение рыночных сегментов: сегментация рынков с выделением потенциального рынка, доступного рынка, квалифицированного рынка, целевого рынка.
6. Определение групп сегментов:
1) Выработка отличительных свойств для изучаемых потребителей, что позволит установить схожесть потребителей.
2) Применение процедур объединения потребителей в различные группы.
3) Анализ выделенных групп потребителей и осмысление их семантики. [1]
7. Выбор целевых сегментов – изучение вариантов выделенных групп потребителей и определение тех сегментов, которые следует обслуживать для выводимого на рынок продукта. Выбор из вариантов стратегий маркетинга (массовый, товарно-дифференцированный, целевой, стратегия нескольких сегментов). Выбору стратегии и сегмента ее приложения должны предшествовать следующие действия:
─ Оценка схожести потенциальных сегментов, на которых фирма имеет опыт работа. (схожесть может быть раскрыта через систему числовых величин, измеряющих наблюдаемые параметры сегментов.
─ Определение схожести продвигаемого продукта с товарами, с которыми фирма имеет опыт работы.
─ Оценка новизны потенциальных сегментов для фирмы.
─ Анализ возможных изменений в деятельности фирмы при выходе на новые сегменты и оценка последствий этих изменений
─ Ревизия конкурентной среды на потенциальных сегментах. Ставится задача оценки состояния конкурентной борьбы и динамики ее развития.
─ Анализируется текущее состояние сегментов и перспективы их развития. Изучаются текущий и будущий потенциал сегментов
─ Оцениваются ресурсы, которые требуются фирме для удержания сегментов.
8. Составление портрета потребителя и выявление его базовых предпочтений.
9. выбор позиций на рынке.
10. Выбор стратегии дифференциации товара
11. Позиционирование товаров на целевых рынках. Может быть обусловлено, например:
1) Обусловленное природой параметров, через которые могут быть оценены и измерены отношения потребителей к товару. (Green, 1993; Rowley, 1997, Hooley, 1980)
2) Позиции продукта в системе коммуникаций (Camp,199; Chaney 2001).
12. Разработка для целевых сегментов комплексов маркетинга, которые поддерживали бы выбранное позиционирование товаров.
1. Установление ЛПР
2. Определение управляемые переменных (например, ЛПР, которое принимает решение.
3. Принятие решения – выбор линии поведения по отношению к альтернативным значениям различных управляющих переменных.
4. определение неуправляемых переменных – те ситуации, которые ЛПР не может изменить (возрастная структура населения и т. д.). На управляемые и неуправляемые переменные могут быть назначены внешние и внутренние ограничения (например, определенный уровень скидок клиентам)
5. Определение возможных исходов – зависят от принятия решений и от значения неуправляемых переменных
6. Выработка линии поведения ЛПР, которое должно привести к желаемому исходу.
Одним из приемов поиска рыночного окна сегментированием может быть декомпозиция проблемы и целей бизнеса на более простые задачи с одновременным выделением сегментов. При этом само разбиение целей предполагает выделение схожих потребителей с близким по значению свойствами.
При решении задачи сегментирования ЛПР должен воспользоваться одним из подходов. Классическим подходом к описанию способов достижения общей цели деятельности фирмы является построение дерева промежуточных целей, где задается иерархия, при которой достижение цели верхнего уровня возможно только при реализации целей нижнего уровня. Разбиение цели на подцели приводит к декомпозиции и общей проблемы на более мелкие и простые задачи, которые также требуется решить. На каждом уровне декомпозиции аналитик должен предложить метод решения отдельной проблемы.
(СДЕЛАТЬ ЗАДАЧИ НА ДЕКОМПОЗИЦИИ ЦЕЛИ).
Переход от исходной совокупности к меньшим по объему группам потребителей сопровождается выделением мнения ЛПР о важности признаков, по которым проводится декомпозиция задач.
ЛПР устанавливает важность отдельных свойств потребителей, согласно которым общая совокупность пользователей продукта может быть развита на меньшие группы. При этом каждая группа может рассматриваться как сегмент, на котором фирма должна достигнуть общей или промежуточной цели.
Если согласно введенным ЛПР ограничения на управляемые и неуправляемые переменные, не может быть достигнут эффективный уровень ели на выделенном сегменте потребителей, этот сегмент исключается из рассмотрения. А сам вариант разделения на группы (вариант сегментирования) также исключается из исследования.
Если ЛПР не может выразить свое отношение к свойствам покупателей, или когда природа решаемой задачи требует привлечения для анализа многих свойств потребителей, а ЛПР не может выделить наиболее существенные свойства, полагают, что в рамках имеющейся информации задача не может быть решена. Но при этом продолжить декомпозицию целей можно, если для этого привлечь информацию о внутренних закономерностях в значениях переменных, которыми обладают схожие потребители. Такие закономерности выделяются специальными методами, которые позволяют разбить исходную совокупность потребителей (неразделяемую в рамках доступной ЛПР информации) на группы однородных потребителей (кластеры/ сегменты):
- Кластеризацией;
- Факторным анализом.
Существуют два альтернативных способа декомпозиции задачи:
1. Первый способ. При нем учитывается мнение ЛПР о целесообразности выделения сегментов по одному из свойств потребителей. Критерием целесообразности ЛПР полагает возможность реализации общей цели через достижение промежучтоных целей, каждая из которых может быть поставлена для любой из выделенных сегментов.
2. Второй способ. При нем используются методы выявления скрытых закономерностей в значения свойств потребителей. При этом целесообразность полученного разбиения общей совокупности на более мелкие образования также оценивается через тот уровень достижения цели, который может быть получен при использовании выделенных сегментов. Однако здесь отличие от первого способа оценка возможности достижения целей может потребовать привлечения более сложных процедур анализа выделенных сегментов как бизнес-единиц фирмы.
На любом шаге процесса сегментирования возможен возврат к предшествующим шагам.
Только в том случае, если сегмент обладает системными свойствами, он может быть рассмотрен как объект управления (Ансофф, 1989, Ламбен, 1996, Дойль, 1999) или бизнес-единица (Вайсман, 1995).
Свойства, которыми должны обладать выделяемые в качестве сегментов группы потребителей:
1. Терминологическая определенность. Правила и условия:
1) Можно пользоваться понятиями и терминами, определенными в теории маркетинга или введенные им самим, но которые обязательно базируются на классических понятиях маркетинга.
2) Должны быть определены свойства, параметры и названия изучаемых объектов (потребителей, сегментов) и в целом это должно быть понятно всему руководству фирмы.
2. Отделение реальности от абстракции. Правила и условия:
1) При формулировании модели сегментов, надо разграничить понятия, описывающие реальность и используемые абстракции.
2) Использование абстракций неминуемо, так как при сегментировании используется моделирование.
3) Значения параметров должны быть извлечены из баз данных (marketing data mining) или могут быть собраны из интервью.
4) Параметр является элементом изучаемой реальности.
5) Если вводятся абстракции – объяснить выделенные сегменты в терминах реальности и указать соответствие между реальными понятиями и абстрактными образами, которые и позволили выделить сегменты.
3. Измеримость. Правила и условия:
1) Выделенным в сегмент потребителям надо дать числовые и экспертные оценки.
2) Необходимо найти критерии для оценки размеров сегмента и описания его параметров.
3) Возможно использование абстрактных критериев, которые достаточно сложно вычислить и оценить.
4) Необходимо искать компромисс между желанием построить сегмент и стремлением достигнуть его измеримости. (например, посредством введения интерпретирующих критериев, вычисляемых методами факторного анализа.
4. Прогнозирование. Правила и условия:
1) Модель сегментов должна не только отражать наблюдаемые процессы, но и обладать прогнозными возможностями, то есть модель наблюдаемых явлений должна использовать такие параметры, которые могут быть оценены в числовых величинах во временном измерении.
5. Управляемость. Правила и условия:
1) Модель должна обладать свойствами, которые позволяют рассматривать ее как инструмент подготовки маркетинга-микс, то есть управляющих воздействий.
2) В рамках модели сегментов должны быть определены взаимосвязи между изучаемыми объектами системы маркетинга.
6. Изучаемость. Правила и условия:
1) Модель должна быть построена согласно тем задачам, которые она призвана изучать.
2) Модель можно рассмотреть как отдельный предмет изучения, а результаты этого изучения могут быть проанализированы как описания явлений, которые присутствуют в реальности, но не могут быть обнаружены без привлечения модели.
7. Достаточность объема. Правила и условия:
1) В результате сегментации могут быть определены очень маленькие сегменты. Их оценивать надо с позиций не только численности потребителей, входящих в этот сегмент, но и с позиций других параметров, например, частоты покупок или продолжительностью перерыва между повторяющимися покупками.
2) Необходимо найти компромисс между идеологией маркетинга и идеологией производства. Идеология маркетинга, настроенная на поиск наиболее выгодных сегментов рынка стремится достигнуть наибольшего разнообразия в выделенных сегментах, что приводит к снижению их размеров. В то же время, идеология производства стремится снизить себестоимость продукции за счет масштабов производства, стандартизации и унификации технологических процессов.
3) Эффект «обманчивости». Выделенный сегмент может привлечь и конкурентов, а это означает, что его объем может быть переоценен. Поэтому необходимо учитывать и такой фактор, как доступность.
8. Достижимость сегментов. Понимается в двух аспектах:
─ Необходимо полагать, что сегменты, выделенные на исследуемом наборе переменных, действительно обладают схожестью свойств. Это позволяет разработать единые подходы ко всему сегменту. [2]
─ Достижимость сегмента проявляется через обладание потребителями, включенными в сегмент свойствами по восприятию тех маркетинговых воздействий, которые на них направлены. Свойство достижимости по коммуникации является важнейшим с позиций реализуемости маркетинговых стратегий. Это означает, что среди переменных, которые используются для группировки сегментов, должны быть использованы переменные, которые отразили бы способность потребителей воспринимать обращенные на них маркетинговые воздействия (Прингл, 2001)
1) В целом, достижимость понимается как возможность селективного воздействия на сегмент. Это означает, что можно сконцентрировать свои усилия в области коммуникаций и продаж. Различают 2 вида доступности:
─ Автоселекция. Автоселекция покупателей проявляется в том, что позиционируемый товар обладает свойствами, которые притягивают целевую группу. Это можно реализовать через специальные коммуникации. Автоселекция покупателей предполагает получение положительной реакции покупателей на товар и на маркетинговые коммуникации фирмы.
─ Контролируемый охват. Означает проведение направленных действий фирму на продвижение товаров конкретным покупателям с конкретным выбором средств коммуникации.
9. Стабильность сегментов. Правила и условия:
1) Выделяемые сегменты должны быть устойчивы во времени, в том числе и относительно конкурентной и рыночной среды.
2) Изменения сегментов во времени должны быть прогнозируемыми и измеряемыми.
3) Устойчивость должна обеспечить запланированное прохождение жизненного цикла товаров.
10. Дифференцированная реакция. Правила и условия:
1) Сегментирование должно обеспечить достижение максимального различия между сегментами, то есть они должны быть неоднородными.
2) Должна определять возможность позиционирования товара на каждом отдельном сегменте.
1. Сегмент рынка нельзя исследовать сам по себе, он исследуется в рамках системы, в том числе по отношению к другим подобным группам потребителей и всей совокупности исследуемых объектов.
2. Необходимо сформулировать подход, который позволит выделить те свойства потребителей всего рынка, которые определяют суть изучаемых маркетинговых потребностей покупателей. Необходимо найти взаимосвязи между изучаемыми элементами системы.
3. Анализ свойств элементов системы и их взаимодействия позволяет вывести общие свойства всей системы маркетинга.
4. Единичные свойства, качества и признаки системы (например, потребителя) неповторимы. Но наличие особенного свойства у каждого потребителя позволяет найти общее для их совокупности (Акофф, 1982). То же касается сегментов товаров и сегментах конкурентов.
5. Сегменты позволяют описать некоторую часть потребителей на рынке.
6. Упростить модель системы можно через изучение взаимосвязей между отдельными потребителями, потребителями и конкурирующими продавцами, потребителями и товаром, а также через взаимосвязи между сегментами.
7. Сложность описания реальных явлений определяется взаимосвязями изучаемых объектов, разнообразием их свойств и отражается в сложности моделей, которые описывают изучаемую реальность с необходимой для исследователя точностью
8. Действительность может быть определена различными моделями, которые отражают наблюдаемые явления с различных углов зрения и соответствуют определенным задачам исследования.
9. Процесс сегментации должен обладать достаточной сложностью, которая обеспечивает адекватную точность получаемых результатов, соответствующих задачам исследования.
10. Для изучения сегментов рынка может быть предложено достаточно большое количество моделей и методов их построения. Но при использовании каждого из них необходимо руководствоваться общими принципами создания модели.
1. Модели неформализованные и формализованные – описательные (Попов, 1998, Морозова, 1992) и математические (Beane, 1987)
2. Модели с различными переменными сегментирования, например демографические модели.
3. Модели , разделяемые по уровню моделируемой системы – макро- и микросегментирование
4. Модели детерминистические и стохастические (Букерель, 1993, Ламбен, 1996) – отличаются по способу отображения в модельных конструкциях законов и закономерностей, которым подчиняется объект исследования.
5. Модели эмпирические и теоретические. Эмпирические модели выполняют, как правило, измерительную и описательную функции (измерение характеристик потребителей и фиксация результатов эмпирического исследования, выраженные в понятиях маркетинга) (Burke, 1979). На теоретическом уровне модели выполняют объяснительную функцию, с их помощью раскрывается сущность исследуемых явлений, проверяется истинность стратегических положений, системы гипотез, проводится оценка будущего состояния рассматриваемой системы маркетинга. (McKinsey, 1996, Стати, 1998).
6. др.
Переменная сегментирования – это понятие, которое используется для описания свойства потребителя через конкретные сопоставимые значения, то есть для конкретного потребителя переменная должна иметь конкретные значения. Свойства потребителя – это понятия, через которые выражается отношение потребителя ко всем аспектам удовлетворения свой потребности *Ламбен, 1996). Потребность, которую следует удовлетворить, изучают через свойства потребителей. Эти свойства разделяют на 2 типа:
1) Свойства, отражающие отношение покупателей к ощущаемой потребности, к желаниям и товарам
2) Базовые свойства, которыми обладают потребители независимо от своих потребностей.
При этом допускается проявление свойств первого типа для покупателей со свойствами второго типа.
Для определения переменных сегментирования необходимо четко зафиксировать объект исследования (то есть потребителя). При этом учитываются 3 группы потребителей: конечные покупатели, промышленные покупатели, посредники
Существуют 2 альтернативных подхода к выбору изучаемого объекта.
1. Изучается только один из названных типов потребителей и для этих потребителей формируется список изучаемых свойств (переменных сегментирования).
2. Исследуются все 3 вида потребителей и для этих потребителей формируется список общих переменных сегментирования, которые могут охарактеризовать любой из объектов з объектов объединенного множества потребителей.
Одной из важнейших задач сегментирования является необходимость нахождения тех переменных, с помощью которых можно выделить группу потребителей с одинаковой потребностью.
При этом должна возникнуть логическая цепочка типа:
«если потребитель i характеризуется переменной А со значением а,
И
если это значение переменной А наблюдается у многих потребителей, которые также характеризуются переменной В со значением b,
И
если значение b переменной В есть проявление того, что потребители обладают потребностью N,
то изучаемый потребитель i тоже обладает потребностью N.
См. пример логической последовательности – в конце
1. Метод аналогий. Означает привлечение в качестве прототипа известные методики решения задач, которые схожи с рассматриваемой проблемой. Этот подход можно рассматривать как способ выбора переменных, использование которых позволило получить удачные результаты. Среди многочисленных исследований сегментных структур выбирают те модели (переменные сегментирования), которые, по мнению аналитика, должны дать хорошие результаты при решении изучаемой задачи. Использованный в выбранном исследовании набор переменных подвергают критическому анализу. Модель дополняют своими переменными, которые могли бы учесть особенности решаемой задачи сегментирования.
2. Метод мозгового штурма.
В теории измерений используют 4 типа шкал (Черчилль, 2000)
1. Номинальная шкала.
2. Порядковая
3. Интервальная
4. относительная
Номинальная шкала – образована из чисел, которые поставлены в соответствие объектам изучения. Ее введение преследует 2 цели:
1) распознавание изучаемых объектов по их свойствам;
2) подсчет числа объектов с одинаковыми свойствами.
Пример: мужскому полу может быть поставлен код 1, а женскому – 2. изучение свойства полового признака потребителя будут идентифицироваться с этими цифровыми значениями. При этом промежуточные значения не имеют смысла.
Порядковая шкала – присваивает значения свойствам потребителя с учетом отношения порядка, который присутствует между изучаемыми значениями свойств. Между значениями отдельного свойства потребителя может существовать отношение порядка. Порядковая шкала определяет лексикографический порядок потребителей относительно друг друга с учетом значение изучаемого свойства. Вычисленные значения как разности между кодовыми значениями, присвоенные отельным свойствам, не могут быть использованы для оценки уровня достигаемого свойства. Главное назначение порядковой шкалы – это размещение отдельных объектов согласно установленному значению этого свойства. Нельзя определить относительное положение между парами объектов. Однако можно вычислить среднее значение установленного свойства для выборки объектов.
ПРИМЕР:
Пусть анализу подлежат 3 группы потребителей, каждая из которых обладает свойством, которое имеет 3 значения. Например, низкая платежеспособность, средняя, высокая. Безусловно, что эти свойства устанавливаются аналитиком с учетом конкретных объемов финансовых поступлений в рассматриваемой прикладной области. Каждого потребителя аналитик может оценить по этому значению свойства. Так, например, значению «низкая платежеспособность» присваивается балл, равный 1, «средняя платежеспособность» — 2, «высокая платежеспособность» — значение 3. Можно утверждать, что два потребителя, принадлежащие к различным уровням, например низкому и среднему, находятся в том же отношении порядка, что и баллы 1 и 2. Аналогичное утверждение может быть сделано относительно двух потребителей, обладающих свойствами средней и высокой платежеспособности с баллами 2 и 3. Хотя разность между баллами для каждой из пар одинакова, но равенство этой разницы не отражает расхождения в платежеспособности между высоким и средним уровнем и между средним и низким. Это объясняется тем, что клиентом с высокой платежеспособностью можно считать клиента, превышающего средний уровень во много раз, в то время как отличие низкого уровня от среднего может быть менее заметным. Выявленная непропорциональность значений финансового уровня платежеспособности к балльному эквиваленту показывает, что порядковая шкала позволяет только оценить качественное положение значений друг относительно друга. Эта шкала не может быть использована для числовых оценок различий между уровнями изучаемого свойства потребителя.
Интервальная шкала. С ее помощью можно оценить, на сколько один объект «удален» от другого по рассматриваемому свойству. Например, в качестве объектов могут рассматриваться товары, потребители. Сравнение объектов возможно только тогда, когда может быть вычислено различие между наблюдаемыми свойствами у отдельных потребителей и эти различия могут быть сопоставлены. Например, с помощью этой шкалы можно изучать отношение потребителей к различным товарам.
Относительная шкала, в отличие от интервальной шкалы, предполагает наличие естественного (абсолютного) нуля. Поэтому в этой шкале можно сравнивать абсолютные значения величин (определить, во сколько раз одна величина больше другой).
Примерами относительной шкалы являются шкалы массы и длины. В качестве примера можно рассматривать и объемы продаж товаров потребителям. Также к относительной шкале можно относить измерения цен различных товаров, товарооборот (сумму) в денежном выражении.
Критерии (переменные сегментирования)
I. Географический, в т.ч. по названию территорий; по размеру населенных пунктов; по плотности населения; по климату территории.
II. Демографический критерий (описательное микросегментирование): Используется для: 1) описания и углубленного изучения существующих потребителей; 2) для составления профиля целевого сегмента; 3) для выбора средств коммуникации, имеющих наибольшую вероятность достижения целевой группы; 4) для выявления перспективных покупателей нового товара
1. Пол;
2. Возраст
3. семейное положение
4. жизненный цикл семьи, в том числе информация о детях.
5. религия
6. национальность
7. раса.
III. Социально-экономический критерий
1. Уровень доходов,
2. род занятий,
3. уровень образования
4. источник дохода
5. род деятельности
6. норма расхода,
7. тип жилья
IV. Психографический:
1. Критерий по типу личности:
1) Актуализаторы (Actualizers) - активные, опытные, предприимчивые, без комплексов.
2) Экспериментаторы (Experiences) энергичные, активные. Ищущие острых ощущений
3) Борцы (Srivers) упорные и целеустремленные, но колеблющиеся по некоторым вопросам, кажущимся им важными
4) Довольные (FullFields) – достигшие желаемого, спокойные, удовлетворенные.
5) Успешные (achievers) – делающие карьеру профессионалы, не достигшие вершины и неуклонно стремящиеся к ней, готовые пожертвовать многими ради цели.
6) Уверение (Belivers) имеющие строение нормы и правила и неукоснительно следующие цели, консерваторы относительно мировоззрения.
7) Производители (Makers) – простые люди без затей, консерваторы относительного нового, следующие простым правилам.
8) Борющиеся за существование (Strugglers) – бедные, не имеющие профессиональных навыков, ни к чему не стремящиеся.
2. По Ламбену:
1) Система ценностей и черты личности
2) Виды активности, интересы и мнения
3) Стиль жизни через приобретаемые товары и услуги (активность – интересы- мнения).
Типы европейцев по стилю жизни Табл. 1., рис. 2.
Таблица 1. Характеристики стиля жизни
Деятельность | Интересы | Мнения | Демографические характеристики |
Работа | Семья | О себе | Возраст |
хобби | Дом | О социальных проблемах | Образование |
Круг знакомств | Работа | О политике | Доход |
Отдых | Объединения | О бизнесе | Профессия |
Развлечения | Отдых | Об экономике | Размер семьи |
Членство в клубах | Мода | Об образовании | Тип жилья |
Объединения | Питание | О товарах | Место жительства |
Покупки | Средства информации | О будущем | Размер города |
Спорт | Достижения | О культуре | Стадия жизненного цикла семьи |
V. По социальному типу:
1. Элита общества
2. Золотая молодежь
3. Молодые профессионалы
4. Изящные пары (высокий доход, без детей)
5. Белые воротнички – наемные работники о средним доходом
6. Синие воротнички – квалифицированные работник, специалисты сферы обслуживания
7. Современные семьи с детьми
8. Альтернативный жизненный проект (меньшинства, вегетарианцы и т. д.)
9. Бедная интеллигенция
VI. Критерий сегментирования по выгодам (на основе достоинств). Определяется причастность сегмента к следующим группам:
1. Сегмент «экономичность»
2. Сегмент «надежность и качество»
3. Сегмент потребителей, уделяющих большое внимание марке.
При применении этого критерия требуется информация:
1) перечень свойств или выгод, ассоциируемых с товарной категорией.
2) Оценка относительной важности каждой выгоды
3) Процедура перегруппировки потребителей со сходными системами оценки
4) Определение размера и профиля выявленных сегментов. [3]
VII. Поведенческая сегментация – в зависимости от уровня знаний, отношения, характера использования продуктов и реакции на него.
1. По обстоятельствам применения
2. На основе статуса пользователя
3. На основе оценки интенсивности потребления
4. На основе оценки степени лояльности
5. В соответствии со стадией готовности.
Существуют два подхода выбора переменных для сегментирования на рынке ТПН:
1. Последовательное применение единичного сегментного признака, который разделяет совокупность объектов на сегменты.
2. Предполагает совместный анализ многих переменных для разделения совокупности потребителей на сегменты.
Для описания потребителей промышленных товаров переменные сегментирования делятся на 3 группы:
1. Описательные переменные. Используются для проведения сегментации по одной переменной – потребителю. К ним относятся:
1) отраслевая принадлежность;
2) размер предприятия;
3) численность персонала
4) размер производственных площадей
5) широта производимого ассортимента продукции
6) объем товарооборота
7) тип собственности
8) географическое положение и территориальная близость к потребителям
9) изменение спроса
10) эластичность по ценам
11) способ доставки продукции потребителю
2. Переменные, оценивающие выгоды потребителей (переменные, позволяющие определить выгоды потребителя:
1) по типу производства: какие товары выпускаются, как они выпускаются, как они удовлетворяют потребности покупателей, какие проблемы имеет организация;
2) по конечному использованию товара: основное, вспомогательное оборудование, полуфабрикаты, комплектующие, расходные материалы
3. Переменные, описывающие поведение потребителей ТПН:
1) Соотнесение характеристик производства и личностного состава производственного персонала;
2) ЛПР и ЦПР
3) Длительность принятия решения
4) Лояльность к марке и компании
5) Периодичность по времени и объему закупок.
6) Общая политика закупок (закупочная логистика).
7) По особенностям конкурентной борьбы на рынке покупателя.
8) По конкурентному положению покупателя.
9) Стратегии закупок
10) Формы оплаты
11) Дисциплина оплаты.
12) Финансовое благополучие
13) Технология проверки необходимой документации
14) Наличие требований к пробе образцов.
1. Географическое месторасположение
2. В зависимости от типов организаций. (оптовые и розничные, строительные, машиностроение и т. д.), а также в зависимости от характера капитала (частное или смешанное), от инновационной и сбытовой политики и т. д.
3. Отрасль.
4. технология
5. статус пользователя
6. располагаемые ресурсы
7. срочность выполнения заказа
8. применение товара
9. размер заказов
10. подходы к покупке (организация закупочного центра, политика закупок, критерии закупок.
11. В зависимости от размеров организации. (большие организации - большие скидки)
12. Личные характеристики: мотивация, отношения между покупателем и продавцом, восприятия риска.
Разделяют две группы методов: однопараметрические и многопараметрические.
Однопараметрические – выделение одной главной переменной сегментирования (Морозов, Котлер):
- Определяется структура классификатора, по которому потребители относятся к сегментам.
- Устанавливается количество возможных сегментов и их отличительное свойство, задаваемое через диапазон значений важнейшего параметра.
- Доя выделенной переменной устанавливаются конкретные значения (или интервалы значений), каждому из которых ставится в соответствие сегмент.
См. рис. 3.
Многопараметрические методы - предполагают анализ совокупности переменных сегментирования, которыми описываются свойства изучаемых потребителей. Здесь возможны два похода.
Когда число анализируемых переменных мало и насчитывает два или три анализируемых свойства, выделяемые сегменты могут быть представлены таблицей — для случая двух переменных или кубом — для трех переменных. Куб по-другому называется сеткой сегментирования (рис. 4)
7 этапов:
1. Определение неструктурированной совокупности объектов сегментации.
2. Определение набора переменных, значения которых можно выяснить для каждого потребителя из рассматриваемой совокупности изучаемых объектов.
3. Задание отношения вложенности на выделенном перечне переменных. На этом шаге мы преследовали цель сократить размерность решаемой задачи (осуществить декомпозицию)
4. Если отношение вложенности между переменными установлено, то следует выбрать главную переменную (в смысле охвата ею всех других переменных) и перейти к этапу 5. Если между переменными отношение вложенности отсутствует, то следует перейти к этапу 7.
5. Согласно выбранному признаку необходимо разделить неструктурированную совокупность потребителей на сегменты.
6. Каждый выделенный сегмент на предыдущем шаге следует рассматривать как неструктурированную совокупность покупателей, а далее необходимо выбрать следующую вложенную переменную и перейти к шагу 5. Этапы 5-6 следует продолжать до тех пор, пока не будут использованы все переменные, для которых установлено отношение вложенности.
7. Когда отношение вложенности между переменными отсутствует, разбиение неструктурированной совокупности потребителей на сегменты можно провести только при совместном рассмотрении независимых переменных.
Кластеризация – это совокупность методов и технологий выделения однородных групп объектов и объяснения полученных результатов. Основная цель кластерного анализа при сегментации состоит в поиске однородных групп среди непознанных потребителей, то есть он дает возможность понять и выделить сегментную структуру. В этом состоит отличие метода кластеризации от метода классификации. Результатом кластеризации всегда является некоторый набор групп объектов. Однако получаемое разбиение может и не соответствовать гипотезе о существовании «реально» сегментной структуры. Поэтому при применении кластерного анализа необходимо проводить многочисленные эксперименты, позволяющие совместить результаты с представлением о реальной структуре рынка с конкретными вычисляемыми результатами.
Существует огромное разнообразие алгоритмов кластерного анализа.
Применительно к сегментированию кластерный анализ решает следующие задачи:
1) Классификация потребителей
2) Разработка различных схем кластеризации
3) Создание гипотез о существовании в исследуемой совокупности потребителей однородных групп
4) Проверка гипотез о наличии однородных групп в исследуемых совокупностях потребителей.
Логика кластерного анализа предполагает выполнение следующих шагов:
1) Подготовка данных для кластеризации
2) Определение множества свойств , по которым будут оцениваться объекты
3) Вычисление меры сходства между объектами
4) Применение кластерного анализа для создания групп сходных объектов
5) Проверка достоверности результатов кластерного решения.
Процедура оценки выделяемых кластеров как прототипов сегментов может проводиться в 2 этапа:
1. Проводится математическое изучение получаемых кластеров как однородных групп объектов. Когда будет установлено, что выделенный кластер является достаточно однородным, и его размер соответствует практическим требования, которые предъявляются к сегментам, тогда можно переходить ко второму этапу.
2. На 2 этапе анализируются выделенные однородные группы как целевые сегменты. Дается интерпретация экономического смысла выделяемых групп схожих потребителей, оценивается экономический потенциал выделяемой группы как сегмента для продвижения продукции.
Смысл нормирования состоит в приведении численных значений выбранных переменных к одному масштабу.
Целесообразность нормирования значений переменных можно показать на следующем примере. Пусть одна переменная имеет диапазон изменений от 0 до 5, и пусть эта переменная отражает балльные значения. Другая переменная оценивает количественные параметры, измеряемые в тысячах рублей. При построении меры сходства влияние значений этих переменных на получаемую меру будет, очевидно, различным. Поэтому целесообразно выполнить нормирование по каждой переменной.
При нормировании очень часто выполняют следующее преобразование (формула (6.2) — вычисление нормированного значения наблюдаемой переменной х)
где
х — ненормированное значение переменной;
хmin и xmax - соответственно минимальное и максимальное значения по этой переменной;
х' — вычисляемое нормированное значение переменной
Визуальное представление нормированных данных:
Изображение потребителей в ненормированном пространстве переменных ранее мы представляли на рис. В. 3.1. Нормированные данные в пространстве переменных представлены на рис. В. 4.1. Здесь мы видим, что изображение облака точек (клиентов) приобрело более округлые очертания, сами точки более равномерно распределились в пределах изучаемого облака.
Сходство необходимо не только установить, что оценить. Для этого в кластерном анализе вводят меры сходства.
Существуют геометрические методы определения меры сходства.
Большее распространение при сегментировании получили следующие меры сходства:
Меры расстояния - измеряют удаление одних объектов от других или одного скопления точек от другого. Меры расстояния зависят от выбора шкалы, которая определяет масштаб измерений. Одной из наиболее известных мер расстояний является евклидово расстояние, определяемое как:
где
dij — расстояние между объектами i и j,
хik — значение k-й переменной для i-гo объекта.
Также используются и другие виды расстояния. Большинство из этих расстояний является частными видами метрики Минковского, которая рассчитывается по формуле:
Коэффициент корреляции определяет зависимости между переменными. Поэтому он дает лучшие результаты, когда значения переменных отражают количественные значения. Коэффициент корреляции вычисляется следующим образом:
где
хij — значение i-й переменной для j-го объекта;
xj — среднее всех значений переменных j-го объекта;
n — число переменных.
Мера сходства, вычисленная с помощью евклидовой и других метрик, сильно зависит от различий в диапазонах значений переменных. Это означает, что переменные, у которых одновременно велики абсолютные значения и среднеквадратичные отклонения, могут подавить влияние переменных с меньшими размерами и стандартными отклонениями. Эти недостатки могут быть устранены путем взвешивания переменных. Так, для метрики «евклидово расстояние» мера сходства с учетом коэффициентов важности переменных сегментирования может быть вычислена по формуле (6.6)
(6.6)
При кластеризации, выполняемой в рамках сегментирования, целесообразно проводить предварительное взвешивание отдельных переменных. Взвешивание определяется как манипулирование значением переменной для отражения большей или меньшей роли переменной при измерении сходства между объектами. В общем случае вклад переменной в меру сходства может принимать произвольные значения. Но иногда полезно придерживаться значений из диапазона от 0 до 1. При этом сумма коэффициентов важности по всем переменным должна быть равна 1 (формула (6.7) — ограничение на коэффициенты важности переменных сегментирования):
где
n — число переменных.
Целесообразность такого взвешивания переменных сегментирования определяется желанием аналитика построить более плотные облака точек, которые представляют потребителей. Веса с большим значением присваиваются тем переменным, которые в понимании аналитика играют большую роль при изучении сходства потребителей. Когда переменная имеет нулевой коэффициент важности (вклад), она исключается из построения меры сходства. Так, назначение одной переменной веса с максимальным значением, равным 1, и присваивание всем остальным переменным нулевых весов приводит к предельной ситуации — многомерная задача кластеризации превращается в одномерную задачу.
При взвешивании переменных могут быть применены специальные алгоритмы, которые позволяют выяснить мнение аналитика о важности каждой переменной для построения меры сходства (алгоритм Чер-маиа-Акоффа [Литвак, 1982]). Использование весов (коэффициентов важности) в мерах сходства потребителей позволяет формальными средствами отразить знания аналитика о переменных сегментирования.
Понятие «важности» участия каждой переменной в формируемой мере сходства может вызвать у аналитика трудности в понимании семантики этого термина. Термин «важность переменной» мы будем использовать в двух контекстах. Наряду с «важностью переменной для построения меры сходства» мы так же будем использовать понятие «важность переменной, используемой в функции полезности». Функция полезности применяется нами для интерпретации выделяемых кластеров и в рамках Conjoint-анализа [Green, 1971; Green, 1978; Green, 1988].
1. Плотность
Плотность [Ким, 1989] можно определить как число точек-объектов, приходящихся на единицу пространства, ограниченного переменными сегментирования. Этот параметр позволяет определить кластер как скопление точек в пространстве данных, относительно плотное по сравнению с другими областями пространства. Содержательный смысл этого понятия очевиден. Оно позволяет определить скопление точек (рис. 6.1).
2. Дисперсия [Шеффе, 1980] определяет меру рассеяния точек в пространстве относительно центра кластера. Центр кластера определяется как среднее геометрическое место точек в пространстве переменных (формула (6.8) — определение центра кластера для одной переменной сегментирования, вычисленного с учетом веса этой переменной):
где
wj — вес j-ой переменной;
Ik — количество объектов в k-м кластере.
Дисперсию можно понимать как характеристику того, насколько близко друг к другу в пространстве расположены точки кластера (формула 6.9):
Аналогично определяется среднеквадратичное отклонение объектов (СКО) от центра кластера (формула 6.10):
Можно считать, что дисперсия кластера мала, если точки близки к его центру. И наоборот, дисперсия значительна, если точки разбросаны вокруг центра кластера.
3.
Размеры описываются числом точек, отнесенных процедурой разбиения объектов к рассматриваемому кластеру. Очевидно, что в качестве прототипа для построения сегмента целесообразно выбирать кластеры с большими размерами.
4. Форма кластеров представляет собой расположение точек в пространстве. Обычно кластеры визуально отображают в трехмерном пространстве. Кластеры могут иметь различную форму. Читатель может убедиться в этом. На рис. В.5.2 можно наблюдать кластеры, имеющие округлую форму. Конусовидную форму имеет первый кластер, представленный на рис. В.21.2, а на рис. В.21.4 можно наблюдать сегмент «бананообразной» формы (второй сегмент).
5. Радиус определяется как максимальное расстояние точек от его центра. Очевидно, что радиусом лучше измерять кластеры, имеющие сферическую форму (формула (6.11) - определение радиуса кластера/сегмента по взвешенным переменным сегментирования):
Радиус определяется как максимальное расстояние точек от его центра. Очевидно, что радиусом лучше измерять кластеры, имеющие сферическую форму (формула (6.11) - определение радиуса кластера/сегмента по взвешенным переменным сегментирования):
Когда кластеры имеют вытянутую форму, то понятие радиуса становится бесполезным. В этом случае рассчитывают меру связности точек в кластере как относительную меру расстояния между точками.
6. Отделимость характеризует степень перекрытия кластеров и насколько далеко друг от друга они расположены в пространстве. Кластеры могут быть близки друг к другу и не иметь четких границ.
Для визуального изучения качества разделения объектов на кластеры можно прибегнуть к различным геометрическим построениям. Однако для этого необходимо указать переменные, в пространстве которых будет проводиться интерпретация.
1. Иерархические. Иерархические методы порождают все возможные варианты построения кластеров при выбранной эвристической мере сходства. Вариант построения всевозможных кластеров обычно изображают в виде дерева, которое показывает схему объединения объектов в кластеры. Дерево кластеризации - дендрограмма. Каждому уровню объединения соответствует максимальное значение целевой функции, достигаемое на каждом уровне группировки объектов. В качестве целевой функции используется мера сходства, вычисленная на всей совокупности разбиваемых объектов и выделяемых кластеров.
2. Итерационные. Пользуются большей популярностью, так как на практике необходимо выделять сегменты на больших выборках респондентов. Эти методы определяются как пошаговое подключение к одному из формируемых кластеров одного объекта, который выбирается по одной из возможных итерационных схем кластеризации.
1) Автоматические. В качестве исходного разбиения принимается гипотеза о существовании конкретного количества кластеров, которые необходимо выделить. На первом шаге указывается это конечное число кластеров (гипотеза о К-кластерах). На втором шаге для каждого из кластеров вычисляется центр кластера [Bradley, 1998]. Например, в качестве центра может быть выбран произвольный объект. В практических реализациях центр кластера вычисляется на основе случайных выборок, которые выделяются из всей совокупности анализируемых потребителей. После определения центров кластеров просматриваются объекты из анализируемой совокупности потребителей. Согласно установленной мере сходства выбирается тот объект, который имеет лучшую меру сходства по отношению к другим объектам и формируемым кластерам. По выбранной мере объект относится к одному из кластеров. Далее процесс вычисления продолжается до тех пор, пока все объекты не будут разнесены по кластерам.
2) Экспертные. При экспертном сегментировании аналитику предоставляется возможность самому указать, какие из объектов целесообразно включить в кластер как образцы. Обычно, исходя из своего понимания потребителей как объектов кластеризации, аналитик может достаточно точно сказать, какие из объектов следует отличать друг от друга. Конечно, такое предположение аналитик делает только на интуитивном уровне. Он не может оценить весь комплекс переменных, которыми описываются объекты. Данная процедура позволяет учесть интуитивные знания аналитика о принадлежности клиентов с различными свойствами к исследуемым сегментам. С учетом установленной принадлежности к сегментам отдельных представительных образцов вычисляются центры формируемых кластеров. А затем для определенных экспертным образом центров формируются кластеры путем изучения всей совокупности потребителей. Существуют различные модификации этой схемы, однако практик-аналитик может опустить эти тонкости реализаций. Экспертный подход к выделению сегментов можно рассматривать как альтернативу методу дендограмм. Действительно, эксперт в состоянии отнести к сегментам только небольшое число потребителей. А при небольшом числе кластеризуемых респондентов эксперт может проверить много вариантов разбиения их на сегменты. Поэтому получение знаний о сегментной структуре экспертными методами, основанными на k-means-алгоритмах, практически совпадает по затратам времени с анализом методом дендограмм. Это объясняет популярность применения экспертного метода при анализе сегментной структуры промышленных потребителей.
Применяются также генетические алгоритмы и нейронные сети.
Одной из важнейших задач на этом этапе является проверка схожести объектов, включенных в кластер, который проводится с привлечением математических оценок кластеров. Фиксируются:
1) Число объектов
2) Расстояние
3) Радиус
4) СКО
Для этого составляется таблица (табл. 2)
Таблица 2
Пример таблицы с описанием математических параметров клиентов и выделенных кластеров
Сегмент | Число объектов | Расстояние | Радиус | СКО |
|
1 сегмент | 365 | 0,476 | 0,656 | 0,324 |
|
2 сегмент | 303 | 0,651 | 0,507 | 0,253 |
|
3 сегмент | 327 | 0,308 | 0,626 | 0,301 |
|
Переменная | 1 товар | Значение |
| 1,546 |
|
Сегмент | Минимум | Центр –СКО | Центр | Центр+СКО | Максимум |
1 сегмент | 1,392 | 1,906 | 2,062 | 2,217 | 2,629 |
2 сегмент | 0,667 | 1,23 | 1,378 | 1,525 | 2,141 |
3 сегмент | 0,77 | 1,251 | 1,44 | 1,629 | 2,395 |
СКО- среднеквадратическое отклонение |
Судить о том, пересекаются кластеры или нет, можно только в пределах принятого соглашения о параметре, которым измеряется кластер. Например, радиус кластера и его разброс (СКО) могут иметь различные значения. Поэтому может возникнуть ситуация, когда кластеры по значению своих радиусов будут пересекаться, а по значению разброса – нет.
Если данный объект сложно отнести к одному из кластеров, то могут быть привлечены и другие переменные.
Для изучения структуры кластеров как совокупности точек, удаленных от центра кластеров, полезно выполнить статистический анализ удаленности объектов от центра кластера. Для этого необходимо построить распределение расстояния объектов от центра кластера.
При изучении качества группировки потребителей кластере могут быть привлечены значения отдельных переменных сегментирования. Для анализа распределений переменной в кластерах (сегментах) привлекают классические параметры распределений - среднее, дисперсия, размах и т. д.
Проверка базируется на необходимости реализации двух принципов сегментации:
1) По значениям переменных, которыми описываются свойства потребителей, можно выделить группы схожих потребителей.
2) На выделяемой группе (сегменте) можно достигнуть лучших маркетинговых результатов по продвижению продукции.
Технология проверки статистической значимости проведенной кластеризации. Результатов кластеризации являются группы схожих потребителей (кластеры). Различие между ними может быть оценено по отклонения в средних значениях анализируемой переменной, которая участвовала в кластеризации. Оценка среднего для кластера вычисляется по все потребителям, включенным в кластер (формула 7.1.)
где
wj — вес j-й переменной;
Ik — количество объектов в k-м кластере.
Проверка различий между кластерами сводится к построению статистически обоснованного вывода об отклонениях между величинами средних значений по кластерам.
Можно предположить, что различия в оценках средних значений по каждому кластеру велики, так как метод кластеризации стремится выделить кластеры с максимальным отклонением средних. Однако эти отличия можно наблюдать не для всех переменных, участвующих в кластеризации. Вклад некоторых переменных в достижение различий между кластерами может быть незначительным. Поэтому при построении кластерной структуры целесообразно выделить набор переменных, которые оказывают заметное влияние на результаты кластеризации.
Итак, построим модель однофакторного дисперсионного анализа.
Предположим, что в результате кластеризации было выделено несколько кластеров (сегментов).
Подвергнем изучению только одну переменную, по которой требуется оценить схожесть выделенных кластеров. Для каждого потребителя известно значение этой переменной.
Построим матрицу наблюдений для данного метода анализа. Построенную матрицу будем исследовать методом однофакторного дисперсионного анализа. Пусть столбцы матрицы соответствуют кластерам (сегментам), а строки наблюдениям. Первоначально заполним первую строку матрицы. Наблюдения будем проводить следующим образом. Выберем из каждого кластера по одному потребителю. Для каждого выбранного потребителя выделим значение анализируемого параметра. Поместим это значение в формируемую матрицу, в столбец, соответствующий сегменту, из которого был выбран рассматриваемый потребитель.
Во вторую строку поместим значения оцениваемой переменной для следующих потребителей, выбираемых из сегментов. Выбор потребителей из сегментов проводим «без возврата», т. е. каждый потребитель рассматривается только единожды [Кокрен, 1976],
В том случае, когда из какого-либо сегмента выбраны все потребители, формируемый элемент столбца, который соответствует сегменту, оставляем пустым. Но заполнение строки матрицы продолжается по другим непустым сегментам.
Заполнение строк матрицы наблюдений продолжаем до тех пор, пока все потребители из всех сегментов не будут выбраны.
Итак, мы показали, как может быть построена матрица наблюдений. Пример матрицы наблюдений приведен на врезке 10.
Для оценки результатов кластеризации при изучении выбранной переменной выполняется проверка «нулевой гипотезы» о том, что кластеры не отличаются друг от друга, т. е. средние значения переменной, вычисленные по кластерам, равны. В результате дисперсионного анализа мы должны либо принять эту гипотезу, либо опровергнуть ее.
Если гипотеза о «схожести» кластеров подтверждается, это означает, что в исследуемом множестве данных не обнаруживается кластерная структура и разбиение на кластеры по исследуемой переменной незначимо. Если же в результате дисперсионного анализа мы получим, что кластеры различаются, то этот результат подтвердит правильность нашего кластерного решения и обоснованность выбора переменной как анализируемого свойства при кластеризации потребителей. Проиллюстрируем выполнение проверки гипотезы о значимости различий в сегментах по одной переменной
Таблица В. 10.1
Aрагмент матрицы наблюдений для однофакторного дисперсионного анализа, выполняемого для проверки гипотезы о значимости различий в сегментах по переменной
1 Сегмент | 2 Сегмент | 3 Сегмент |
1,725 | 0,968 | 1,721 |
1,829 | J),858 | 1,407 |
2,494 | 1,598 | 1,082 |
… | … | … |
Количество наблюдений в сегментах: | ||
365 | 303 | 327 |
Столбцы этой таблицы соответствуют выделенным в результате кластеризации сегментам, а строки — клиентам, принадлежащим выделенным кластерам (сегментам). Так как число клиентов в разных сегментах может быть различно, то мы получим столбцы таблицы с различным числом элементов. Так, сегмент 1 содержит 356 клиентов — это означает, что в таблице первый столбец «1 сегмент» содержит 356 элементов.
Далее делается вывод о влиянии переменной на выделение сегментов. Для каждого сегмента вычисляются следующие параметры:
1) число объектов;
2) сумма значений переменной по всем объектам сегмента
3) среднее значение переменной по сегменту;
4) дисперсия переменной по сегменту.
Далее приводится таблица с вычисленными характеристиками (для каждого из источников дисперсии — межгруппового и внутригруппо-вого):
1) сумма квадратов — SS;
2) число степеней свободы — df;
3) средний квадрат — MS.
Полная сумма квадратов и число степеней свободы определяются как суммы соответствующих величин внутри и между группами.
Для проверки нулевой гипотезы (о равенстве средних значений переменной по сегментам) вычислено значение F-статистики. Это значение необходимо сравнить с критическим значением F. Если значение F-статистики больше критического, то нулевая гипотеза о равенстве кластеров отвергается и делается вывод о статистически значимом влиянии анализируемой переменной на результаты выделения сегментов. Если значение F-статистики меньше критического, то нулевая гипотеза о равенстве сегментов принимается и делается вывод о незначительном влиянии переменной на выделение сегментов.
Причина появления перекрытий объясняется существующей неопределенностью, которую приходится преодолевать при кластеризации, когда следует выбрать кластер (сегмент) для изучаемого потребителя. Так как для конкретного объекта могут быть определены расстояния от него до центров выделяемых кластеров. При этом сами кластеры как совокупности объектов оцениваются радиусами или значением среднего квадратичного отклонения объектов от центра кластера.
При кластеризации объект может быть включен только в один из кластеров, хотя он может находиться в пределах окружностей, построенных для нескольких кластеров. Пример такого расположения объекта в пределах двух кластеров показан на рис. 7.1.
Кластер для изучаемого объекта может быть найден по критерию, например, математической близости. Можно предположить, что альтернативный вариант размещения может быть установлен по критериям другой природы (по значению переменной, интерпретирующего критерия, экономического критерия и др.), и это размещение объекта может оказаться «лучше» в маркетинговом смысле.
Можно сказать, что перекрытие кластеров — относительное понятие. Это означает, что перекрытие кластеров можно наблюдать только при некоторых выбранных переменных, ограничивающих пространство анализа.
Для изучения перекрытий кластеров могут быть использованы статистические распределения объектов по кластерам [Hartigan, 1985]. Анализ перекрывающихся участков распределений показывает частотную структуру этих перекрытий.
При анализе экономических свойств сегментов изучению могут быть подвергнуты «экономические» параметры, которые оценивают потребителей, но которые не были использованы в кластеризации для расчета мер близости. Можно наблюдать ситуацию, когда выделенные сегменты по мерам близости не перекрываются, но содержат потребителей с одинаковыми значениями экономических параметров. Так, можно наблюдать сегменты потребителей с различными свойствами, но одинаковым товарооборотом. Из этого следует, что значения переменных сегментирования позволили лишь частично установить зависимость от показателя экономического потенциала сегмента. Статистическая проверка этого свойства проводится методами дисперсионного анализа
Заметим, что для визуализации перекрытий сегментов по значению качественных показателей (экономических показателей) могут быть применены профили сегментов.
Чтобы избавится от перекрытий, аналитику следует прибегнуть к изучению причин их появления. Для этого полезно анализировать влияние отдельных переменных сегментирования. Для поддержки этого рода анализа могут быть применены диаграммы распределений объектов по кластерам Этот анализ может быть проведен и с помощью профилей сегментов
Добиться лучшей группировки потребителей по сегментам и даже уменьшить перекрытие сегментов можно изменением степени воздействия переменных сегментирования на вычисляемые меры близости. Такое «управление» переменными сегментирования может быть выполнено через коэффициенты важности (вклады) переменных (формула (6.6)). Значения коэффициентов важности для переменных сегментирования обычно назначаются экспертным способом (смотрите пункт «Взвешивание переменных сегментирования»).
Полезно также для «борьбы* с перекрытиями применить факторный анализ для «сжатия информации», обработка которой методами кластеризации позволяет получить более плотные кластеры, которые, с большой вероятностью, могут и не перекрываться.
Когда выделение кластеров производится по одной-двум переменным, смысл схожести потребителей, входящих в один и тот же кластер, обычно легко распознается, а выделенным кластерам могут быть присвоены семантически значимые названия, отражающие понимание аналитиком свойства близости потребителей. Но когда сопоставление потребителей проводится по многим переменным, требуются значительные усилия для того, чтобы понять, в чем состоит сходство потребителей. Аналитик заинтересован в том, чтобы интерпретировать «сходство» потребителей, принадлежащих одному кластеру, в терминах более информативных, чем набор изучаемых переменных и значения мер близости [Айвазян, 1989; Klastorrin, 1983; Punj, 1983; Minhas, 1996; Doyle, 1972].
Сходство потребителей может быть проинтерпретировано в маркетинговых терминах. Такая интерпретация дает аналитику намного больше информации для практической работы, чем объяснение причин выделения потребителей в один кластер с привлечением математических понятии. Меры близости являются абстрактными величинами и не имеют простого объяснения в терминах изучаемой предметной области.
Это означает, что аналитик должен интерпретировать полученное кластерное решение в понятных маркетинговых терминах.
Для решения задачи интерпретации обычно используется следующий подход. Он сводится к определению интерпретирующей функции (критерия) на множестве изучаемых переменных, которыми описываются потребители. При построении этих функций используются переменные сегментирования. Аналитик обобщает в виде интерпретирующей функции разрозненные представления о потребителях, отраженные в значениях переменных. Данные функции позволяют вычислить оценки для отдельных потребителей, и, конечно, с их помощью может быть оценен выделяемый кластер (сегмент).
На практике для построения интерпретирующих критериев широко используются три подхода:
1) профили сегментов [Haley, 1968];
2) Факторный анализ (главные факторы) [Андрюкович, 1974; Шерла, 1980; Окунь, 1974];
3) функции полезности [Литвак, 1973; Бешелев, 1973; Дэвид, 1978; Подиновский, 1978;Шмерлинг, 1997;Миркин, 1974; Озерный, 1971; Cattin, 1984].
Данный подход наиболее прост для практического применения. В его основе лежит сопоставление статистических значений переменных, вычисленных для отдельных сегментов. Профиль сегмента отражает свойства «среднего» потребителя из анализируемого сегмента.
Для выяснения семантики кластера как сегмента ( с целью исследования «схожести» потребителей) может быть применен метод построения профиля сегмента. [4]
В данном случае исследуются значения переменных сегментирования по всем потребителям рассматриваемого кластера. Профиль сегмента может быть построен в нескольких видах:
1. Профиль «одной переменной». Обычно этой переменной в процедуре кластеризации присваивается наибольший коэффициент важности. [5] Далее для каждого сегмента строится гистограмма значений выбранной переменной (рис. В. 11.1).
По данной гистограмме можно определить частоту появления в сегменте потребителей, обладающих конкретным значением переменной. Для каждой гистограммы вычисляется среднее значение переменной. Для совместного визуального анализа гистограмму каждого выделенного сегмента удобно расположить на одной числовой оси, по которой откладываются значения переменной.
Когда мы наблюдаем значительное расхождения в значениях средних по каждой гистограмме, тогда можно сказать, что сегменты отличаются своими «усредненными» потребителями. Определение «среднего» потребителя проводится по значению исследуемой переменной в пределах сегмента. В том случае, когда «средние» по сегментам расположены близко друг к другу, можно утверждать, что профиль, построенный по значению данной переменной, не позволяет судить об «индивидуальных» особенностях потребителей из выделенных сегментов.
2. Профиль «многих переменных». Выбирают из набора переменных те, которые емко отражают индивидуальность потребителей из различных сегментов. В пределах каждого сегмента вычисляются средние значения по выбранным переменным. «Средние» представляются в виде столбчатой диаграммы (рис. 8.1). Кроме «средних» могут быть использованы и другие функции, например минимальные, максимальные значения, суммы значений. Выбор функции определяется стремлением аналитика выразить семантику изучаемых кластеров. Конечно, функция расчета показателя также учитывается при присваивании названия исследуемому профилю.
Для удобства сопоставления столбчатых диаграмм, построенных для изучаемых кластеров, полезно упорядочить имена исследуемых переменных. Обычно, задавая порядок между переменными, аналитик пытается установить приоритет анализа переменных. Иногда через установленный порядок имен переменных на диаграмме удается выразить «порядок» семантических значений, присутствующих в именах переменных.
Построенные профили для каждого сегмента следует сопоставить друг с другом. Следует определить, чем профили похожи и чем отличаются. А затем необходимо эти особенности диаграмм интерпретировать как индивидуальность потребителей из различных сегментов.
При сопоставлении диаграмм могут быть применены различные технические приемы. Столбчатые диаграммы могут быть представлены не только в плоскостном (рис. 8.1), но и объемном изображении (рис. 8.2).
В ряде случаев при сопоставлении профилей различных сегментов привлекают лепестковые диаграммы (рис. 8.3). Здесь каждой переменной соответствует свой луч диаграммы, а профили представлены многоугольниками с различными очертаниями.
Применение факторного анализа к решению задач сегментирования [Doyle, 1972] обычно инициируется стремлением аналитика достигнуть двух взаимосвязанных целей:
1) снизить размерность решаемой задачи кластеризации;
2) определить семантику выделяемых кластеров как сегментов.[6]
Факторный анализ предполагает необходимость следующих действий:
1) сжатие и интерпретация
2) выделение главных компонентов (факторов)
3) выбор числа главных факторов
4) помещение потребителей в пространство факторов
5) выбор переменных для интерпретации
Рассмотрим их.
Снижение размерности задачи кластеризации с помощью факторного анализа предполагает замену большого числа (20-50 и более) исходных переменных сегментирования на значительно меньшее число искусственно созданных переменных [Айвазян, 1989; Doyle, 1972]. Обычно используют «сжатие» до двух-трех переменных.
Факторный анализ обеспечивает построение этих искусственных переменных. Эти переменные интерпретируются как факторы, объясняющие наблюдаемые и скрытые зависимости между значениями исходных переменных. Так как информация о зависимостях между переменными в сжатом виде содержится в выделяемых факторах, эти факторы рекомендуется использовать как переменные сегментирования, по которым следует провести кластеризацию изучаемых потребителей. Предположить, что переход к меньшему числу переменных позволит получить лучшие результаты кластеризации, т. е. выделяемые кластеры будут обладать большей плотностью и их границы будут более четкими.
Одновременно с улучшением результатов кластеризации построенные факторы позволяют аналитику объяснить семантику формируемых кластеров. При построении факторов аналитик выбирает те исходные переменные сегментирования, которые вносят наибольший вклад в создаваемый фактор. Изучая семантику этих переменных, аналитик пытается объяснить смысл создаваемого фактора. А через семантику создаваемых факторов аналитик объясняет смысл выделяемых кластеров. Применение факторов позволяет интерпретировать взаимное расположение потребителей.
Метод главных компонент является одной из разновидностей кластерного анализа [Андрюкович, 1974;Иберла, 1980; Окунь, 1974]. Он основан на предположении, что исследуемые обобщенные факторы независимы между собой.
Пусть n объектов (потребителей) описываются m переменными (переменными сегментирования). Каждая переменная может быть представлена линейной комбинацией главных компонент, которые являются искомыми факторами. Формально это определяется следующим образом (формула (8.1) — описание переменной через главные компоненты):
(8.1.)
где
zj —j-я исходная переменная сегментирования; F1, F2..., Fm — общие факторы, влияющие на значения исходных переменных; аj1, aj2,..., а j3— так называемые «факторные нагрузки», которые характеризуют степень влияния каждого фактора.
Цель вычислительной процедуры метода главных компонент (как и любого метода факторного анализа) сводится к определению значений факторных нагрузок — аj1, аj2, ..., аjm . Вычисленные факторные нагрузки устанавливают влияние выделяемых факторов (компонент) на переменные сегментирования.
Геометрически метод главных компонент можно описать следующим образом.
Рассмотрим потребителей в трехмерном пространстве исходных переменных. Каждый объект можно представить как точку в трехмерном пространстве исходных переменных. Так, совокупность потребителей в трехмерном пространстве исходных переменных может быть представлена эллипсоидом (рис. 8.4). В общем случае рассматривается скопление точек в m-мерном пространстве переменных.
Метод главных компонент обеспечивает переход из m-мерного пространства переменных в р-мерное пространство выделяемых компонент. Покажем геометрическую интерпретацию из 3-мерного пространства исходных переменных в 3-мерное пространство главных факторов (рис. 8.5). Здесь количество исходных переменных и выделяемых факторов совпадает. На практике выполняется переход от большого числа m переменных к меньшему количеству факторов, к 2-3 факторам. В иллюстративном примере мы покажем переход от 7 исходных переменных к трем факторам.
Оси факторного пространства (оси F,, F2 F3 на рис. 8.5) выделяются следующим образом.
Главная ось эллипсоида задается линией, для которой сумма квадратов расстояний до всевозможных точек минимальна. Первая компонента задана так, что основная доля информации содержится именно в ней. Это объясняется тем, что дисперсия в направлении этой компоненты максимальна. Вторая компонента определяется аналогично при условии, что она перпендикулярна к первой и третьей оси эллипсоида. Так же определяется и третья ось эллипсоида при условии, что она будет перпендикулярна к первой и второй.
Для m-мерного пространства переменных выделяются т компонент, из которых отбираются первые p главных компонент (факторов).
При реализации метода главных компонент вычисляется матрица факторных нагрузок. Эта матрица показывает, какое влияние каждый фактор оказывает на ту или иную переменную. Строки матрицы соответствуют переменным сегментирования, а столбцы факторам. Матрица факторных нагрузок строится автоматически при обработке исходной матрицы наблюдений, в которой строки соответствуют потребителям, а столбцы — переменным сегментирования. Программная процедура построения матрицы факторных нагрузок и выделения главных факторов описана в пункте «Выделение факторов — сжатие данных. В табл. 12.1 показан пример матрицы факторных нагрузок.
Таблица 12.1
Матрица факторных нагрузок, вычисленная по значениям 7 переменных
Переменные | 1 | 2 |
| Фактор |
|
|
|
Продукт 1 | 0,6263 | -0,4602 | -0,4998 | 0,1950 | 0,0116 | 6 -0,0033 | 7 0,3286 |
Продукт 2 | 0,0718 | 0,6578 | -0,2531 | 0,6695 | -0,0141 | 0,2015 | -0,0954 |
Продукт 3 | -0,1826 | 0,3275 | -0,7433 | -0,4579 | -0,1603 | 0,2658 | -0,0294 |
Продукт 4 | -0,2464 | -0,7991 | 0,1524 | 0,1048 | 0,0678 | 0,5073 | -0,0681 |
Продукт 5 | -0,6678 | -0,1871 | -0,4572 | 0,0881 | 0,5168 | -0,1830 | -0,0412 |
Продукт 6 | -0,7980 | 0,3834 | 0,2731 | 0,0291 | -0,0317 | 0,1210 | 0,3538 |
Продукт 7 | -0,6102 | -0,4668 | -0,2386 | 0,2391 | -«,4932 | -0,2220 | -0,0553 |
На основе найденной матрицы факторных нагрузок вычисляется вектор дисперсий. Значения дисперсий обусловлены воздействием отдельных факторов. Каждый элемент вектора дисперсий соответствует фактору и показывает, какое влияние фактор оказывает на рассеивание точек (потребителей) вдоль осей эллипсоида, которым представляется в модели факторного анализа скопление точек (наблюдений/ потребителей). Первый (больший по значению) элемент вектора представляет величину дисперсии, соответствующую первой главной оси, второй элемент показывает величину дисперсии, соответствующую второй главной оси, и т. д. При использовании корреляционной матрицы суммарная дисперсия факторов равна числу переменных. Поэтому делением выбранного элемента вектора дисперсий на (в нашем примере на число 7 — количество переменных) можно получить долю дисперсии, соответствующую данному направлению или компоненте (фактору).
Аналитик сам должен принять решение, сколько факторов (главных компонент) ему необходимо оставить для работы. На практике обычно используют не все найденные т компонент (факторов), а оставляют лишь несколько, р компонент (р < m).
Главные компоненты выделяются следующим образом.
Вектор дисперсий (которые называют собственными числами в методе факторного анализа) представляют в виде графика (рис. 8.6), по вертикальной оси которого откладываются значения дисперсии, а сами факторы отображаются по горизонтали. Порядок факторов в векторе дисперсий (и на графике) соответствует значениям дисперсий. Важнейший фактор имеет большую дисперсию, за ним следует менее значимый фактор с меньшей дисперсией и т. д.
Анализ этого графика позволяет визуально определить, сколько факторов целесообразно выделить. Так, первая из компонент должна учитывать максимум суммарной дисперсии переменных. Вторая компонента, в силу предположения о независимости факторов не должна коррелировать с первой и должна учитывать максимум оставшейся дисперсии. Построение остальных компонент продолжается до тех пор, пока вся дисперсия не будет учтена. Количество выделяемых компонент определяется долей суммарной дисперсии, учитываемой отобранными компонентами. Чаще всего оставляют для дальнейшего применения столько компонент, сколько требуется, чтобы учитываемая ими суммарная дисперсия составляла заранее указанное число процентов, например, 70-80%. Обычно значение этого процента аналитики указывают при изложении результатов проводимого исследования.
Обычно в методе главных компонент оставляют 2-3 фактора, чтобы можно было наглядно увидеть облака точек (скопления объектов) в пространстве небольшой размерности, определенной выделенными факторами. Координаты точки в данном пространстве есть значения факторов для потребителей. Так значение А-го фактора для z-го потребителя ищется по следующей формуле (8.2) — вычисление значения фактора по исходным значениям переменных, описывающих свойства потребителя:
где
i — индекс потребителя (объекта);
j — индекс исходной переменной сегментирования;
k — индекс выделенного фактора (компоненты);
аjm — факторные нагрузки;
zjm — исходные переменные;
lk— k-e собственное число;
p — количество оставленных главных компонент.
Мы показали, как может быть выделено несколько обобщенных главных факторов (р < m), которые объясняют корреляции между переменными сегментирования. Кроме того, мы продемонстрировали, как могут быть вычислены значения выделенных факторов для каждого изучаемого потребителя.
Теперь проинтерпретируем полученный обобщенный фактор как скрытое свойство потребителей. Этот фактор объясняет значения только группы переменных сегментирования, а не всех исходных переменных сегментирования. Значения других переменных объясняются действием других факторов. Переменные, на значения которых влияет выделенный обобщенный фактор, находятся из матрицы факторных нагрузок следующим образом.
Для изучаемого фактора в матрице факторных нагрузок рассматривается столбец. Элементы столбца содержат факторные нагрузки на переменные сегментирования изучаемого фактора. Считается, что фактор объясняет значения тех переменных, которые имеют наибольшие по модулю факторные нагрузки. Изучение семантики этих переменных позволяет аналитику понять и сформулировать семантику фактора, который аккумулирует в себе информацию о выделенных переменных.
После определения числа главных факторов аналитик переходит к объяснению семантики выделенных факторов на основе анализа семантики переменных, которые имеют наибольшие факторные нагрузки. В нашем примере были выделены три главных фактора. Матрица факторных нагрузок для этих трех факторов показана в табл. В.13.1.
Таблица В. 13.1
Матрица факторных нагрузок для семи переменных и трех главных факторов
Переменные | Фактор 1 | Фактор 2 | Фактор 3 |
Продукт 1 | 0,6263 | -0,4602 | -0,4998 |
Продукт 2 | 0,0718 | 0,6578 | -0,2531 |
Продукт 3 | -0,1826 | 0,3275 | -0,7433 |
Продукт 4 | -0,2464 | -0,7991 | 0,1524 |
Продукт 5 | -0,6678 | -0,1871 | -0,4572 |
Продукт 6 | -0,7980 | 0,3834 | 0,2731 |
Продукт 7 | -0,6102 | -0,4668 | -0,2386 |
Мы видим, что наибольшие нагрузки (отрицательные по знаку) имеют переменные «продукт 5», «Продукт 6», «Продукт 7», а переменная «Продукт 1» имеет значительную положительную нагрузку.
С «отрицательными» переменными ассоциируем положительное воздействие определяемого фактора, т. е. при увеличении воздействия первого фактора его значения будут увеличиваться в отрицательном направлении. В нашем случае можно сказать, что эти величины показывают стремление клиентов перейти к торговле товарами из групп замороженных продуктов, которые представлены переменными «Продукт 5», «Продукт 6», «Продукт 7».
Переменные с большими положительными нагрузками, но меньшими по модулю, чем отрицательные нагрузки, интерпретируем как стремление клиентов не выполнять действие, описываемое отрицательным направлением фактора. Таким образом, клиенты, покупающие в основном замороженные продукты, не склонны закупать кондитерские изделия.
В целом, фактор есть стремление клиентов действовать в направлениях, описываемых переменными с большими значениями факторных нагрузок.
Аналогично первому фактору определяется второй и третий фактор.
Для второго фактора его семантика описывается через переменные «Продукт 4», «Продукт 7», «Продукт 1». Семантика второго фактора может быть объяснена как стремление клиентов торговать товарами из данных товарных групп, но не закупать при этом товары из группы «Продукт2».
А третий фактор объясняется как стремление клиентов торговать товарами бакалеи, мясными продуктами и кондитерскими изделиями. Этот вывод подтверждается большими значениями факторных нагрузок по указанным переменным.
Таким образом, от абстрактных названий главных компонент Фактор 1, Фактор 2, Фактор 3 можно перейти к семантически значимым названиям:
Группа 1 («Продукты 5, 6, 7»);
Группа 2 («Продукты 4, 7, 1»);
Группа 3 («Продукты 3, 5, 1»).
Таким образом, построение факторов для анализа исходных данных сегментирования проводится в следующей последовательности:
- автоматическое построение матрицы факторных нагрузок;
- определение числа важнейших факторов, по проценту обобщенной дисперсии, вычисленной для факторов (рис. 8.6);
- выделение для каждого выбранного фактора переменных со значениями факторных нагрузок больше установленного уровня (табл. В. 13.1 - значения нагрузок выделены жирным шрифтом,);
- наконец, определение семантики выбранного фактора, присвоение фактору названия на основе анализа содержательного смысла выделенных переменных, у которых факторные нагрузки имеют большие значения.
Безусловно, что аналитик формирует свое мнение о важнейших факторах и переменных сегментирования не только на основе формальных правил и вычисленных значений параметров факторной модели. Аналитик должен учитывать семантику решаемой задачи. Однако вычисленные параметры факторной модели могут быть рассмотрены аналитиком как отправная точка для построения семантической интерпретации связей между переменными сегментирования.
Здесь для целей интерпретации используется экспертный метод, основанный на построении функции полезности. Здесь функция полезности определяется как цель, которую следует достичь при использовании выделяемых кластеров как сегментов. Семантику этой цели определяет сам аналитик через задание коэффициентов важности для отдельных переменных сегментирования. Аналитик привлекает свои предположения о том, в какой степени желаемая цель может быть достигнута в зависимости от того, какими свойствами описываются потребители (объекты кластеризации).
Безусловно, аналитик может сформулировать несколько целей, при формальном описании которых одни и те же переменные могут играть различные роли. Это означает, что он для построения каждой цели определяет свою функцию полезности, а для каждой функции определяет вклады переменных сегментирования.
При изучении предпочтений, которые отражают качественные характеристики объектов исследования, применяют понятие бинарного отношения. Введение понятия «бинарное отношение» позволило сформулировать строгий математический аппарат для изучения предпочтений, которые могут высказать аналитики об исследуемых альтернативах. Для количественного описания предпочтений между сравниваемыми альтернативами X и Y используется вещественная функция, называемая функцией полезности. Формально функция полезности определяется следующим образом [Озерный, 1971;Подиновский, 1978]:
«Пусть u — вещественная функция, определенная на множестве альтернатив X, и пусть p,q Х. Функция и называется функцией полезности для отношения предпочтения >- на X, если u(p)>u(q) для любых р и q, таких, что р > q ».
Определенная указанным образом функция полезности обладает свойством линейности, которое формулируется следующим образом:
для всех а, лежащих между 0 и 1, и для всех р и q, принадлежащих X.
Таким образом, от качественного сопоставления альтернатив мы переходим к сравнению вещественных чисел, которые являются значениями функции полезности, определенными на сопоставляемых альтернативах.
Предположим, что сопоставляемые альтернативы р и q есть наборы, определенные на подмножестве X декартова произведения п множеств
Х1 * Х2 *Х .. .Хп. Например, в качестве множеств могут рассматриваться множества значений наблюдаемых свойств изучаемых альтернатив.
На данных наборах может быть определена аддитивная функция полезности [Подиновский, 1978]:
(8.4.)
где хi - значение наблюдаемого i-го свойства S альтернативы;
λi- — есть весовой коэффициент, задающий в количественной шкале предпочтение i-го свойства по сравнению с другими свойствами.
Величина λi определяет важность i-ro свойства S для аналитика в рамках решаемой задачи сопоставления альтернатив р, q. Более важному свойству назначается больший вес, а менее важному свойству — меньший. Общая важность всех свойств равна 1. Для того чтобы альтернативы могли быть сопоставлены с помощью функции полезности [Подиновский, 19 78] необходимо ввести дополнительную информацию о тех свойствах, которыми описываются альтернативы. Необходимо предположить, что эти свойства сопоставимы по важности и допускают сравнение в одной размерности.
Таким образом, для того чтобы сопоставить две альтернативы, необходимо вычислить значения функции полезности согласно формуле (8.4) [Подиновский, 1978]. При этом необходимо предварительно оценить значения коэффициентов важности. Для оценки значения весовых коэффициентов привлекают мнения аналитиков, перед которыми стоит задача сопоставления альтернатив. Существуют различные подходы к выяснению значений коэффициентов важности для функций полезности. Например, для определения численных значений коэффициентов важности часто применяется процедура сопоставления индивидуальных суждений аналитика об отношениях предпочтения для изучаемых свойств (алгоритм Черчмана-Акоффа) [Литвак, 1973; Литвак, 1982]. Данная формальная процедура имеет программную поддержку (смотрите пункт «Шкалирование данных»).
В маркетинговых исследованиях функции полезности нашли широкое применение. На их основе разработан обширный класс методов изучения маркетинговых свойств потребителей, товаров, маркетинговых событий и ситуаций. Эти методы получили название conjoint analysis — «обобщенный» анализ, который реализует технику комплексного изучения свойств сопоставляемых объектов исследования [Acito, 1977; Cattin, 1984; Green, 1971; Green, 1978; Green, 1988; Green, 1993].
Применение функций полезности к исследованию сегментов делает необходимым привлечение от аналитика информации об отношении предпочтения для изучаемых свойств потребителей. Привлечение качественной информации о маркетинговых свойствах потребителей позволяет оценить отдельных потребителей и в целом весь сегмент с помощью значений функции полезности. При этом необходимо обеспечить сопоставимость значений наблюдаемых маркетинговых свойств потребителей. Сопоставимость значений изучаемых свойств на практике достигается с помощью шкалирования. Выбирая те или иные свойства, аналитик может придать функции полезности требуемую маркетинговую семантику.
Аналитик, который решил применить функции полезности для изучения выделяемых сегментов и интерпретации маркетинговых свойств сегментов, прежде всего должен учитывать, что высказываемые им предпочтения о свойствах потребителей, включаемых в создаваемую функцию полезности, отражают лишь его взгляды только в рамках конкретного аспекта изучения. Для изучения иного маркетингового свойства сегмента аналитик может построить другую функцию полезности на иных свойствах потребителей и иных отношениях предпочтения.
Например, при исследовании стратегического потенциала сегментов портфолио-методом [Hussey, 1978; Burke, 1979; Haspeslagh, 1982] необходимо построить две функции полезности, семантика которых отражает конкурентоспособность и привлекательность фирмы на рынке. При построении каждой из этих функций аналитик должен привлечь только те свойства потребителей, которые отражают семантику формируемой функции. Безусловно, что, ставя перед собой задачу изучения страте! ического потенциала на выделяемых сегментах, аналитик должен позаботиться о том, чтобы включаемые в исследование свойства потребителей позволили бы ему описать и понятие конкурентоспособности, и понятие привлекательности.
Макросегментация – это процесс идентификации товарных рынков и описка рыночного окна.
РЫНОЧНОЕ ОКНО – группа потребителей, чьи конкретные потребности не могут быть удовлетворены с помощью имеющихся товаров и услуг, сегменты рынка, которыми пренебрегали фирмы- конкуренты.
ПЕРВЫЙ ЭТАП – определение бизнеса. Связан с ответом на такие вопросы, как:
1) каким видом бизнеса занимается фирма?
2) каким видом бизнеса следует заниматься фирме?
3) каким видом бизнеса не следует заниматься фирме?
С учетом того, что покупатель покупает не товар, а решение своих проблем на этом этапе формируется миссия фирмы.
ВТОРОЙ ЭТАП – концептуализация базового рынка. Выделяют 3 параметра базового рынка (Д.Абел) (см. рис. 5)
1) группа потребителей или те, кого удовлетворяет фирма, функции или потребности потребителя.
2) что удовлетворяется, используемые для удовлетворения потребностей технологии -
3) как удовлетворяются потребности потребителей.
ТРЕТИЙ ЭТАП. Определение границ рынка. Для этого различаются рынки товаров, рынки решений, отрасль (рис. 6):
1) Рынок товара – конкретная группа потребителей, нуждающаяся в конкретной функции или ассортименте функций, в основе которой лежит одна и та же технология.
2) Рынок решения – определяется осуществлением заданных функций в данной группе потребителей, но включает в себя все альтернативные технологии выполнения этих функций
3) Отрасль основывается на единой технологии независимо от связанных с ней функций или групп потребителей.
ЧЕТВЕРТЫЙ ЭТАП. Построение сетки макросегментации. По функциям, технологиям, потребителям. (из множества вариантов выбираются наиболее важные.
ПЯТЫЙ ЭТАП. Анализ значимости полученные сегментов
ШЕСТОЙ ЭТАП. Тестирование сетки сегментацию:
1) Темы роста каждого сегмента и определение сегментов с наивысшим ростом.
2) Определение текущего уровня охвата каждого сегмента?
3) Месторасположение основных потребителей.
4) Месторасположение основных конкурентов
5) Потребности каждого сегмента в качестве, сервисе и т. д.
6) Степень однородности конкурентов и модель конкурентной борьбы на рынке.
7) Степень однородности потребителей
8) Содержание основных факторов успеха.
9) Влияние ухода с рынка одного товара на оставшийся товар.
СЕДЬМОЙ ЭТАП. Поиск новых сегментов (см. про рыночное окно). Ответы на следующие вопросы:
1) существуют ли другие способы (технологии) удовлетворения потребностей?
2) Может ли улучшенный товар выполнять дополнительные функции?
3) Можно ли удовлетворить потребности некоторых покупателей лучше, сократив количество функций или снизив цену?
4) Существуют ли другие группы покупателей, которые требуется данная функция или услуга
5) Существуют ли новые каналы распределения, которыми можно воспользоваться?
6) Существуют ли различные товары и услуги, которые можно продавать единым пакетом.
ВОСЬМОЙ ЭТАП. Выбор стратегии охвата базового рынка.
7. Стратегия концентрации – большая доля в узкой нише.
8. стратегия функциональной специализации – выполнение одной или нескольких функций, н с охватом широкого спектра потребителей. (фирмы, производящие комплектующие детали и узлы).
9. стратегия специализации по клиенту – границы рынка определены широко по функциям и узко по группе потребителей (фирмы специализирующиеся на поставках медоборудования)
10. смешанная стратегия - диверсификация деятельности: разные функции и/или разные группы потребителей.
11. стратегия полного охвата рынка – границы определяются широко как по функциям, так и по группам потребителей.
ДЕВЯТЫЙ ЭТАП. Определение возможностей изменений границ рынка (по одному из 3-х секторов: функции, технологии, потребители):
1. Расширение с включением новых групп потребителей за счет процесса принятия и распространения новых товаров. (микрокомпьютеры в школьных классах).
2. Расширение с включением новых функций за счет процесса систематизации и создания товаров, выполняющих сразу несколько функций (сканер+принтер+ копирование +факс).
3. Расширение через использование новых технологий за счет процесса их замещения (электронные книги вместо обычных).
ДЕСЯТЫЙ ЭТАП. Проведение микросегментационного анализа – по критериям сегментации.
Микросегментация – это процесс выявления на каждом из товарных рынков сегментов.
ВЫБОР ЦЕЛЕВЫХ СЕГМЕНТОВ РЫНКА – определение и отбор одного или нескольких сегментов рынка для выхода на них данной фирмы со своими товарами.
Этапы выбора целевого рынка:
1. Сгруппировать все источники МИ по типу информации, по степени достоверности, типу источников, уровню детализации
2. выделить из общего массива наиболее верифицированные источники (взаимные подтверждения из разных источников).
3. Собрать все верифицированные данные и постараться определить общую тенденцию.
4. сформулировать основные параметры целевой аудитории на основе результатов, полученных на предыдущем этапе.
5. проверить все данные, сопоставив их с результатами, полученными на предыдущем этапе
6. проанализировать все полученные данные, которые не вошли в список источников окончательных характеристики и обратить внимание на неожиданные тенденции.
7. принятие решения.
При оценке степени привлекательности различных рыночных сегментов, удовлетворяющих требованиям к их успешной сегментации, учитываются факторы:
1) размер сегмента, скорость его изменения;
2) адекватный размер
3) измеримость сегмента
4) доступность сегмента
5) цели фирмы
6) ресурсы фирмы
7) Степень однородности рынка.
8) Этап ЖЦТ.
9) структурная привлекательность сегмента, (модель конкурентной борьбы)
10) Маркетинговые стратегии конкурентов.
Причем у фирмы есть выбор:
1. Один товар и на одном сегменте (сегментарная концентрация, специализация);
2. Один товар для всех рыночных сегментов (товарная специализация)
3. Один рынок множество товаров (рыночная специализация)
4. Отдельные рынки и отдельные товары (селективная специализация)
5. все товары- все рынки (отсутствие специализации - Кока-кола)
На выбранных рынках могут использоваться определенные подходы к освоению. Фирме необходимо принять решение:
1. сколько сегментов следует охватить (см 1-й и 2-й варианты охвата рынка)
2. как определить самые выгодные для нее сегменты (концентрированных маркетинг)
Возможны три варианта охвата рынка:
1. Недифференцированный маркетинг.
2. Дифференцированный маркетинг.
3. Концентрированный маркетинг.
По Ламбену:
1. Стратегия концентрации – большая доля в узкой нише.
2. стратегия функциональной специализации – выполнение одной или нескольких функций, н с охватом широкого спектра потребителей. (фирмы, производящие комплектующие детали и узлы).
3. стратегия специализации по клиенту – границы рынка определены широко по функциям и узко по группе потребителей (фирмы специализирующиеся на поставках медоборудования)
4. смешанная стратегия - диверсификация деятельности: разные функции и/или разные группы потребителей.
5. стратегия полного охвата рынка – границы определяются широко как по функциям, так и по группам потребителей.
Рассмотрим простейший пример, который позволит показать, как может быть проведено логическое обоснование целесообразности использования в качестве переменных сегментирования трех свойств потребителей —регион, отрасль, численность.
Предположим, фирма производит сверлильные станки для деревообрабатывающей промышленности. Какую потребность призваны удовлетворить эти станки? Очевидно, эти станки позволяют делать отверстия в деревянных изделиях. Какова логика рассуждений может быть в этом случае?
Из предыдущего жизненного опыта известно, что потребителей, которым необходимо делать отверстия в дереве, находится больше там, где обрабатывают древесину. Древесины много там, где растет много леса. Много леса произрастает на севере европейской части России, в Сибири и в Приморском крае. Следовательно, если мы выберем признак «регион» и по его значению разделив предприятия, то мы выделим территории, покрытые лесом, в которых много древесины. Там много деревообрабатывающих предприятий, которым надо делать отверстия в деревянных изделиях. Именно они могут быть нашими покупателями. Следовательно, характеристика предприятий «регион» может быть рассмотрена как переменная сегментирования, так как мы выстроили логическую цепочку утверждений о переменных и потребностях потенциальных покупателей. Здесь мы говорили о характеристиках территорий, занятых лесом, и полагали, что там есть деревообработка и т. д.
Возможна и другая последовательность рассуждений, которая приведет нас к утверждению, что признак «отрасль» может быть переменной сегментирования для выделения потребителей сверлильных станков. Рассуждения могут быть такими. Если предприятие принадлежит к деревообрабатывающей отрасли, то можно предположить, что на нем производят изделия, в которых необходимо делать отверстия.
И наконец, более слабая логическая цепочка. Если на предприятии большое число работников, то оно обладает большим производством. А тогда на предприятии может быть деревообрабатывающий цех, где изготавливают изделия, при производстве которых необходимо делать отверстия. Можно предположить, что данные предприятия могут купить сверлильные станки по дереву.
Очевидна слабость логических построений последнего примера. Предприятие может быть крупным, но при этом не обладать деревообрабатывающим цехом или не изготавливать изделия с отверстиями. Но среди общей массы крупных потребителей, вероятно, найдутся такие, которым сверлильные станки по дереву необходимы
Пусть мы имеем ограниченное количество потребителей, допустим предприятий. И пусть каждое предприятие описывается тремя переменными:
1) региональным признаком,
2) отраслевой принадлежностью
3) численностью работающего на нем персонала.
У нас есть альтернативы – разбить по каждому отдельному признаку. В этом случае имеются недостатки:
1) При каждом разбиении по одному из признаков мы не принимали во внимание значения других признаков.
2) Вариант разбиения потребителей по одному признаку не дает представления о предприятиях с позиций другой переменной.
3) Использование только одного сегментного признака сделало разделение совокупности потребителей на сегменты простейшей задачей.
Разбиение потребителей одновременно по двум переменным, а именно, по региональному и отраслевому признакам.
Предположим, что предприятия принадлежат N регионам и М отраслям.
Казалось бы, все исходные данные остаются прежними. Однако получить разбиение нельзя, так как информации недостаточно для построения сегментов и неизвестно, как соотносить друг с другом эти две переменные при выделении сегментов. Действительно, есть альтернативы.
Вариант 1. Сначала проведем разбиение предприятий по региональному признаку и получим N сегментов, в которые включим предприятия из одного региона. Затем каждый выделенный региональный сегмент, т. е. предприятия из одного региона, разделим на М групп по отраслевому признаку. В результате на первом уровне разбиения расположены N региональных сегментов, а на втором — расположены М отраслевых сегментов, которые входят в конкретный региональный сегмент. Схема описанного разбиения приведена на рис. 8
Вариант 2. Данный вариант противоположен первому. На верхнем уровне следует расположить М отраслевых сегментов, а на нижнем уровне, в пределах одной отрасли, следует разместить N региональных групп предприятий.
Вариант 3. Здесь мы одновременно строим NxM сегментов, в каждый из которых входят предприятия только одного региона и только одной отрасли. Если в предшествующих вариантах процесс выделения сегментов можно было отобразить в виде иерархической структуры (дерева), то в данном варианте мы получаем матрицу, в которой строкам соответствуют регионы, а столбцам — отрасли (рис. 9).
Итак, мы имеем три равноправных способа построения сегментов. Выбор варианта обусловлен целями исследования, а выделяемые сегменты позволяют лучше организовать маркетинговую работу с сегментами.
Выбор варианта обусловлен следующим.
Во-первых. Перед началом сегментирования необходимо не только выбрать переменные сегментирования, но и установить между ними отношения «вложенности».
- первый вариант сегментирования был получен, когда мы посчитали, что региональная переменная для нас важнее. Выделенный сегмент по региональному признаку может быть поделен далее с помощью отраслевой переменной.
- второй вариант соответствует противоположному предположению - отраслевая переменная «включает» региональную переменную.
- в третьем варианте мы предположили, что обе переменные независимы по отношению друг к другу. Отсюда можно заключить, что концептуальный взгляд на отношение вложенности между переменными приводит к различным результатам сегментирования. Отношение вложенности приводит к иерархии сегментов, а отношение независимости переменных приводит к сегментам, между которыми отсутствует отношение вложенности.
Во-вторых, введение отношения вложенности между переменными значительно упростило процедуру сегментирования. На каждом уровне иерархии разбиение потребителей проводилось только по одной переменной. И на каждом уровне изучению подвергалась совокупность меньшего объема, чем исходная. Это каждый раз снижало размерность решаемой задачи. В момент разделения совокупности на сегменты мы анализировали меньшее количество предприятий.
В-третьих, сегменты, выделенные из общей совокупности только с помощью одной переменной, обладают ясной семантикой. Смысл выделенных сегментов легко понять. Например, при использовании регионального признака мы получили сегменты, содержащие только предприятия одного региона. Когда же мы выделили сегменты с учетом двух сегментов, объяснить смысл полученных сегментов стало чуть сложнее, чем в случае сегментирования по одной переменной. В нашем примере мы используем переменные, смысл которых очевиден. Но когда на практике используются более сложные признаки, тогда выяснение смысла сегментов, выделенных по двум и более переменным, становится отдельной проблемой.
В-четвертых, анализ процесса выделения сегментов показывает, что он представляет собой не однократный акт, а состоит из нескольких действий.
[1] Разбиение потребителей на однороднее группы может дать совершенно незнакомые для аналитика результаты. Аналитику необходимо понять, что есть общего у потребителей, объединенных в одну группу. Без понимания семантики групп сложно выбрать среди них сегменты, на которых должен строится бизнес фирмы. Семантика групп определяется на основе исходных свойств потребителей. Могут быть выбраны дополнительные переменные.
[2] Если выделенные сегменты по математическим соображениям являются однородными, а с учетом переменных, которые определяют результативность продаж, неоднородными, то это может привести к тому, что затраты на продвижение продукции не окупятся.
[3] Например, для зубной пасты: 1) сегмент «предотвращения кариеса», «коммуникабельный сегмент» - белизна; 3) сенсорный сегмент – вкус; 4) «независимый» сегмент - мужчины, выбирающие по цене и не видящие разницы между марками. Среди потребителей аудиотехники: 1) «Спецы» - - наслаждаются качеством звука, интересуются техническими характеристиками товара; 2) «музыканты» - наслаждаются музыкой; 3) «снобы» - хотят продемонстрировать свои возможности, вкусы и эстетическое звучание.
[4] Это самый простой способ анализа сегмента с точки зрения используемого математического аппарата.
[5] Данный коэффициент позволяет показать, что по сравнению с остальными переменными именно эта переменная вносит наибольший вклад в вычисляемую меру близости.
[6] Заметим, что последняя задача очень близка к проблеме построения карт восприятия [Hauser, 1979;Kohli, 1993;Pilon, 1992; Sinclair, 1990], которые применяются в технологиях позиционирования [Ries, 1981; Aaker, 1982; Green, 1993]