Автор работы: Пользователь скрыл имя, 13 Сентября 2013 в 08:54, курсовая работа
Цель аналитической работы с данными — определение ме-стонахождения объекта в «пространстве восприятия (субъектов)» и создание его образа. Имеется в виду, что непосредственно о самом объекте даже по значениям некоторого набора признаков нельзя судить достаточно надежно или полно.
Введение 4
1. Неметрические методы многомерного шкалирования 5
2. Модели поиска индивидуальных различий 16
3. Анализ предпочтений 27
Заключение 41
Список литературы 42
Графическое изображение несоответствий ранговых оценок j можно получить и несколько иным образом, если по оси у вместо % ранговой теоретической величины различий откладывать количественно определенные значения расстояний между объектами dij. Такой рисунок носит название диаграммы Шепарда.
В данном примере улучшить оценки расстояний достаточно просто: монотонность равномерно возрастающих теоретических данных воспроизводится, если центрировать отклоняющиеся от прямой величины расстояний dij посредством расчета обычных арифметических средних:
В завершение ряда данных целесообразно рассчитать среднюю для трех оставшихся пар стран:
Новые центрированные значения закрепляются за двумя соседними парами стран, в данных которых возникли нарушения монотонности.
Исходные и улучшенные оценки различий стран сведем в табл. 8.5. С переходом от оценок к уточненным оценкам (с+1 — первой итерации) неметрический этап завершается.
Таблица 1.4. Исходные ранговые оценки различий стран и величины расстояний между ними в теоретическом пространстве шкал — первичные и уточненные
Исходный ранговый порядок δij |
Стимул |
Стимул |
Стандартизованные расстояния dij |
Ранговый порядок стимулов в пространстве шкал Х1, X2 |
Улучшенные оценки расстояний |
1 |
Россия |
Беларусь |
0,918 |
1 |
0,918 |
2 |
Литва |
Беларусь |
1,646 |
2 |
1,646 |
3 |
Таджикистан |
Армения |
1,759 |
4 |
1,733 |
4 |
Таджикистан |
Россия |
1,708 |
3 |
1,733 |
5 |
Таджикистан |
Беларусь |
2,190 |
5 |
2,190 |
6 |
Литва |
Россия |
2,507 |
7 |
2,388 |
7 |
Литва |
Армения |
2,269 |
6 |
2,388 |
8 |
Литва |
Таджикистан |
3,051 |
10 |
2,761 |
9 |
Россия |
Армения |
2,700 |
9 |
2,761 |
10 |
Беларусь |
Армения |
2,532 |
8 |
2,761 |
Шаг 5. Метрический этап. На данном этапе имеющимся исходным и уточненным величинам расстояний ( и ) находят уточненные оценки координат. Для расчетов используют формулу Лингоса—Роскама:
Чтобы избежать деления на нуль, если dij =0, отношение произвольно приравнивается единице.
Посмотрим, как применить формулу Лингоса—Роскама при вычислении новых оценок координат для стимула Беларусь (исходные данные, участвующие в расчетах, см. в табл. 8.4 и 8.5):
т.е. новые координаты стимула Республика Беларусь будут: X1 = (1,030;-0,180) в отличие от начальных координат X0 = (0,988; -0,164).
Подобные расчеты проводятся для всех участвующих в анализе объектов, после этого уже по новым оценкам координат () находят расстояния между стимулами в теоретическом пространстве (dc+1) и первая итерация заканчивается, остается только оценить качество ее результатов.
Шаг 6. Оценка соответствий монотонных ранговых эмпирических и теоретических данных. Собственно проверке на монотонность подлежат теоретические данные dc и dc+1, рассматривается степень их улучшения на прошлой итерации. Если улучшение существенно, итерация возобновляется после стандартизации полученных на шаге 5 оценок координат и расстояний, если же улучшение мало, итерации заканчиваются, и приступают к интерпретации итогов анализа.
Оценивание соответствий
теоретических результатов
Стресс-формулы Краскала
Стресс-формулы Юнга
Коэффициент отчуждения Гуттмана
Где
Во всех перечисленных формулах символами d и обозначены величины расстояний: исходные и уточненные, после выполнения определенного шага алгоритма, или завершения итерации, d..- среднее арифметическое всех оцененных расстояний:
Расчет стресс-формул продемонстрируем на данных табл. 8.5. Выбрав S1 и S2 Дж. Краскала, посмотрим, насколько улучшены оценки л?1 по сравнению с оценками d (табл. 1.5). Задачу интерпретации величин, исчисленных по стресс-формулам, облегчают известные заранее стандартные характеристики (табл. 1.6).
Таблица 1.5. Проверка на существенность улучшения теоретических оценок расстояний с использованием стресс-формул Дж. Краскала
Стимул |
Стимул |
Исходная ранговая оценка |
|||||
Россия |
Беларусь |
1 |
0,918 |
0,918 |
0,843 |
0 |
1,464 |
Литва |
Беларусь |
2 |
1,646 |
1,646 |
2,709 |
0 |
0,232 |
Таджикистан |
Армения |
3 |
1,759 |
1,733 |
3,094 |
0,0007 |
0,156 |
Таджикистан |
Россия |
4 |
1,708 |
1,733 |
2,917 |
0,0007 |
0,156 |
Таджикистан |
Беларусь |
5 |
2,190 |
2,190 |
4,796 |
0 |
0,038 |
Литва |
Россия |
6 |
2,507 |
2,388 |
6,285 |
0,0142 |
0,068 |
Литва |
Армения |
7 |
2,269 |
2,388 |
5,148 |
0,0142 |
0,068 |
Литва |
Таджикистан |
8 |
3,051 |
2,761 |
9,309 |
0,0841 |
0,401 |
Россия |
Армения |
9 |
2,700 |
2,761 |
7,290 |
0,0037 |
0,401 |
Беларусь |
Армения |
10 |
2,532 |
2,761 |
6,411 |
0,0524 |
0,401 |
- |
21,280 |
21,279 |
48,802 |
0,1700 |
3,385 | ||
128
|
Таблица 1.6. Содержательная оценка величин, исчисленных по стресс-формулам S1 a S2 (Дж- Краскала)
Степень соответствия |
Для формулы | |
Низкая Удовлетворительная Хорошая Отличная Превосходная |
0,2 0,1 0,05 0,025 0 |
0,4 0,2 0,1 0,15 0 |
Согласно данным табл. 1.6 значения критериев S1 и S2, рассчитанные в табл. 1.5, дают основание судить о результатах нашего решения как удовлетворительных. В прикладном анализе, думается, исследователем была бы предпринята при этом попытка продолжить итерации и найти более адекватные оценки координат стимулов и расстояний.
Обобщая материал, отметим, что в рамках методов неметрического МШ решаются схожие с метрическим МШ задачи: оценки координат стимулов и расстояний между стимулами, вращения системы координат, интерпретации аналитических результатов. В то же время заметны и отличия. Неметрическое МШ имеет более сложные алгоритмы, включающие: поиск стартовой конфигурации, неметрический этап — для корректировки распределения теоретических оценок расстояний и, наконец, метрический этап — для уточнения оценок координат стимулов. Итеративная реализация алгоритма неметрического МШ строится таким образом, чтобы предупредить появление вырожденных решений и существенные расхождения функциональных монотонных связей эмпирических и теоретических данных. В его алгоритмах проблемными остаются вопросы: подборки вида монотонной функции, отвечающей фактическому распределению характеристик различий стимулов, неизвестной заранее, и, как прежде, задача интерпретируемости итогов анализа.
Рассмотренные выше методы метрического и неметрического многомерного шкалирования могут применяться для координатного описания только самих стимулов. Но в исследованиях не менее важно иметь представление и о различиях источников информации. В конечном счете пространственное положение стимулов объясняется не только их «непохожестью», но и расхождениями суждений о них, или различием приемов оценивания, получения данных. Действительно, если данные получают посредством анкетирования или экспертного оценивания, то они нередко существенно различаются в силу особенностей поведения и склонностей субъектов, выступающих в роли экспертов, когда же ведется прямая регистрация сведений о явлениях, процессах, свой отпечаток налагают особенности наблюдаемых объектов, условия, в которых они находятся (климатические, экологические) и т.д.
В сущности задача моделирования индивидуальных различий сводится к реализации алгоритма для нахождения шкал и представления в координатном пространстве как стимулов, так к субъектов, их оценивающих.
Координатами субъектов при этом служат значения весовых коэффициентов ωks, характеризующие уровень значимости координатной оси к для субъекта s.
На рис. 2.1 показано гипотетическое распределение субъектов (экспертов) в двумерном пространстве шкал, определяющих экономичность производства. Расположение субъектов задается значениями весовых коэффициентов ωks.
Рис. 2.1. Расположение трех субъектов в двумерном шкальном пространстве процесса эффективности производства
По данным рис.2.1 можно видеть, что, например, субъект 1 в определении эффективности производства примерно равное значение придает характеристикам ресурсоемкости и трудоемкости производства. Субъект 2 считает, что эффективность в наибольшей мере определяется ресурсоемкостью производства, весовой коэффициент для этого общего признака почти в 2 раза превышает оценку значимости по шкале «трудоемкость производства». Наконец, субъект 3 находит, что определяющим для эффективности производства является именно характеристика результатов использования живого труда.
В моделировании индивидуальных различий существует два основных подхода. Первый подход базируется на предположении о независимости координатных осей и объединяет так называемые модели индивидуального шкалирования — Кэррола, Чанга, Хорана и др. (теоретические работы 1968—1970 гг.). Второй подход допускает, что субъекты различаются не только весами координат, но и силой взаимодействия координатных осей (стимулов). Его модели были разработаны в основном в 1972—1980 гг. Наиболее представительной здесь является трех-модальная модель Такера.
Алгоритмы вычислений для
различных моделей
Шаг 1. Построение матриц различий стимулов ∆s для каждого из субъектов.
Шаг 2, Построение S матриц скалярных произведений ∆*s .
С учетом того, что анализируются матрицы различий субъектов ∆s, формулы для определения матриц скалярных произведений запишутся в следующем виде:
где
Затем, при поиске стартовой конфигурации, S матриц скалярных произведений ∆*s обобщаются в одной, средней матрице
скалярных произведений ∆s , элементы которой — простые средние величины:
Основополагающим является предположение, что полученные в ходе подгонки модели оценки ее параметров хорошо воспроизводят скалярные произведения:
или в матричном виде —
Шаг 3. Поиск одним из возможных методов стартовой конфигурации (определение матрицы X0, где 0 указывает на начальную итерацию).
Шаг 4. Оценка весовых коэффициентов (ωks. Множество значений ωks образует матрицу W с данными по к координатным осям и s субъектам, т.е. для конкретного субъекта s в W — диагональной матрице имеется некоторый элемент ωks, представляющий его суждение о k-м общем признаке (k-й шкале).
Шаг 5. Оценка координат стимулов, построение матрицы X размерности j х к — по числу j стимулов (строк) и к координатных осей (шкал).
Шаг 6. Проверка качества полученного решения методом наименьших квадратов:
где и — скалярные произведения по исходным и теоретическим данным.
Если квадрат разности между фактическими и теоретическими скалярными произведениями наименьший или меньше некоторого заранее известного порогового значения, то полученная конфигурация X0 и матрица оценок весов W считаются наилучшими, и алгоритм завершен. Если же значения критерия F неудовлетворительны, оптимизирующие шаги 4—6 повторяются.
Остановимся подробнее на
важнейших моделях
Взвешенная евклидова модель — модель первого типа рассчитана на получение линейно независимой системы координат (шкал). Конструктивно основывается на использовании взвешенной евклидовой метрики:
где — квадрат величины , представляющей вес (важность, значимость) k-той шкалы для субъекта s.
Значение линейно связывается с координатами стимула i субъекта s:
или в матричном виде: Xs= XWs
Очевидно, что при прочих равных величинах координат стимулов увеличение означает и большее различие между стимулами i и j.
При реализации алгоритма анализа индивидуальных различий решаются задачи оценки координат стимулов, оценки величин и их оптимизации.
Для примера возьмем гипотетические матрицы различий, это могут быть, скажем, результаты оценки двумя субъектами уровня экологачности производства до и после проведения природоохранных мероприятий в трех административных районах (табл. 2.1).
Таблица 2.1. Исходные матрицы различий по результатам экспертного оценивания двумя субъектами и исчисленные по ним матрицы скалярных произведений
Информация о работе Многомерное шкалирование в экономических исследованиях