Процедура многомерного шкалирования
Назначение многомерного шкалирования. Представление исходных данных для его проведения. Мера различий объектов. Измерение расстояния между объектами в многомерном пространстве. Модели Торгерсона. Проведение многомерного шкалирования в рамках этой модели.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 10.01.2019 |
Размер файла | 68,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
Многомерное шкалирование начало свое интенсивное развитие в 60-х годах в работах американских ученых Торгерсона, Шепарда, Краскэла. Круг советских специалистов, занимающихся этой проблемой, достаточно узок, и основные их усилия направлены на разработку формализованных методов и вычислительных процедур, реализующих известные модели на ЭВМ. К настоящему времени методы многомерного шкалирования, к сожалению, не получили широкого применения в психометрических исследованиях в нашей стране. Видимо, причинами тому являются малочисленность группы специалистов и отсутствие хороших пакетов программ.
Развитие многомерного шкалирования идет в направлении все большей его формализации. При этом остаются в тени некоторые содержательные вопросы, обсуждение которых могло бы привлечь внимание большого количества пользователей и способствовало бы расширению области применения этих методов. Не уделяется достаточно внимания изучению свойств моделей многомерного шкалирования. Отсутствуют публикации (в доступных американских источниках в том числе), в которых бы анализировался сам механизм шкалирования и рассматривался вопрос о том, каким образом методы многомерного шкалирования позволяют выделить факторы, принимаемые во внимание человеком при сравнении стимулов. Эти вопросы связаны самым непосредственным образом с проблемой содержательной интерпретации формально построенного решения.
Задача многомерного шкалирования в самом общем виде состоит в том, чтобы выявить структуру исследуемого множества стимулов. Под выявлением структуры понимается выделение набора основных факторов, по которым различаются стимулы, и описание каждого из стимулов в терминах этих факторов. Процедура построения структуры опирается на анализ объективной или субъективной информации о близостях между стимулами либо информации о предпочтениях на множестве стимулов. В случае анализа субъективных данных решаются одновременно две задачи. С одной стороны, выявляется объективная структура субъективных данных, с другой -- определяются факторы, влияющие на процесс принятия решения.
1. Каково назначение многомерного шкалирования?
Многомерное шкалирование-- метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в пространстве меньшей размерности чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от эмпирически измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы матрицы расстояний получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Мера различий расстояний в исходном и новом пространстве называется функцией стресса.
Метод многомерного шкалирования по своему замыслу является родственным методу факторного анализа, исторически он может рассматриваться даже как ответвление метода факторного анализа, хотя и основан на несколько иных теоретических предположениях. Так же как и в случае факторного анализа, задача многомерного шкалирования состоит в уменьшении размерности и, следовательно, неопределенности собранных экспериментальных данных. На основе использования различных геометрических моделей этот метод позволяет визуализировать те отношения, которые существуют между оцениваемыми объектами.
Общее назначение метода многомерного шкалирования: он применяется для анализа матриц данных, отражающих те или иные связи между элементами. Эти матрицы могут быть симметричными или асимметричными, квадратными или прямоугольными. Сами данные могут отражать как результаты субъективного оценивания сходства или различия, так и представлять собой различные статистические меры сходства, такие как коэффициенты корреляции или ковариации. Конечной целью такого анализа является представление избыточного объема данных в более компактном и наглядном виде. Это облегчает интерпретацию тех связей, которые существуют между оцениваемыми объектами.
Пример: Е. Смит, Е. Шобен и Л. Рипс, исследуя фактор семантической связности, который они рассматривали в качестве важного фактора, описывающего способы хранения знаний в семантической памяти, предлагали испытуемым оценивать близость но значению различных примеров категории "птица". Оценка проводилась попарно. Таким образом была получена квадратная матрица, содержавшая оценки семантической связности для всех пар птиц, которые предъявлялись испытуемым. Подвергнув далее эти оценки процедуре многомерного шкалирования, Е. Смит и др. сумели представить полученные результаты в виде двумерной геометрической модели. Одним измерением в этом модели оказался фактор размера птицы, вторым - степень ее одомашнивания. Таким образом, исследователи выявили значимые базовые параметры, по которым испытуемые могут сравнивать различные примеры заданной семантической категории.
2. Каким образом должны быть представлены исходные данные для проведения многомерного шкалирования?
Метод многомерное шкалирование можно рассматривать как альтернативу факторному анализу, в котором достигается сокращение числа переменных, путем выделения латентных (непосредственно не наблюдаемых) факторов, объясняющих связи между наблюдаемыми переменными. Цель многомерного шкалирования - поиск и интерпретация латентных переменных, дающих возможность пользователю объяснить сходства между объектами, заданными точками в исходном пространстве признаков. Показателями сходства объектов на практике могут быть расстояния или степени связи между ними. В факторном анализе сходства между переменными выражаются с помощью матрицы коэффициентов корреляций. В многомерном шкалировании в качестве исходных данных можно использовать произвольный тип матрицы сходства объектов: расстояния, корреляции и т.д. Несмотря на то, что имеется много сходства в характере исследуемых вопросов, методы многомерное шкалирование и факторный анализ имеют ряд существенных отличий. Так, факторный анализ требует, чтобы исследуемые данные подчинялись многомерному нормальному распределению, а зависимости были линейными. Многомерное шкалирование не накладывает таких ограничений, оно может быть применимо, если задана матрица попарных сходств объектов. В терминах различий получаемых результатов факторный анализ стремится извлечь больше факторов - латентных переменных по сравнению с многомерным шкалированием. Поэтому многомерное шкалирование часто приводит к проще интерпретируемым решениям. Однако более существенно то, что метод многомерное шкалирование можно применять к любым типам расстояний или сходств, в то время как факторный анализ требует, чтобы в качестве исходных данных была использована корреляционная матрица переменных или по файлу исходных данных сначала была вычислена матрица корреляций. Основное предположение многомерного шкалирования заключается в том, что существует некоторое метрическое пространство существенных базовых характеристик, которые неявно и послужили основой для полученных эмпирических данных о близости между парами объектов. Следовательно, объекты можно представить как точки в этом пространстве. Предполагают также, что более близким (по исходной матрице) объектам соответствуют меньшие расстояния в пространстве базовых характеристик. Поэтому, многомерное шкалирование - это совокупность методов анализа эмпирических данных о близости объектов, с помощью которых определяется размерность пространства существенных для данной содержательной задачи характеристик измеряемых объектов и конструируется конфигурация точек (объектов) в этом пространстве. Это пространство («многомерная шкала») аналогично обычно используемым шкалам в том смысле, что значениям существенных характеристик измеряемых объектов соответствуют определенные позиции на осях пространства.
Логику многомерного шкалирования можно проиллюстрировать на следующем простом примере. Предположим, что имеется матрица попарных расстояний (т.е. сходства некоторых признаков) между некоторыми городами. Анализируя матрицу, надо расположить точки с координатами городов в двумерном пространстве (на плоскости), максимально сохранив реальные расстояния между ними. Полученное размещение точек на плоскости впоследствии можно использовать в качестве приближенной географической карты. В общем случае многомерное шкалирование позволяет таким образом расположить объекты (города в нашем примере) в пространстве некоторой небольшой размерности (в данном случае она равна двум), чтобы достаточно адекватно воспроизвести наблюдаемые расстояния между ними. В результате можно измерить эти расстояния в терминах найденных латентных переменных. Так, в нашем примере можно объяснить расстояния в терминах пары географических координат Север/Юг и Восток/Запад.
3. Что такое мера различий объектов? Какие способы оценки различий вы знаете?
Меры различия, типы моделей
Многомерное шкалирование предлагает геометрическое представление стимулов в виде точек координатного пространства минимально возможной размерности.
Существует два типа моделей: дистанционные и векторные. В дистанционных моделях исходные различия должны быть приближены расстояниями, в большинстве случаев используют привычное евклидово расстояние:
В векторных моделях меры близостей или связей -- величины, обратные различиям, аппроксимируются скалярными произведениями векторов, соединяющих точки, соответствующие стимулам, с началом координат:
При построении конфигурации стимулов используется аппарат линейной или нелинейной оптимизации. Почему же такая простая модель и формальные методы поиска экстремума позволяют получить содержательно интерпретируемое решение? Почему оси, построенные формальным образом, приобретают смысл хорошо интерпретируемых факторов?
Векторная модель. Обсудим геометрические свойства векторной модели. Начнем со шкалирования бинарных данных, т. е. высказываний типа «похожи--непохожи». Допустим, что мы имеем матрицу, содержащую информацию о том, что все стимулы не похожи друг на друга. Как можно представить геометрически такую структуру? Стимулы должны располагаться либо на ортогональных прямых, либо в начале координат. В этом случае все скалярные произведения будут нулями.
Перейдем к ситуации наличия нескольких групп похожих между собой стимулов. Стимулы из одной группы должны представляться одной точкой; точки, соответствующие разным группам, должны принадлежать ортогональным прямым. Изолированные стимулы могут быть помещены в начало координат. Тогда скалярные произведения между похожими стимулами будут большими, а скалярные произведения между непохожими стимулами будут нулями.
Ориентируем оси координатного пространства вдоль ортогональных направлений. Тогда каждая ось будет связана с группой похожих между собой стимулов, и фактор, ей соответствующий, будет лежать в основе сходства этих стимулов. Разным группам будут соответствовать ортогональные осп и, следовательно, независимые факторы. Исключение составляют изолированные стимулы, которые могут попасть в начало координат. Чем больше стимулов объединяются в группы, тем меньше измерений необходимо.
Пусть теперь мы располагаем дискретными или непрерывными данными, т. с. получаем оценки о сходствах или связях либо в виде баллов, либо в виде чисел. Допустим, что в этом случае матрица имеет квазиблочпую структуру. Тогда по ней можно разбить все множество на несколько групп так, что стимулы внутри каждой группы будут сильно связаны, а стимулы из разных групп--слабо связаны между собой. Характер отображения будет примерно таким же, как в случае непересекающихся бинарных данных. Однако стимулы из одной группы не будут представляться одной точкой, а будут сконцентрированы в некоторой ее окрестности. Такая структура, вообще говоря, не будет совпадать с ортогональной системой координат, поскольку точки могут лежать несколько в стороне от осей. Однако если связи в группах достаточно сильны, а связи между группами достаточно слабы, то и в этом случае каждое измерение будет связано с одной группой и фактор, ему соответствующий, будет лежать в основе сходства стимулов из этой группы.
На практике сильно структуризованные данные, характеризующие непересекающиеся группы стимулов, встречаются редко, обычно группы имеют пересечения. Имеются стимулы, похожие одновременно на стимулы из двух или нескольких групп. Естественно, что они не попадут на оси, а будут располагаться в пространстве между ними. Характер распределения будет зависеть от матрицы исходных данных. Картина будет тем контрастнее, чем более структуризованы данные, т. е. сильнее внутригрупповые связи и слабее -- межгрупповые. Оси будут определяться группами стимулов, которые очень похожи между собой и минимально похожи на стимулы из других групп. Такие стимулы характеризуются большими значениями координат по соответствующим осям. Эти группы стимулов лежат в основе всей структуры. Остальные стимулы, похожие одновременно на стимулы из нескольких групп, должны занять промежуточные положения между этими группами.
Поскольку исходная матрица не является матрицей точных расстояний или скалярных произведений, то все стимулы не могут быть отображены в пространстве, определяемом ортогональными осями, соответствующими изолированным группам. Для их размещения потребуются дополнительные размерности. Если первый тип размерностей определяется большими межгрупповыми различиями и каждая размерность характеризуется значительным разбросом стимулов, то второй тип размерностей возникает за счет того, что субъективные различия между стимулами не могут быть отображены точным образом в пространстве небольшого числа размерностей. Разброс стимулов вдоль размерностей второго типа невелик и во многих случаях им можно пренебречь.
Центрированная векторная модель. Другой вариант векторной модели -- модель центрированных скалярных произведений. На ней основан широко распространенный метод Торгерсона, положивший начало теории многомерного шкалирования. В этой модели полагается, что начало координат помещено в центре тяжести структуры. Исходные близости или связи должны быть аппроксимированы скалярными произведениями векторов, соединяющих точки, соответствующие стимулам, с центром тяжести конфигурации. Матрица исходных близостей предварительно центрируется, так что наряду с положительными числами в ней появляются и отрицательные. Если пронормировать приведенные данные: |ajk 1, то их можно рассматривать как коэффициенты корреляции.|
Решение, порождаемое моделью центрированных скалярных произведений, отличается от решения, получаемого по обычной векторной модели. В исходной матрице близости (связи) между стимулами могут принимать положительное, нулевое и отрицательное значения; будем приближать их скалярными произведениями. Естественно, что стимулы, характеризующиеся сильными положительными связями (большими мерами близостей), должны концентрироваться в окрестности одной точки, отстоящей на значительном расстоянии от начала координат. Тогда скалярные произведения между соответствующими векторами будут большими. Стимулы, характеризующиеся отрицательными связями, должны находиться по разные стороны от начала координат. Скалярные произведения между ними будут принимать максимальные отрицательные значения, если они будут принадлежать разным концам одной прямой, проходящей через начало координат. Пары стимулов с нулевыми связями должны принадлежать ортогональным прямым; в таком случае скалярные произведения между ними будут нулями. Изолированные стимулы, имеющие нулевые связи со всеми остальными, могут попадать в начало координат.
Большие положительные, отрицательные, а также нулевые связи будут определять основную структуру всей системы. Стимулы, характеризующиеся умеренными связями, будут располагаться между этими основными группами стимулов. Чем слабее связи, тем ближе стимулы к началу координат. Поскольку исходная матрица близостей или связей не является точной матрицей скалярных произведений, то все стимулы не могут быть отображены в пространстве небольшой размерности. Как и в случае предыдущей модели, для компенсации шума в данных потребуются дополнительные размерности, разброс в направлении которых незначителен по сравнению с основными размерностями и им можно пренебречь. Таким образом, модель центрированных скалярных произведений позволяет отобразить структуру системы в координатном пространстве, натянутом на небольшое множество ортогональных прямых. Повернем первоначальные оси пространства и совместим их с этими прямыми. Тогда каждую ось можно интерпретировать как биполярный фактор: справа будут располагаться стимулы, характеризующиеся положительными значениями этого фактора, слева -- отрицательными, а в центре -- нулевыми. Ортогональные оси будут соответствовать стимулам или группам стимулов, не связанных между собой, поэтому они могут интерпретироваться как независимые факторы. Решение, порождаемое моделью, будет иметь смысловое содержание.
Дистанционная модель. Посмотрим теперь, какими свойствами обладает дистанционная модель; ограничимся евклидовой метрикой. Начнем опять с системы, в которой все стимулы не похожи друг на друга. Для точной передачи структуры этой системы следует поместить каждый стимул в одну из N вершин многогранника с одинаковыми ребрами (симплекса). Тогда стимулы будут отстоять друг от друга на одинаковом расстоянии.
Пусть имеется несколько изолированных групп- стимулов. Тогда стимулы из одной группы должны быть помещены в одну вершину, и многогранник будет иметь размерность, равную количеству групп. В отличие от векторной модели изолированные стимулы не могут быть все помещены в одну точку -- начало координат, каждый из них должен занимать отдельную вершину.
В общем случае произвольной матрицы различий группы похожих между собой стимулов будут сконцентрированы вблизи одной вершины, а стимулы, похожие одновременно на стимулы из двух или нескольких групп, будут располагаться между этими вершинами.
Характер конструкции будет определяться в основном большими различиями между стимулами или группами стимулов. Однако, как и в случае векторной модели, ввиду того, что матрица различий не является точной матрицей расстояний, для передачи структуры потребуются дополнительные размерности. Но разброс стимулов в этих направлениях будет сравнительно мал.
В результате шкалирования необходимо выявить существенные оси, разброс в направлении которых велик, и отбросить несущественные оси, разброс в направлении которых мал. Итак, следуя модели многомерного шкалирования, можно разместить все стимулы в пространстве таким образом, чтобы оси несли смысловую нагрузку и факторы, им соответствующие, лежали в основе сходств или различий между стимулами.
Построенная результирующая конфигурация и полученные размерности отражают данные, занесенные в матрицу близостей или различий. И хотя многомерное шкалирование при своем зарождении было предназначено для анализа высказываний человека, никакой специфики обработки субъективных данных в нем не содержится. Оно в равной мере может использоваться и для анализа объективных данных о близостях или связях. Более того, иногда легче поддаются интерпретации объективные данные, потому что они характеризуют некие объективные связи между объектами. Интерпретация субъективных данных, построенных на основе высказываний одного человека (эксперта, испытуемого), может вызвать значительные затруднения у другого человека (исследователя, экспериментатора).
После анализа механизма шкалирования легко понять, какие же данные следует считать хорошими или, как принято говорить, хорошо структуризованными. Для кластерного анализа хорошо структуризованной является матрица, которая может быть приведена к блочно-диагональному виду. Иными словами, если имеется группа похожих (или сильно связанных) между собой стимулов, то все стимулы этой группы должны быть непохожими на остальные (или слабо связаны). Тогда структура может быть представлена изолированными группами сходных между собой стимулов. В многомерном шкалировании ввиду непрерывности измерений требования на входную информацию более слабые. Если два стимула сходны между собой, то они должны иметь близкие профили сходств со всеми другими стимулами. Это является необходимым условием для их адекватного представления в пространстве небольшого числа измерений.
Хотя модель многомерного шкалирования достаточно проста и интуитивно понятно, какого характера решение следует ожидать, попытки построить конфигурацию точек вручную могут привести к успеху лишь при очень небольшом количестве стимулов и хорошо структуризованной матрице близостей. В общем случае исследователь вынужден прибегнуть к помощи вычислительной машины, а для работы на ней необходимо алгоритмизировать процесс решения задачи. Иногда трудно вручную построить конфигурацию даже для небольшого набора стимулов. Примером такого множества могут служить равнояркие цветовые стимулы, равномерно распределенные по длине волны. Анализ матрицы субъективных различий не позволяет выделить ключевые стимулы, различия между которыми могли бы быть положены в основу всей структуры. Обработка этих данных на ЭВМ приводит к представлению стимулов на окружности -- «цветовом круге»; действительно, с точки зрения такой структуры все стимулы равноценны.
Меры различия. Вывод об экспериментальном эффекте может быть сделан как на основе установления значимой связи между изменениями НП и ЗП, т.е. путем использования мер связи, так и путем установления значимых различий в ЗП между экспериментальным и контрольным условиями, т.е. путем использования мер различий. Выбор тех или иных статистических критериев определяется обоснованным обсуждением адекватности их с точки зрения возможных соотнесений разных видов представления эмпирических результатов и предположений о каузальной зависимости. Если выбраны меры связи, то далее необходимы решения о выборе коэффициента корреляции, соответствующего шкалам измерения психологических переменных и плану соотнесения ЗП с экспериментальными условиями. В случае если выбраны меры различий, то также предполагается ряд решений об их соответствии плану сбора данных и типу показателей ЗП.
При установлении связей между переменными, измеренными в разных шкалах, требуются решения об их преобразованиях (приведение к одному виду, например, на основе их нормирования). Эти и другие решения принимаются не на основе знаний по статистике, а на основе содержательных переходов от целей исследования к поиску процедур, соответствующих установлению необходимых психологических шкал и способов количественной оценки полученных эффектов.
Выявление ковариации или корреляции переменных для выполнения второго условия причинного вывода не означает, что отношение между НП и ЗП должно статистически оцениваться именно на основании использования мер связей. В этом условии имеется в виду установление неслучайного, закономерного соответствия фиксируемых изменений ЗП изменениям в уровнях управляемого (экспериментального) фактора. Статистические выводы о значимых различиях в выборочных показателях ЗП в контрольном и экспериментальном условиях, т.е. использование мер различий для установления экспериментальных эффектов, позволяют установить лишь факт изменений ЗП. Это первый шаг к выводу о результате действия НП. Вторым существенным шагом (при планировании эксперимента и обсуждении его результатов) является обоснование того, что разница в условиях НП экспериментально контролировалась. Обсуждение экспериментальной процедуры с точки зрения того, действительно ли управляемые экспериментатором различия выступают в качестве причинно-действующих условий - лишь один из аспектов принятия решения об установленной зависимости. Другим, не менее важным аспектом является многоплановая оценка валидности эксперимента.
Статистические решения об отвержении нуль-гипотез следует рассматривать только в качестве одного из этапов реализации достоверных выводов об установленной зависимости на основе полученных эмпирических данных. Формальное планирование учитывает этот этап следующим образом. Величина полученного в эксперименте различия (в сравниваемых рядах показателей ЗП) оценивается с точки зрения предполагаемого минимального эффекта, который при заданном уровне значимости (вероятности ошибок первого рода), а также необходимом для этого числе проб или испытуемых (n - величина выборки) принимается в качестве критериального при заключении о неслучайном характере различий в эмпирических выборках показателей.
Статистические решения связаны с количественной оценкой экспериментального эффекта как преодолевающего это минимальное значение. Однако они не означают установления количественных зависимостей, если под таковыми понимать установление количественно представленных отношений между изменениями в уровнях НП и ЗП.
Экспериментальная гипотеза может включать предположения о функциональных отношениях между НП и ЗП как количественных зависимостях. Статистические решения осуществляются и для сравнения качественных уровней НП по соответствующим им показателям ЗП. Иными словами, сама по себе количественная оценка основного результата действия НП не означает, что психологическая гипотеза является количественной.
4. Как измеряются расстояния между объектами в многомерном пространстве?
Задача многомерного шкалирования состоит в построении переменных на основе имеющихся расстояний между объектами. В частности, если нам даны расстояния между городами, программа многомерного шкалирования должна восстановить систему координат (с точностью до поворота и единицы длины) и приписать координаты каждому городу, так чтобы зрительно карта и изображение городов в этой системе координат совпали. Близость может определяться не только расстоянием в километрах, но и другими показателями, такими как размеры миграционных потоков между городами, интенсивность телефонных звонков, а также расстояниями в многомерном признаковом пространстве. В последнем случае задача построения такой системы координат близка к задаче, решаемой факторным анализом - сжатию данных, описанию их небольшим числом переменных. Нередко требуется также наглядное представление свойств объектов. В этом случае полезно придать координаты переменным, расположить переменные в геометрическом пространстве. С технической точки зрения это всего лишь транспонирование матрицы данных. Для определенности мы будем говорить о создании геометрического пространства для объектов, специально оговаривая случаи анализа множества свойств. В социальных исследованиях методом многомерного шкалирования создают зрительный образ «социального пространства» объектов наблюдения или свойств. Для такого образа наиболее приемлемо создание двумерного пространства.
Основная идея метода состоит в приписывании каждому объекту значений координат, так, чтобы матрица евклидовых расстояний между объектами в этих координатах, умноженная на константу, оказалась близка к матрице расстояний между объектами, определенной из каких-либо соображений ранее.
Метод весьма трудоемкий и рассчитан на анализ данных, имеющих небольшое число объектов
Основной тип данных в МШ - меры близости между двумя объектами (i, j) -dij. Если мера близости такова, что самые большие значения dij соответствуют парам наиболее похожих объектов, то dij - мера сходства, если, наоборот, наименее похожим, то dij - мера различия.
МШ использует дистанционную модель различия, используя понятие расстояния в геометрии как аналогию сходства и различия понятий (рис. 1).
Для того чтобы функция d, определенная на парах объектов (а, b), была евклидовым расстоянием, она должна удовлетворять следующим четырем аксиомам:
d (a,b)>0,
d(a,a) = 0,
d(a,b) = d(b,a),
d(a,b)+d(b,c) > d(a,c).
Тогда, согласно обычной формуле евклидова расстояния, мера различия двух объектов i и j со значениями признака k у объектов i и j соответственно Xik и Xjk:
Рис.1. Расстояние в евклидовой метрике
5. Какие типы данных могут быть использованы при проведении многомерного шкалирования?
Методы многомерного шкалирования могут использовать разные типы данных: данные о предпочтениях субъекта на множестве стимулов, данные о доминировании, о близостях между стимулами, данные о профилях и т. п. Как правило, с каждым типом данных принято соотносить определенную группу методов их обработки. Однако такое соотнесение не должно быть слишком жестким, поскольку часто не представляет особого труда перейти от одного типа данных к другому. Так, например, данные о профилях можно легко преобразовать в данные о близостях, для этого необходимо только воспользоваться подходящей метрикой. Данные о предпочтениях содержат в себе информацию о доминировании. С другой стороны, подсчитав корреляции между столбцами матрицы предпочтений, получим матрицу близостей между стимулами, а корреляции между строками той же матрицы дадут нам матрицу близостей между субъектами. В настоящей работе будет обсуждаться только анализ близостей.
В основе многомерного шкалирования лежит идея геометрического представления стимульного множества. Предположим, что нам задано координатное пространство, каждая ось которого соответствует одному из искомых факторов. Каждый стимул представляется точкой в этом пространстве, величины проекций этих точек на оси соответствуют значениям или степеням факторов, характеризующих данный стимул. Чем больше величина проекций, тем большим значением фактора обладает стимул. Мера сходства между двумя стимулами обратна расстоянию между соответствующими им точками. Чем ближе стимулы друг к другу, тем выше мера сходства между ними (и ниже мера различия), далеким точкам соответствует низкая мера сходства. Чтобы точным образом измерить близости, необходимо ввести метрику в искомом координатном пространстве; выбор этой метрики оказывает большое влияние на результат решения.
6. Коротко опишите основные понятия модели Торгерсона
Одна из первых моделей многомерного шкалирования была предложена в самом начале 1950-х гг. американским статистиком У.Торгерсоном и получила название метрической модели Торгерсона. Эта модель была призвана изменить традиционные подходы к проблеме психологических измерений. Дело в том, что обычно в психометрике измерения осуществляются по заранее заданным свойствам. Так, например, можно оценивать субъективную громкость звука или яркость света или же уровень привлекательности человека на фотографии. Такое шкалирование называется одномерным. Этот подход, очевидно, предполагает, что воспринимаемые характеристики объектов уже известны исследователю и могут быть выделены испытуемым в явном виде. В то же время в ряде случаев оказывается, что параметры, по которым испытуемый оценивает комплексные стимулы, оказываются неизвестными исследователю либо оказываются трудно выделяемыми в экспериментальных процедурах. Даже если исследователь и может обозначить эти свойства, они могут оказаться значительно более сложными по своей природе, включая в себя целый набор более простых характеристик. Тогда целью измерений могут стать непосредственно выявление таких параметров и оценка их числа. Именно такую задачу и решал У.Торгерсон, разрабатывая свою модель многомерного шкалирования.
Идея У.Торгерсона состояла в том, чтобы реконструировать недоступные для исследования параметры, по которым происходит оценка объекта, на основе данных, описывающих субъективные метрические расстояния между ними. Иными словами, предполагалось, что такие расстояния должны быть изначально заданы в интервальной шкале или шкале отношений. Эти данные, как предполагалось, содержат всю необходимую информацию для того, чтобы можно было реконструировать скрытые от непосредственного наблюдения характеристики и таким образом сделать их явными.
В качестве примера представим, что нам нужно построить карту местности для трех объектов. Мы не знаем, каким образом расположены эти объекты относительно друг друга, располагаются ли они в один ряд, находятся ли они в одной плоскости или же местность отличается выраженным перепадом высот. Все, что у нас есть, - это информация об удаленности этих трех объектов друг от друга. Тем не менее, имея такую информацию, мы можем на ее основе установить, располагаются ли все наши объекты на одной прямой или образуют нечто наподобие треугольника. Действительно, если мы обнаружим, что сумма расстояний от первого объекта до второго и от второго до третьего равна расстоянию от первого до третьего, очевидно, что все три этих объекта располагаются на одной прямой. Иначе для описания их взаиморасположения понадобятся уже два пространственных измерения. Имея в распоряжении данные о большем числе объектов, мы можем построить и более сложную трехмерную модель взаиморасположения объектов на местности.
Отталкиваясь от рассуждений подобного плана, Торгерсон разработал конкретную процедуру реконструкции многомерного пространства точек на основе данных о попарном расстоянии между ними. Эта процедура включала три основных шага.
На первом шаге получают матрицу попарных расстояний. Как уже было отмечено, метрическая модель многомерного шкалирования предполагала, что эти расстояния должны быть представлены по меньшей мере в интервальной шкале. Для получения такой матрицы используют процедуру, напоминающую процедуру парных сравнений Терстона (Ч.А.Измайлов, М.Б.Михалевская). Однако такая процедура не дает нам информации о точке отсчета в реконструируемой системе координат. Таким образом, требуется второй шаг - от относительных расстояний перейти к их абсолютным значениям. Наконец, на третьем шаге определяется необходимое число измерений, которые требуются для того, чтобы расположить все точки в реконструируемом пространстве, и оцениваются проекции каждой точки на эти измерения. Процедура метрического шкалирования, предложенная У.Торгерсоном, обеспечивала конкретные аналитические действия для реализации всех этих трех шагов.
7. В чем заключатся основные идеи модели индивидуальных различий?
Одно из фундаментальных ограничений метрических и неметрических методов состоит в том, что они применимы только к одной матрице данных. Если бы мы хотели обработать групповые данные описанными ранее методами, мы могли бы использовать процедуру их усреднения или нам пришлось бы обрабатывать каждую индивидуальную матрицу в отдельности, а затем пытаться сравнить их. Не всегда такой вариант решения проблемы имеет действительный смысл.
Например, если мы попросим группу избирателей оценивать сходство кандидатов, участвующих в выборах, ясно, что структура получаемых данных может оказаться в значительной степени различной. Так же в значительной степени различной может оказаться структура представлений новичков и экспертов в какой-либо области в случае, если мы попросим их оценивать сходство или различие набора понятий, отражающих основное содержание знаний, представленных в данной области.
Для решения этой проблемы была предложена техника многомерного шкалирования, которая позволяет обойти указанное ограничение. Такая процедура получила название многомерного шкалирования индивидуальных различий. Было предложено несколько вариантов этой процедуры.
Первый вариант соединяет процедуру многомерного шкалирования и факторного анализа. Данные одних испытуемых коррелируются с результатами других испытуемых, и получаемая таким образом корреляционная матрица подвергается факторному анализу.
Второй вариант процедуры основан на выделении двух типов индивидуальных различий: в когнитивном стиле и в стилях ответа. Эта процедура определяет индивидуальные различия как нечто среднее между этими двумя крайностями и полностью исключает какое-либо усреднение данных. Таким образом, эта неметрическая процедура позволяет обрабатывать большое число индивидуальных матриц одновременно. Она дает возможность исследователю осуществлять монотонную трансформацию данных отдельно для каждой матрицы или для всех матриц одновременно по выбору самого исследователя. В результате мы имеем единственную многомерную модель для всего массива данных, подлежащих обработке, таким образом исключая фактор индивидуальных различий или же отдельную модель для каждого испытуемого, если индивидуальные различия настолько велики, что единая модель не может быть построена.
Третий вариант процедуры предполагает существование эвклидова пространства свойств, или атрибутов, определяющих индивидуальные различия. Если хотя бы один испытуемый обладает этим атрибутом, соответствующее различие включается в это пространство, образуя одно из его измерений. Таким образом, индивидуальные различия испытуемых оказываются представлены весовыми коэффициентами, определяющими координаты каждого испытуемого в этом пространстве. Если испытуемый не обладает соответствующим свойством, весовой коэффициент для него устанавливается в нулевое значение.
8. Что такое модель субъективных предпочтений? Как должны быть организованы данные для проведения многомерного шкалирования в рамках этой модели?
Многомерное шкалирование по своему происхождению является областью математической психологии и первая его задача -- это анализ субъективного восприятия. Методы многомерного шкалирования можно использовать для построения модели поведения человека при вынесении суждений о сходстве между различными стимулами. Процесс оценки субъектом сходств между стимулами может быть представлен в виде традиционного «черного ящика», на вход которого подается информация о стимулах, а на выходе получают субъективные высказывания о сходствах. Задача состоит в том, чтобы описать этот «черный ящик». Под моделью понимается система правил, руководствуясь которой, можно генерировать те же результаты о сходствах, какие были высказаны субъектом для анализируемого набора стимулов.
В основе модели лежит предположение о том, что при сравнении стимулов человек (явным или неявным образом) сопоставляет их характеристики. Чем сильнее расхождение стимулов по этим характеристикам, тем выше субъективная мера различия между ними. Следовательно, задача сводится к тому, чтобы для исследуемого множества стимулов 1) выявить набор основных факторов, их характеризующих, 2) описать каждый стимул с помощью этих факторов и 3) сконструировать функцию, позволяющую определить меру различия между стимулами на основе известных значений по факторам.
Четвертый заключительный этап включает процедуру построения модели принятия решений о сходствах, использующую параметризацию стимулов с помощью выделенных факторов и их геометрическое представление в пространстве этих факторов. Нужно описать «черный ящик», т. е. в терминах расстояний между стимулами сформулировать правило, следуя которому можно получить те же меры сходств, которые получены от субъекта в ходе эксперимента. Необходимо также оценить степень адекватности модели субъективным данным. Для большей наглядности результата кроме коэффициента корреляции можно использовать также корреляционное поле. Чем большее количество факторов принимается во внимание при построении модели, тем, конечно, она лучше приближает исходные данные. Наша цель, однако, ограничиться минимальным набором факторов, достаточным для построения модели, адекватной анализируемым субъективным сходствам (различиям).
Многомерное шкалирование предоставляет формальный способ построения модели, основывающийся только на результирующих высказываниях субъекта. Такой способ может использоваться, когда человек опирается на свою интуицию и не может описать процесс принятия решения. Заметим, что мы будем строить «апостериорную» модель. Это означает, что мы можем начать работу только после того, как получим от субъекта информацию о сходствах, и попытаемся объяснить, какими мотивами он руководствовался при вынесении своих суждений. Поэтому, строго говоря, наша модель будет верна только для набора стимулов, участвующих в эксперименте. Но если предъявляемая выборка окажется достаточно представительной, то построенная модель будет обладать прогностической силой и по ней можно будет предсказывать, какие решения будет принимать субъект, если в эксперимент будут включены другие стимулы, подобные анализируемым.
Заключение
Методы многомерного шкалирования предназначены для анализа структуры субъективных данных. Они позволяют выявить факторы, лежащие в основе сходств и различий между стимулами, и построить модель принятия решения о сходствах.
Следует заметить, что методы многомерного шкалирования работают только в том случае, когда сходства или различия между всеми стимулами исследуемого множества порождаются одной закономерностью. Когда же при сравнении одной пары стимулов субъект опирается на одну систему факторов, а при сравнении другой пары -- на другую, многомерное шкалирование удовлетворительного результата дать не может. Кроме того, решение будет существенно зависеть от предлагаемого набора стимулов (контекста). Одни и те же стимулы, включенные в разные наборы, могут описываться разными факторами. Это обстоятельство является следствием того факта, что различия между стимулами одного набора могут характеризоваться расхождениями по одним факторам, а различия между стимулами другого набора -- расхождениями по другим факторам. Так, если предъявлять испытуемому стимулы одинаковой формы, но разного цвета, он при сравнении будет обращать внимание только на цвет. Если в то же время варьировать стимулы по форме, то испытуемый будет принимать во внимание также и форму.
Таким образом, с помощью предлагаемой процедуры многомерного шкалирования можно выявить только те факторы, по которым различается стимулы исследуемого набора, но нельзя выявить факторы, по которым все они сходны.
Список литературы
многомерный шкалирование торгерсон
1. Гмурман В.Е. Теория вероятностей и математическая статистика. Учебное пособие для втузов. Изд. 9-е, М., Высшая школа, 2003 г.
2. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. Изд. 3-е - М., ЮНИТИ-ДАНА, 2007 г.
3. Колемаев В.А. и др. Теория вероятностей и математическая статистика. М.: ИНФРА-М, 1997 г.
4. Мхитарян В.С., Трошин Л.И., Адамова Е.В., Шевченко К.К., Бамбаева Н.Я. Теория вероятностей и математическая статистика / Московский международный институт эконометрики, информатики, финансов и права. - М., 2003 г.
5. Терехина А.Ю. Методы многомерного шкалирования и визуализации данных. Автоматика и телемеханика, № 7, 1973, с. 86-94.
6. Терехина А.Ю. О двух задачах индивидуального многомерного шкалирования, Автоматика и телемеханика, № 4, 1974, с. 135-142.
7. Терехина А.Ю. Многомерный анализ субъективных данных о сходствах или различиях. Препринт, ВНИИСИ, M., 1978.
8. Шепард Р.Н. Многомерное шкалирование и безразмерное представление различий // Психологический журнал Том 1 №4 1980.
Размещено на Allbest.ru
Подобные документы
Точечное оценивание основных числовых характеристик, функции и плотности распределения компонент многомерного случайного вектора. Статистическая проверка характера распределения. Особенности корреляционного анализа признаков этой математической категории.
курсовая работа [1,1 M], добавлен 01.10.2013Методика проведения группировки объектов на основе алгоритма K-средних, используя рандомизацию исходных данных (объединенной центрированной матрицы наблюдений). Оценка требуемого числа итераций. Расчет расстояния от объектов до новых центров кластеров.
практическая работа [195,6 K], добавлен 20.09.2011Элементы общей теории многомерных пространств. Понятие векторного многомерного пространства на основе аксиоматики Вейля. Евклидово векторное пространство. Четырёхмерное пространство, его пределение и исследование. Применение многомерной геометрии.
дипломная работа [1,0 M], добавлен 24.02.2010Первые два момента состоятельной оценки спектральной плотности, исследование асимптотического поведения математического ожидания и дисперсии построенной оценки. Сравнительный анализ оценки спектральной плотности в зависимости от окон просмотра данных.
курсовая работа [558,0 K], добавлен 12.04.2012Главная задача спектрального анализа временных рядов. Параметрические и непараметрические методы спектрального анализа. Сущность понятия "временный ряд". График оценки спектральной плотности для окна Дирихле, при центрированном случайном процессе.
курсовая работа [332,8 K], добавлен 17.09.2009Обзор адаптивных методов прогнозирования. Построение модели Брауна. Применение методов прогнозирования на примере СПК колхоза "Новоалексеевский" в рамках модели авторегрессии и проинтегрированного скользящего среднего, предложенной Боксом и Дженкинсом.
дипломная работа [9,0 M], добавлен 28.06.2011Вводные понятия. Классификация моделей. Классификация объектов (систем) по их способности использовать информацию. Этапы создания модели. Понятие о жизненном цикле систем. Модели прогнозирования.
реферат [36,6 K], добавлен 13.12.2003Понятие числовой прямой. Типы числовых промежутков. Определение координатами положения точки на прямой, на плоскости, в пространстве, система координат. Единицы измерения для осей. Определение расстояния между двумя точками плоскости и в пространстве.
реферат [123,9 K], добавлен 19.01.2012Особенности применения координатного метода при изучении стереометрии в 10-11-х классах. Определение расстояния от точки до прямой и до плоскости в пространстве, а также между скрещивающимися прямыми. Нахождение углов между двумя прямыми и плоскостями.
статья [2,1 M], добавлен 04.12.2012Операторы преобразования переменных, классы, способы построения и особенности структурных моделей систем управления. Линейные и нелинейные модели и характеристики систем управления, модели вход-выход, построение их временных и частотных характеристик.
учебное пособие [509,3 K], добавлен 23.12.2009