Методы категориального факторного анализа
Понятие латентной переменной. Уровни измерения переменных в социологии. Методы категориального факторного анализа. Сравнение результатов применения РСА, САТРСА и D-FA. Факторы, определяющие положения человека в обществе. Интерпретация факторной модели.
Рубрика | Социология и обществознание |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 02.04.2016 |
Размер файла | 123,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Говоря об б Кронбаха, нужно сказать несколько слов об интерпретации данного коэффициента.
Коэффициент может принимать значения в интервале (- ?; 1]. Если б ? 0,7 можно говорить о достаточном качестве построенной модели. Если б ? 0,9 - модель отличная. Если коэффициент принимает значение 1, можно говорить о 100% надежности теста Schmitt N., Uses and Abuses of Coefficient Alpha. Фактически, коэффициент сравнивает дисперсию одномерных переменных (наблюденных) и многомерных переменных (компонент). Если дисперсия многомерной величины стремится к нулю, б стремится к 1. Если же дисперсия многомерной величины стремится к сумме дисперсий одномерных величин, б принимает отрицательные значения.
САТРСА и РСА имеют схожие алгоритмы определения «оптимального» числа компонент. В обоих методах заложена возможность определить число факторов «вручную». Однако, в классическом ФА существует метод определения числа факторов, именуемый критерием Кайзера. При использовании данного критерия рассматриваются только те факторы, собственные значения которых превышают 1. Если фактор не объясняет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, он опускается Ким Дж.О., Мьюллер Ч.У., «Факторный, дискриминантный и кластерный анализ», с. 215, «Финансы и статистика», Москва, 1989.
В САТРСА число компонент определяется схожим образом. Когда в модели появляются факторы с собственными значениями меньше единицы, б Кронбаха становится отрицательной. Следовательно, оптимальным является то число компонент, при котором б Кронбаха принимает положительные значения.
В процедуре САТРСА в отличие от классического РСА не предусмотрены методы вращения матрицы нагрузок. Данное обстоятельство несколько усложняет интерпретацию факторов, извлеченных с применением САТРСА по сравнению с традиционным РСА.
Кроме того, существует еще одно значительное отличие данных методов.
В результате применения классического РСА мы получаем некоторое количество компонент, которые описывают (или должны описывать) большую часть исследуемой дисперсии. Автоматически, алгоритм использует критерий Кайзера для определения оптимального числа факторов. Однако, мы можем отойти от данного критерия и ввести необходимое для конкретного анализа число компонент. В таком случае, к имеющемуся «Кайзеровскому» решению, мы получим дополнительные компоненты, описывающие максимум оставшейся дисперсии. При этом, само «Кайзеровское» решение не изменится. Для пояснения данного утверждения приведем простой пример.
Предположим, применение РСА к конкретным данным привело к выделению 3 компонент (по критерию Кайзера), которые описывают 70% общей дисперсии. При том, 1 фактор будет описывать 50%, 2 фактор - 15% и 3 - 5%. Однако, по каким то причинам (недостаточный процент объясненной дисперсии, затруднительная интерпретация полученных факторов и т.д.), нас не устраивает трехфакторное решение. В таком случае, мы проводим анализ заново, указывая необходимое число факторов, например, 4, и получаем новое решение. Предположим, новая модель будет описывать 70,9% общей дисперсии. В этом случае, 1 фактор по-прежнему будет описывать 50% дисперсии, 2 - 15%, 3 - 5%, а новый, 4 фактор - 0,9%. Иными словами, структура решения не изменилась. Имеющееся трехфакторное («Кайзеровское») решение сохраняется, процент, описываемый тремя факторами дисперсии, не меняется. это объясняется тем, что РСА строит компоненты по принципу «вложенности» («nestedness») Meulman J.J., Principal Components Analysis With Nonlinear Optimal Scaling Transformations for Ordinal and Nominal Data. Таким образом, двухфакторное решение будет аналогично первым двум факторам в трехфакторной модели. Это объясняется тем, что при выделении первой компоненты максимизируются собственное значение корреляционной матрицы, выделяется фактор, объясняющий наибольший процент дисперсии. Вторая компонента строится по тому же принципу, анализируя оставшуюся дисперсию и т.д.
Принцип работы САТРСА отличается от описанного выше. Поскольку САТРСА строится на основе алгоритмов оптимального шкалирования, компоненты выбираются не по принципу «максимального собственного значения». Выбирается «оптимальное» число собственных значений для «оптимальной» размерности модели. Первая компонента не обязательно имеет максимальное собственное значение. При изменении запрашиваемого числа компонент, происходит ре-оптимизация, структура решения может измениться. Иными словами, принцип «вложенности» в алгоритме САТРСА соблюдается не всегда. Это несколько затрудняет интерпретацию полученной модели. Существует вероятность того, что компоненты трехмерного решения будут сильно отличаться от компонент четырехмерного решения. Следовательно, каждое решение нужно будет интерпретировать «с нуля». С другой стороны, в этом состоит и преимущество метода - он более «мягкий», по сравнению с классическим РСА, в зависимости от требуемой размерности высчитываются «оптимальные» факторы Там же.
Конечно, между РСА и САТРСА существует еще великое множество отличий, у каждого алгоритма существуют уникальные функции, возможности, адаптированные критерии. Однако, в рамках текущего исследования ограничимся предложенным описанием.
Перейдем к рассмотрению следующего метода, изучаемого в данном исследовании - латентно-структурного анализа (ЛСА).
2.3 Латентно-структурный анализ
Основоположником латентно-структурного анализа считается социолог П. Лазарсфельд. Как и многие исследователи, Лазарсфельд интересовался изучением установок. Ценность установок для него определялась мерой порядка, привносимых ими в данные Lazarsfeld P.F. A Conceptual Introduction to Latent Structure Analysis / Mathematical Thinking in the Social Sciences / ed. by P.F. Lazarsfeld., p. 349-387 Glencoe, Illinois: The Free Press, 1954.. Лазарсфельд выделяет понятие латентных классов, которые являются подсвовокупностями респондентов с одинаковыми значениями латентной переменной. Латентные классы неизвестны, поскольку не известны значения латентной переменной. Для того, чтобы определить эти значения необходимо выяснить, как они связаны с наблюдаемыми величинами. «Это может стать понятными только после исследования того, как осуществляется трансформация явного пространства в латентное» Lazarsfeld P.F. Concept Formation and Measurement in Behavioral Sciences: Some Historical Observations // Concepts, Theory and Explanation in the Behavioral Sciences / p. 144-205 Ed. By G.J. DiRenzo. N.Y.: Random House, 1966.. Поиск оснований для вывода латентных переменных с целью построения латентного пространства (классификаций) является основной идеей латентно-структурного анализа.
Лазарсфельд считал, что статистический анализ дискретных категориальных переменных игнорируется исследователями, занимающимися статистическим анализом Henry N., «Latent Structure Analysis at Fifty». ЛСА не накладывает ограничения на уровень измерения наблюдаемых признаков - изначально предназначен для работы с «качественными» переменными.
Основное расчетное уравнение ЛСА имеет вид:
,
где pi - число респондентов, позитивно ответивших на i-й пункт теста или вопросника; х - исследуемая латентная черта; fi(x) - функция, описывающая график (характеристическую кривую) i-того пункта, т.е. вероятность позитивного ответа респондента на i-й пункт; ц(x) - функция, описывающая распределение респондентов на латентном континууме. Для совокупности пунктов составляется система расчетных уравнений.
ЛСА основывается на нескольких предположениях:
1) Предполагается существование латентного континуума;
2) Вводится некоторое число дихотомических эмпирических вопросов. Каждый вопрос i имеет вероятность pxi получения «положительного» ответа на него в любой точке континуума;
3) принцип локальной независимости предполагает, что в фиксированной точке х локального континуума вероятности совместного наступления событий равны произведениям вероятностей отдельных событий Лазарсфельд П., «Математические методы в социальных науках», с. 42-54, Москва 1973, .
Аксиома локальной независимости была описана выше. Для ЛСА она имеет ключевое значение. Локальная независимость указывает на принадлежность респондентом к одному латентному классу. Кроме того, позволяет оценить «качество» вопросника. В идеале, взаимосвязи между наблюдаемыми переменными должны полностью объясняться латентным пространством, к которому они принадлежат. Если при фиксации латентных факторов статистические взаимосвязи между переменными остаются, полученная модель не является корректной. Стоит либо постараться подобрать другую модель, либо, если это не возможно или модель основывается на мощных теоретических предпосылках, переработать вопросник.
Решение основного уравнения ЛСА основывается на двух предположениях - аксиоме локальной независимости и предположении о связи латентного фактора с наблюдаемыми данными. Лазарсфельд предлагает следующую процедуру определения латентного пространства: 1) получение наблюдаемых данных - реакции респондентов по определенным пунктам. 2) Делаем предположение о том, какая модель адекватна имеющимся данным. 3) Определяем латентные параметры модели. 4) Формируем «реакции», которые возникли в случае полной адекватности модели. 5) Сравниваем реальные и гипотетические реакции - делаем вывод о качестве модели. 6) если модель оправдана - задача решена. Если нет, то 7) пытаемся выбрать иную модель или перерабатываем теорию, «индикаторы», выбранные для эмпирической работы Там же, с. 46.
К настоящему времени подход Лазарсфельда расширился и углубился. В его рамках существуют несколько десятков алгоритмов, позволяющих разными способами решать широкий круг задач, в том числе и основную - поиск латентных переменных на основе анализа категориальных данных. Одним из таких подходов является D-факторный анализ, представленный в статистическом пакете Latent Gold. Дискретный факторный анализ (discrete factor analysis, D-FA) является объектом изучения настоящего исследования. Дальнейшее описание модели ЛСА будет происходить с использованием конкретно D-FA.
Стоит отметить, что, в отличие от САТРСА ЛСА и конкретно D-FA кардинально отличаются от классического ФА. Лазарсфельд в своем описании ЛСА неоднократно использует термин «дискретный». Дискретная величина - величина, заданная или полученная в виде непрерывных значений; противоположность непрерывной величины. В контексте ЛСА, дискретные переменные - переменные, измеренные на категориальном, и номинальном уровнях. Непрерывные величины - интервальные и абсолютные данные.
Помимо того, что ЛСА работает с дискретными наблюдаемыми данными, в методе постулируется существование n дискретных факторов с заданным числом k категорий Magidson J., Vermunt J,, «A Nontechnical Introduction to Latent Class Models». Иными словами, фактор, латентная переменная не обязательно будет метрической (каковой является в САТРСА и РСА), она может быть категориальной.
Для понимания метода D-FA необходимо прояснить вопрос о том, как именно образуются факторы и что такое категории дискретного фактора.
D-FA образует факторы в соответствии с распределением значений переменных. Предположим, имеются 2 порядковые переменные с 5 градациями. Распределение ответов респондентов на вопросы имеет вид, близкий к нормальному (см. Рисунок 1).
Размещено на http://www.allbest.ru/
Рисунок 1. кривые Х, Y- гипотетическое распределение ответов респондентов на вопросы Х,Y,соответственно. «1», «3», «5» - выборочные градации переменной Х, Y. К1 - К3 - категории гипотетического фактора Z
Алгоритм D-FA, скорее всего, объединит данные переменные в один фактор (Z), поскольку распределение ответов респондентов на эти вопросы очень похожи. Тем не менее, ответы не однородны, поэтому выделится несколько категорий - наиболее однородных участков распределения (отмечены пунктиром).
Проведение D-FA не требует следующих теоретических предположений:
1) линейная зависимость наблюдаемых переменных
2) нормальное распределение
3) гомогенность данных
Отсутствие требований к выполнению данных пунктов, во-первых, значительно расширяет диапазон данных, подходящих для применения к ним D-FA и, во-вторых, делает данный анализ менее «субъективным».
D-FA имеет ряд преимуществ по сравнению с традиционным ФА. Часто для того, чтобы интерпретировать факторы, полученные посредством ФА, необходимо применить к ним процедуру вращения (о вращении см., например, Харман). D-FA не требует вращения. Кроме того, D-FA может одновременно анализировать переменные, измеренные на разных уровнях Там же.
Факторы, получаемые посредством D-FA могут быть связаны или несвязанны между собой (ортогональны/неортогональны).
Для проведения D-FA требуется значительно меньше наблюдаемых переменных, чем для проведения классического ФА. Так, необходимо минимум 3 наблюдаемых метрических переменных для проведения ФА. На основе трех переменных выделится 1 фактор Шуметов В. Г. Шуметова Л. В. «Факторный анализ: подход с применением ЭВМ», ОрулГТУ, орел, 1999г, . D-FA, на основе двух метрических переменных, может образовать два и более фактора. Кроме того, данный алгоритм позволяет рассматривать модели с коррелирующими остатками. Следовательно, дополнительные факторы, объясняющие корреляцию остатков, могут быть выделены.
Внутри алгоритма D-FA существует несколько опций, о которых стоит упомянуть:
1. Предусмотрена возможность устанавливать равенство-неравенство эффектов внутри одного фактора. Проще говоря, можно указать, имеет каждая переменная одинаковое влияние на фактор или нет.
2. Возможность включения/исключения непрямых эффектов. Например, можно выставить опцию, чтобы алгоритм рассматривал влияние переменной z1 на фактор X1 опосредованно через переменную z2.
3. Возможность включения/исключения зависимости между факторами. Иными словами, как и в классическом ФА, в D-FA можно определить, коррелируют или не коррелируют факторы между собой. Ключевое отличие состоит в том, что D-FA допускает возможность корреляции одних факторов и независимости (ортогональности) других внутри одной модели Vermunt J.K. and Magidson J. Technical Guide for Latent GOLD 4.0.
Однако, у данного метода есть и несколько недостатков. D-FA не предлагает «оптимальное» число факторов с k градациями. Для того чтобы получить наилучшую модель, к одним и тем же данным необходимо применить процедуру D-FA, изменяя количество факторов и категорий, а затем сравнить полученные модели. В методе предусмотрен алгоритм сравнения разных моделей. Он заключается в следующем: рандомно генерируется n выборок (число выборок по умолчанию - 500), на которых проверяется устойчивость модели. Затем сравнивается «устойчивость» разных моделей - делается выбор в пользу наиболее устойчивой.
2.4 Теоретическое сравнение методов САТРСА, D-FA и РСА
Итак, подведем некоторые сравнительные итоги методов, описанных выше.
Таблица 3
Сравнение методов факторизации
САТРСА |
D-FA |
РСА |
||
уровень измерения анализируемых переменных |
любой |
любой |
метрический |
|
предварительные процедуры |
оцифровка |
Х |
Х |
|
построение модели с использованием переменных, измеренных на разных уровнях |
есть |
есть |
Х |
|
минимальное число переменных, необходимое для построения модели |
3 |
1 |
3 |
|
линейность модели |
не предполагается |
не предполагается |
предполагается |
|
нормальность распределения |
не предполагается, но приводится к нормальному виду |
не предполагается |
предполагается |
|
гомогенность данных |
не предполагается |
не предполагается |
предполагается |
|
база для выявления факторов |
матрица корреляций оцифрованных данных |
система уравнений |
матрица корреляций исходных данных |
|
отбор "оптимального" числа факторов |
критерий Кайзера |
Х |
критерий Кайзера |
|
включенность факторного решения |
Х |
Х |
да |
|
возможность рассмотрения зависимости между факторами |
Х |
есть |
есть |
|
выделение категорий внутри фактора |
Х |
есть |
Х |
|
вращение факторов (компонент) |
Х |
Х |
есть |
|
уровень измерения факторов |
метрический |
дискретный - для порядковых и номинальных шкал, метрический - для числовых |
метрический |
|
сравнение моделей |
дисперсия, б Кронбаха |
критерии на основе LL, Хи^2 |
дисперсия |
|
алгоритм сравнения разнофакторных решений |
Х |
Бутстрэппинг |
Х |
|
графическое представление |
развито |
не развито |
не развито |
|
трудность интерпретации |
если больше 2 размерностей, то да |
да |
нет |
Перейдем к следующей части работы - применению различных методов факторизации к конкретной базе данных, сравнению полученных результатов.
Глава 3. Сравнение результатов применения РСА, САТРСА и D-FA
Для того чтобы сравнить результаты методов факторизации, описанных ранее, применим различные алгоритмы к одной и той же базе. Как уже было сказано выше, в качестве базы данных для настоящего исследования мы выбрали базу, размещенную на сайте института GESIS. Исследование, в ходе которого была получена данная конкретная база, было посвящено социальному неравенству. Блок вопросов был посвящен установкам респондентов относительно того, какие факторы, по их мнению, определяют статус, что позволяет достичь высокого положения в обществе. Мы уже обосновали содержательную сторону выбора базы. Стоит сказать несколько слов о методологической стороне. Очевидно, что нахождение латентной переменной требует определенного числа индикаторов - «проявлений» данной переменной. Блок интересующих нас вопросов включает 11 переменных. Респондентам предлагалось определить степень своего согласия с каждой из них по шкале от 1 до 5, где 1 - «полностью согласен», 5 - «полностью не согласен». Для удобства интерпретации, анализируемые переменные были перекодированы таким образом, что 1 стала отвечать категории «полностью не согласен», а 5 - «полностью согласен». Данное преобразование было проведено с помощью функции «автоматическая перекодировка», представленной в статистическом пакете SPSS (далее SPSS).
Поскольку в исследовании приняли участие более 55 тысяч человек, было решено разделить имеющуюся базу данных на несколько частей. На основе базы данных было сгенерировано 3 случайных подвыборки, каждая из которых составляла 10% от всего массива данных. Принятие такого решения мотивированно двумя положениями. Во-первых, выборка в 55 тыс. человек затруднит процедуру анализа данных (что особенно важно в случае применение D-FA). Во-вторых, разделение выборки на несколько случайных подвыборок позволит нам проверить устойчивость полученных моделей.
К данным были поочередно применены три метода факторизации - РСА, САТРСА и D-FA. Данная часть, следовательно, будет построена следующим образом: 1) описание результатов, полученных в результате применения метода РСА, САТРСА, D-FA; 2) сравнение результатов факторизации, полученных с применением указанных методов.
3.1 Результаты применения РСА
Рассмотрим результаты применения РСА к нашей выборке.
Итак, в первой подвыборке, составляющей примерно 10% от базы данных (5541 респондент) был применен метод РСА.
Несколько слов о заданных параметрах. Отбор оптимального числа факторов осуществлялся с помощью критерия Кайзера. Кроме того, был запрошен график собственных значений, чтобы сравнить его с критерием Кайзера. Метод вращения - ВАКРИМАКС. Наблюдения с пропущенными данными исключались их анализа целиком. Факторные нагрузки со значением меньше 0,3 не выводились** об опасности исключения коэффициентов со значением меньше 0,3 можно прочитать в [Крыштановский]. Тем не менее, в настоящем исследовании последуем примеру Терстоуна и исключим из анализа такие коэффициенты. .
Посмотрим на полученные результаты.
Прежде всего, обратимся к таблице, показывающей процент объясняемой моделью дисперсии.
Согласно критерию Кайзера, выделилось 4 компоненты, которые объясняют чуть больше 67% дисперсии (см. Приложение 1, таблица 1). По данным показателям можно сделать вывод, что модель не является «качественной» - достаточно низкий процент дисперсии объясняется ею. Согласно графику собственных значений факторов, оптимальным решением так же является четырехфакторная модель.
Обратим внимание на таблицу «общности», которая показывает, какая часть дисперсии каждой отдельной переменной объясняется моделью (см. Приложение 1, таблица 2). Хуже всего объясняется переменная «Qf1» - «насколько важно состоять в знакомстве с «нужными» людьми?». Она объясняется моделью только на 56%. Попытка исключить данную переменную из анализа не привела к значимому улучшению модели, процент общей объясняемой моделью дисперсии увеличился на 2. Поэтому, не будем исключать переменную из анализа.
Итак, путем применения к данным ФА мы выявили 4 латентные переменные, которые объясняют 67% общей дисперсии.
Попробуем проинтерпретировать полученные факторы. Для этого обратимся к таблице «Матрица повернутых компонент» (см. Приложение 1, таблица 3).
Первый фактор характеризуется такими мнениями респондентов относительно причин, определяющих положение человека в обществе, как важность расы, религиозных убеждений и пола человека. Назовем данный фактор «Соц-дем признак».
Второй фактор характеризуется такими переменными, как наличие политических связей, дача взяток, знакомство с нужными людьми, и, в меньшей степени происхождением из богатой семьи. Назовем этот фактор «связи».
Третий фактор характеризуется такими переменными, как происхождение из богатой семьи, высокий уровень образования человека и его родителей. Назовем данный фактор «социально-экономический капитал».
Последний фактор в большей степени характеризуется такими переменными, как усердие в работе и наличие амбиций. Назовем его «целеустремленность».
Итак, посредством РСА было выделено 4 фактора - «соц-дем» фактор, фактор связей», фактор наличия «социально-экономического капитала» и фактор целеустремленности человека.
Проверим устойчивость полученной модели. Для этого, применим РСА к двум «контрольным» выборкам (Выборка №2, Выборка №3) не меняя характеристик, используемых при анализе изучаемой выборки (Выборка №1). Результаты применения РСА к контрольным выборкам практически не отличаются от применения РСА к изучаемой выборке (см. Приложение 1, таблица 4). Объясняемая моделью дисперсия варьируется от 67 до 68%, факторы устойчивы.
Итак, посредством применения РСА было получено 4 фактора, определяющих мнения респондентов относительно того, какие «параметры» влияют на положение человека в обществе.
Первый фактор. Данный фактор является ключевым для людей, которые считают, что положение человека в обществе, прежде всего, зависит от пола, расы и религиозных убеждений.
Второй фактор. Данным фактором руководствуются люди, считающие, что положение в обществе зависит от наличия у человека «связей». Человек, имеющий политические контакты, общающийся с «правильными» людьми, не чурающийся взяток скорее добьется высокого положения в обществе.
Третий фактор. Данный фактор определяет людей, которые полагают, что положение в обществе зависит, в первую очередь, от родителей респондента. Если человек родился в богатой семье, его родители - образованные люди, то он получит хорошее образование и займет высокое положение в обществе.
Четвертый фактор. Данный фактор определяет людей, считающих, что успеха в жизни можно добиться только упорством. Не важно, какой ты расы, на сколько богаты твои родители и т.д. - главное усердно трудится, иметь высокие амбиции, и тогда ты займешь высокое положение в обществе.
Такая факторная модель является вполне адекватной с точки зрения интерпретации. Однако, как уже было отмечено, она описывает чуть более 67% дисперсии.
Перейдем к описанию следующего примененного метода - САТРСА.
3.2 Результаты применения САТРСА
Для начала попытаемся определить число «достаточное» число факторов, выделенных данным методом. Для этого обратимся к таблице, показывающей результаты вычислений б Кронбаха (см. Приложение 2, таблица 1). Как было отмечено выше, данный коэффициент вычисляется только для компонент, чьи собственные значения превышают единицу. Изначально было запрошено 7 размерностей решения для того, чтобы посмотреть, сколько выделяется компонент с собственными значениями больше 1.
Согласно таблице «сводка для модели», посредством метода САТРСА выделяется 4 компоненты с собственными значениями больше 1. Поэтому, проведем повторный анализ для рассмотрения четырехмерного решения.
Для начала несколько слов об установленных опциях. Задан порядковый уровень оптимального шкалирования. Пропущенные значения анализируются следующим образом: при оцифровке, они исключаются из анализа; затем (после оцифровки), занимаются модальными значениями.
Итак, посмотрим на таблицу, показывающую долю объясняемой моделью дисперсии (см. Приложение 2, Таблица 2).
Отметим, что при заданных параметрах, алгоритм САТРСА не показывает процент объясненной дисперсии. Его можно посчитать вручную, разделив собственное значение каждой отдельно взятой компоненты на максимально возможное собственное значение (в данном случае, 11). В результате, мы получим следующие значения.
Таблица 1
Процент объясненной дисперсии
Размерность |
Объясненная дисперсия |
|
1 |
30,09% |
|
2 |
18,06% |
|
3 |
11,75% |
|
4 |
10% |
|
Всего |
69,91% |
Полученная модель объясняет почти 70% дисперсии.
Обратим внимание на коэффициент б Кронбаха (см. Приложение 2, Таблица 2). Значение коэффициента для первой компоненты равно 0,76. Следовательно, первая компонента достаточно хорошо описывает дисперсию. Для всех остальных компонент значение б гораздо ниже. Тем не менее, общее значение б для модели - 0,95. Можно говорить о том, что модель достаточно хорошо описывает реальную ситуацию.
Прежде чем переходить к интерпретации полученных результатов, посмотрим на преобразованные (оцифрованные) переменные (см. Приложение 2, Таблица 3)** для каждой переменной программа выводит отдельную таблицу. Приведена одна таблица для ознакомления. .
Согласно таблице, после преобразования, первая переменная не поменяла «свое направление» - категории «совершенно не важно» по-прежнему соответствует минимальное значение. Такой порядок сохранился для всех переменных.
Интерпретация компонент, выделенных САТРСА, представляется затруднительной. Это объясняется тем, что алгоритм не предусматривает процедур вращения (см. Приложение 2, таблица 4).
В алгоритме САТРСА предусмотрена функция сохранения значений переменных, полученных посредством оцифровки. Используем данную опцию для того, чтобы к новым (оцифрованным) переменных применить классический РСА с применением вращения. Поскольку основное отличие САТРСА и РСА состоит именно оцифровке переменных, мы сможем проинтерпретировать данные, не искажая результатов, полученных с применением САТРСА.
Проверим, действительно ли результаты применения РСА и САТРСА к оцифрованным данным не отличаются (см. Приложение 2, Таблица 5, Таблица 6).
Применение РСА к оцифрованным переменным, полученным в результате применения САТРСА, дает несколько иные результаты. Снижается процент объясняемой моделью дисперсии, несколько отличаются факторные нагрузки.
Данный факт объясняется тем, что алгоритмы по-разному работают с пропущенными данными. Как было отмечено выше, САТРСА оцифровывает данные, игнорируя пропущенные значения. После оцифровки, пропущенные значения заменяются модальными значениями. РСА, работая с оцифрованными переменными, по умолчанию, игнорирует наблюдения, в которых есть пропуски. Для того чтобы получить идентичные результаты, заново проведем САТРСА, выставив опцию «исключение пропущенных значений».
В приложении представлены сравнения полученных моделей (см. Приложение 2, Таблица 7, Таблица 8). Модели идентичны, за исключением знака 4 компоненты. Однако, это не повлияет на интерпретацию полученного решения.
Из Таблицы 7 видно, что дисперсия, объясняемая моделью, несколько сократилась. Однако, теперь мы можем проинтерпретировать полученное решение, применив метод вращения (ВАРИМАКС).
Перейдем к интерпретации модели (см. Приложение 2, Таблица 9). Мы получили 4 компоненты, которые абсолютно идентичны факторам, полученным в результате применения к исходным данным РСА.
Для проверки устойчивости решения, полученная модель была построена на контрольных подвыборках. Решение устойчиво (см. Приложение 2, Таблица 10, Таблица 11).
САТРСА специально предназначен для работы с неметрическими переменными. Следовательно, если мы произведем допустимое преобразование переменных, результат (модель) не должен измениться. В тоже время модель, получаемая посредством РСА, изменится.
Проверим, насколько это действительно так.
Перекодируем имеющиеся переменные следующим образом.
1 1
2 5
3 18
4 25
5 100
С точки зрения порядковых шкал, такое преобразование является вполне приемлемым, поскольку учитывается только порядок переменных.
Результаты построения имеющейся модели на перекодированных данных соответствуют ожиданиями (см. Приложение 2, Таблица 12)** поскольку результаты в точности повторяют полученною модель, приведена только таблица объясняемой моделью дисперсии. . Результаты применение модели САТРСА к перекодированным данным полностью совпадают с результатами применения САТРСА на начальных данных. Результаты ФА отличаются от полученных ранее (см. Приложение 2, Таблица 13). Распределения факторных нагрузок несколько изменилось. Такие изменения будут случаться при любом преобразовании исходных данных, поскольку РСА чувствителен к расстоянию между категориями переменных.
Перейдем к рассмотрению результатов применения к данным третьего метода - D-FA.
3.3 Результаты применения D-FA
Как было отмечено ранее, в алгоритме D-FA отсутствует метод определения «оптимального» числа факторов. Поэтому, было проверено большое количество факторных решений, с целью выбора наилучшего. Часть сводки по построенным моделям приведена в приложении (см. Приложение 3, Таблица 1).
Было выделено три модели, наиболее хорошо описывающие данные:
1. Двухфакторное решение. 3 уровня в первом факторе. 2 уровня во втором факторе.
2. Трехфакторное решение. В каждом факторе по две категории
3. Четырехфакторное решение. В каждом факторе по три категории.
Решения были сравнены между собой с использованием функции «Bootstrap».
Если основываться на значениях таких критериев, как BIC, AIC, AIC3, CAIC** чем меньше значения данных критериев, тем выше качество модели (Vermunt&Magidson) (см. Приложение 3, таблица 2), мы увидим, что двухфакторная модель является наилучшей. Однако, поскольку изначально полученные решения являются в большей степени теоретическими (т.е., слабо соответствуют реальной ситуации), данные коэффициенты не могут служить ориентиром.
Обратимся к результатам бутстрэппинга (см. Приложение 3, Таблица 3). Согласно полученным данным, трехфакторная модель предпочтительней двухфакторной. Сравнение моделей с 4 и 3 факторами показало, что четырехфакторная модель лучше. Поэтому, остановимся на ней.
Итак, перейдем к подробному рассмотрению выбранной модели - четырехфакторному решению с тремя категориями в каждом факторе.
Посмотрим на ошибки классификации в нашей модели (см. Приложение3, Таблица 4). Из таблицы видно, что хуже всего классифицируется 4 дискретный фактор. Фактически, классификация в данном факторе напоминает «гадание» - вероятность попадания респондента в данный латентный класс равна 50%.
Попробуем проинтерпретировать полученное факторное решение. Для этого обратимся к таблице факторных нагрузок, выдаваемой программой (см. Приложение 3, Таблица 5).
Итак, первый фактор характеризуется такими переменными, как наличие «пол человека», «раса человека», «религиозные взгляды человека». Назовем данный фактор «соц-дем фактор».
Второй фактор определяется такими переменными, как наличие «рождение в богатой семье» (в меньшей степени) и «высокий уровень образования родителей». Назовем данный фактор «семья».
Третий фактор характеризуется такими переменными, как «образование респондента», «большие амбиции», «упорный труд», «знакомство с нужными людьми», «политические связи». Интерпретация данного фактора, на мой взгляд, представляется затруднительной, поскольку переменные, индицирующие упорство человека, его личные старания для того, чтобы занять высокое положение в обществе связываются с переменными, означающие наличие социальных связей, использование своих знакомств с «правильными» людьми.
Четвертый (нерепрезентативный) фактор характеризуется такой переменной, как «дача взяток». Как мне кажется, «выпадение» данной переменной из факторной модели вполне разумно, поскольку она находится в иной «плоскости», нежели все остальные переменные.
Перейдем к следующему этапу интерпретации - объяснению категорий полученных факторов (см. Приложение 3, Таблица 6).
1фактор:
1 категория описывает людей, для которых показатели «пол», «раса», «религия» не являются важными критериями, определяющими положение человека в обществе.
2 категория - люди, которые считают, что эти показатели определяют положение людей в обществе, но не являются ключевыми.
3 категория - люди, которые считают, что эти показатели являются основными факторами, определяющими положение человека в обществе.
2 фактор:
1 категория - люди, которые считают, что семья, уровень состояния и образования родителей определяют положение человека в обществе в большей степени.
2 категория - люди, которые считают данные показатели важными, но не доминирующими.
3 категория - люди, считающие, что данные показатели не оказывают существенного влияния на положение человека в обществе.
3 фактор:
1 категория описывает людей, для которых очень важны такие показатели, как «упорная работа», «высокие амбиции», «знакомство с нужными людьми» и «политические связи», и совершенно не важен показатель «образование человека».
2 категория описывает людей, для которых самой важной из перечисленных характеристик является «образование человека», в то время как остальные показатели не влияют на положение человека в обществе.
3 категория описывает людей, которые считают, что все перечисленные показатели влияют на положение человека в обществе, однако не являются доминирующими.
Итак, посредством D-FA, было выделено 4 фактора, определяющих, какие аспекты, с точки зрения респондентов, детерминируют положение человека в обществе. Первый фактор - «соц-дем фактор». Второй - «семья». Третий - «индивидуальные способности и социальные связи». Четвертый - «взяточничество». Четвертый фактор не является репрезентативным.
3.4 Сравнительный анализ результатов факторизации
Подведем сравнительные итоги результатов факторизации переменных, полученных с помощью разных методов.
Таблица 4
Сравнение результатов методов факторизации
САТРСА |
D-FA |
РСА |
||
качество модели |
среднее |
очень низкое |
среднее |
|
соответствие модели реальности |
Х |
низкое |
Х |
|
использованные переменные |
все |
"выпадение" одной переменной |
все |
|
уровень измерения используемых переменных |
интервальный (после оцифровки) |
порядковый |
порядковый |
|
процент объясняемой моделью дисперсии |
68,66% |
Х |
67,26% |
|
корреляция факторов |
отсутствует |
отсутствует |
отсутствует |
|
число выделенных факторов |
4 |
4, 1 - нерепрезентативный |
4 |
|
число категорий внутри каждого фактора |
Х |
3,3,3,3 |
Х |
Результаты применения САТРСА и D-FA к одной и той же базе данных сильно разнятся. Качество модели, полученной с использованием САТРСА, значительно превосходит качество модели D-FA.
Оба метода показывают, что наилучшей является модель с четырьмя факторами. Тем не менее, факторы отличаются с содержательной точки зрения. На основе САТРСА было выделено 4 фактора - «соц-дем» фактор, фактор «связей», фактор наличия «социально-экономического капитала» и фактор «целеустремленности» человека. Процедура D-FA анализа, фактически, объединила факторы «связей» и целеустремленности в один конструкт. Как мне кажется, такое объединение является бессмысленным. Фактор «связи» характеризует людей, которые полагают, что положение в обществе не зависит от того, целеустремлен человек или нет. Положение человека определяют его социальные связи, общение с нужными людьми. Фактор «целеустремленности» обладает совершенно противоположной характеристикой. Поэтому, объединение этих факторов в один псевдофактор не несет никакого содержательного смысла.
Кроме того, в ходе выполнения D-FA из анализа выпала переменная «взяточничество». Алгоритм выделил данную переменную в отдельный фактор. Однако, данный фактор не является репрезентативным, поскольку ошибка его предсказания составляет 50%.
В рамках поиска латентного пространства методом D-FA, нами было проанализировано более ста разных моделей. Рассматривались модели с разным числом факторов, с разным числом категорий внутри этих факторов, коррелирующие факторы и т.д. Однако, ни одна их рассмотренных моделей не дала результаты, «отражающие» реальность. Фактически, D-FA не индицирует латентное пространство там, где его выделяет САТРСА.
Число проанализированных моделей в рамках D-FA подводит нас еще к одному важному методологическому выводу. Поскольку в алгоритме отсутствует критерий, позволяющий определить оптимальное число факторов, данный метод не стоит использовать в качестве исходного. Иными словами, для упрощения задачи поиска латентного пространства, нужно провести другой метод факторизации (например, САТРСА), чтобы определить возможное число факторов и сократить процедуру подбора наилучшего решения методов D-FA.
D-FA следует использовать скорее для более глубокого изучения латентного пространства, выявленного другими методами факторизации.
Одна из целей настоящего исследования заключалась в выявлении латентных переменных, определяющих мнения людей относительно того, какие аспекты определяют положение человека в обществе.
3.5 Факторы, определяющие положения человека в обществе. Интерпретация факторной модели
Остановимся на факторной модели, полученной с применением САТРСА, т.к. данная модель является наиболее качественной.
Мы получили 4 фактора, латентные переменные, определяющие установки людей. Первый фактор, образно названный «соц-дем фактор», характеризуется такими признаками, как пол человека, его раса и религиозные взгляды. Люди, обладающие данной латентной установкой, полагают, что положение человека в обществе - статус скорее прирожденный (хотя религиозные взгляды не являются чем-то врожденным, чаще всего они воспитываются в человеке с рождения без предоставления альтернативы). Человек не может изменить свое положение в обществе, оно предопределено его «врожденными» характеристиками.
Второй фактор, который мы обозначили как «фактор связей», характеризуется такими показателями, как наличие политических связей, знакомство с нужными людьми, дача взяток. Люди с данной латентной установкой считают, что положение человека в обществе зависит, в первую очередь, от его социальных связей. По их мнению, для того, чтобы получить желаемое, нужно «дернуть за нужную ниточку». Обладание сетью таких «ниточек» и определит положение в обществе.
Третий фактор, обозначенный как «фактор наличия социально-экономического капитала», характеризуется такими показателями, как «богатые родители», «высокий уровень образования родителей», «высокий уровень образования человека». Люди с данной латентной установкой считают, что положение человека в обществе в большей степени зависит от семьи. Высокий уровень образования родителей предполагает хорошее образование их детей, материальное богатство семьи предопределит положение человека в обществе.
Четвертый фактор, обозначенный «фактором целеустремленности», характеризуется такими переменными, как «высокие амбиции» и «упорство в работе». Люди с данной латентной установкой полагают, что если человек ставит перед собой «сложные» цели и делает все от него зависящее чтобы достигнуть их, он добьется высокого положения в обществе. Иными словами, ничто заранее не предопределяет положение в обществе - все достигается упорством.
Полученное факторное решение было проверенно на устойчивость, путем построения выявленной факторной модели на контрольных подвыборках. Как было описано выше, решение оказалось устойчивым, следовательно, можно полагать, что модель действительно соответствует реальности.
Заключение
Проведенное исследование было нацелено на решение двух основных задач. Во-первых, сравнение результатов разных методов категориального ФА и, во-вторых, выявление латентных переменных, определяющих мнения людей относительно причин социального неравенства.
Вторая задача была решена с использованием метода САТРСА. Полученная модель содержит 4 латентные переменные - «соц-дем фактор», «фактор связей», «фактор имеющегося социально-экономического» капитала, «фактор целеустремленности» - которые и определяют мнения людей относительно причин социального неравенства, аспектов, определяющих положение человека в обществе.
Для решения первой задачи было проведено сравнение двух методов категориального ФА - САТРСА и D-FA - как с позиции теории, так и с точки зрения полученных результатов.
Не смотря на то, что алгоритмы САТРСА и D-FA нацелены на решение одной и той же задачи - выделение латентных переменных, между ними имеется множество принципиальных отличий. Алгоритмы базируются на разных предположениях, работают с переменными, измеренными на разных уровнях. В каждом алгоритме присутствуют свои критерии оценки качества моделей, дополнительные функции и особенности. Результаты, получаемые путем применения САТРСА и D-FA к одним и тем же данным, сильно отличаются.
Конечно, методы САТРСА и D-FA имеют и много общего. Например, оба алгоритма могут совмещать в одной модели переменные, измеренные на разных уровнях.
Оба алгоритма категориального ФА были сравнены с методом, наиболее часто используемым для поиска латентных переменных - классическим РСА. Следует отметить, что применение алгоритмов САТРСА и РСА к одним и тем же данным, измеренным на порядковой шкале с 5 рангами, дают практически одинаковые результаты.
Основываясь на настоящем исследовании можно сделать несколько методологических выводов.
Во-первых, разные методы категориальной факторизации предлагают отличные друг от друга факторные модели.
Во-вторых, использование такого сложного и неоднозначного метода факторизации, как D-FA, может быть затруднительным ввиду отсутствия в методе алгоритма вычисления «оптимального» числа факторов.
В-третьих, D-FA может быть использован для более глубокого изучения факторного решения, полученного посредством другого метода факторизации, например САТРСА
В-четвертых, применение классического РСА, предназначенного для анализа метрических переменных, к порядковым шкалам с 5 рангами дает результат, практически идентичный результату применения САТРСА. Однако, применение к данным допустимых шкальных преобразований отражается на модели, предлагаемой РСА. Следовательно, применение данного метода к порядковым шкалам дает неустойчивый и некорректный результат.
Опираясь на данные выводы, можно заключить, что для выявления латентных переменных на основе данных, измеренных на порядковом уровне, предпочтительнее использовать метод САТРСА.
Существует множество методов категориального факторного анализа, не рассмотренных в рамках настоящего исследования. Теоретическое сравнение этих методов, а так же сравнение результатов их применения к одним и тем же данным позволит построить более содержательные методологические рекомендации относительно их применения, нежели представленные в данном исследовании.
Список используемой литературы
1. Анфилатов В.С., Емельянов А.А., Кукушкин А.А. «Системный анализ в управлении», М. Финансы и статистика, 2002.
2. Доугерти К., «Введение в эконометрику», Москва, 1999
3. Ким Дж.О., Мьюллер Ч.У., «Факторный, дискриминантный и кластерный анализ», «Финансы и статистика», Москва, 1989
4. Крыштановский А.О., «Анализ Социологических Данных», ГУ-ВШЭ, Москва 2007
5. Лазарсфельд П., «Математические методы в социальных науках», Москва 1973
6. Миркин Б.Г., «Анализ качественных признаков и структур», Москва 1980
7. Окунь Я., «Факторный анализ», «Статистика», Москва 1974
8. Толстова Ю.Н., «Измерение в социологии», г.7, Москва 2009
9. Трофимов В.А. Экспериментальное обоснование метода качественного факторного анализа // Методы анализа многомерной экономической информации/ отв. ред. Б.Г.Миркин. Новосибирск: Наука, 1981.
10. Харман Г., «Современный факторный анализ», «Статистика», Москва, 1972
11. Шуметов В. Г. Шуметова Л. В. «Факторный анализ: подход с применением ЭВМ», ОрулГТУ, Орел, 1999г,
12. Ядов В.А. «Социологическое исследование: методология, программа, методы»
13. Bollen K., «Latent variables in psychology and the social sciences», (URL: http://www.unt.edu/rss/LatentVariablesBollen.pdf)
14. Fisher, R. A. Statistical methods for research workers (10th ed.). Edinburgh, UK: Oliver & Boyd., 1948
15. GESIS (URL: http://www.gesis.org/en/home/)
16. Guttman, L. A general nonmetric technique for finding the smallest coordinate space for a configuration of points. Psychometrika, 33, 1968
17. Guttman L. The quantification of a class of attributes: A theory and method of scale construction. In P. Horst et al. (Eds.), The prediction of personal adjustment. New York: Social Science Research Council, 1941
18. Henry N., «Latent Structure Analysis at Fifty», (URL: http://www.people.vcu.edu/~nhenry/LSA50.htm)
19. Joreskog KG, Sorbom D. Advancesin Factor Analysis and Structural Equation Models, Cambridge, MA: Abt Books 1979
20. Kruskal, J. B. Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis. Psychometrika, 29, 1964
21. Lazarsfeld P.F. A Conceptual Introduction to Latent Structure Analysis / Mathematical Thinking in the Social Sciences / ed. by P.F. Lazarsfeld. Glencoe, Illinois: The Free Press, 1954.
22. Lazarsfeld P.F. Concept Formation and Measurement in Behavioral Sciences: Some Historical Observations // Concepts, Theory and Explanation in the Behavioral Sciences / Ed. By G.J. DiRenzo. N.Y.: Random House, 1966
23. Likert R., «A Technique for the Measurement of Attitudes», Archives of Psychology 140, 1932
24. Magidson J., Vermunt J.K., «A Nontechnical Introduction to Latent Class Models», (URL: http://www.statisticalinnovations.com/articles/lcmodels2.pdf)
25. Magidson J., Vermunt J.K. Technical Guide for Latent GOLD 4.0
26. Meulman J.J., Optimal scaling methods for multivariate categorical data analysis, (URL: http://www.unt.edu/rss/class/Jon/SPSS_SC/Module9/M9_CatReg/SWPOPT.pdf)
27. Meulman J.J., Principal Components Analysis With Nonlinear Optimal Scaling Transformations for Ordinal and Nominal Data (URL: http://www.sagepub.com/upm-data/5040_Kaplan_Final_Pages_Chapter_3.pdf)
28. Nunnally JC. Psychometric Theory., ch. 3, NewYork: McGraw-Hill 1978
29. Reips Ulf-Dietrich; Funke F., "Interval level measurement with visual analogue scales in Internet-based research: VAS Generator". Behavior Research Methods, 2008
30. SAS/STAT User's Guide, Version 8, (URL: http://ciser.cornell.edu/sasdoc/saspdf/stat/chap6.pdf)
31. Schmitt N., Uses and Abuses of Coefficient Alpha, (URL: http://socrates.berkeley.edu/~maccoun/PP279_Schmitt.pdf)
32. Shepard R. N., The analysis of proximities: Multidimensional scaling with an unknown distance function: I.Psychometrika, 27, 1962
33. Spearman Ch., The Abilities of Man: Their Nature and Measurement. The Blackburn Press
34. SPSS Guide , IBM. (URL: http://publib.boulder.ibm.com/infocenter/spssstat/v20r0m0/index.jsp?topic=/com.ibm.spss.statistics.help/idh_cpca.htm)
35. Thurstone L.L , Attitudes Can Be Measured, URL:http://www.brocku.ca/MeadProject/Thurstone/Thurstone_1928a.html
36. Thurstone L.L. The Measurement of Values. Chicago: Univ. of Chicago Press, 1960.
37. Thurstone L.L. The Vectors of Mind: Multiple Factor Analysis for the Isolation of Primary Traits. Chicago: The University of Chicago Press, 1935.
38. Thurstone L.L., Chave E.J. «The measurement of attitude», (URL: http://www.brocku.ca/MeadProject/Thurstone/Chave_1929/1929_toc.html)
Приложение 1 (РСА)
Таблица 1
Процент объясненной дисперсии
Компонента |
Начальные собственные значения |
Суммы квадратов нагрузок извлечения |
|||||
Итого |
% Дисперсии |
Кумулятивный % |
Итого |
% Дисперсии |
Кумулятивный % |
||
1 |
3,393 |
30,847 |
30,847 |
3,393 |
30,847 |
30,847 |
|
2 |
1,728 |
15,709 |
46,555 |
1,728 |
15,709 |
46,555 |
|
3 |
1,260 |
11,456 |
58,011 |
1,260 |
11,456 |
58,011 |
|
4 |
1,018 |
9,255 |
67,266 |
1,018 |
9,255 |
67,266 |
|
5 |
,656 |
5,964 |
73,230 |
||||
6 |
,609 |
5,537 |
78,767 |
||||
7 |
,577 |
5,250 |
84,017 |
||||
8 |
,479 |
4,356 |
88,372 |
||||
9 |
,437 |
3,972 |
92,345 |
||||
10 |
,431 |
3,915 |
96,260 |
||||
11 |
,411 |
3,740 |
100,000 |
||||
Метод выделения: Анализ главных компонент. |
Таблица 2
Общности
Начальные |
Извлеченные |
||
Q1a coming from a wealthy family? |
1,000 |
,612 |
|
Q1b having well-educated parents? |
1,000 |
,782 |
|
Q1c having a good education yourself? |
1,000 |
,675 |
|
Q1d having ambition? |
1,000 |
,675 |
|
Q1e hard work? |
1,000 |
,692 |
|
Q1g having political connections? |
1,000 |
,702 |
|
Q1h giving bribes? |
1,000 |
,627 |
|
Q1i a person's race? |
1,000 |
,692 |
|
Q1j a person's religion? |
1,000 |
,704 |
|
Q1k being born a man or a woman? |
1,000 |
,674 |
|
Q1f knowing the right people? |
1,000 |
,565 |
|
Метод выделения: Анализ главных компонент. |
Таблица 3
Матрица повернутых компонент
Компонента |
|||||
1 |
2 |
3 |
4 |
||
Q1a coming from a wealthy family? |
,523 |
,558 |
|||
Q1b having well-educated parents? |
,850 |
||||
Q1c having a good education yourself? |
,731 |
,370 |
|||
Q1d having ambition? |
,802 |
||||
Q1e hard work? |
,828 |
||||
Q1g having political connections? |
,811 |
||||
Q1h giving bribes? |
,746 |
||||
Q1i a person's race? |
,795 |
||||
Q1j a person's religion? |
,833 |
||||
Q1k being born a man or a woman? |
,801 |
||||
Q1f knowing the right people? |
,689 |
||||
Метод выделения: Анализ методом главных компонент. Метод вращения: Варимакс с нормализацией Кайзера. |
|||||
a. Вращение сошлось за 5 итераций. |
Таблица 4
Проверка факторного решения. Матрица повернутых компонент для подвыборок 2 и 3
Подвыборка №2 |
Подвыборка №3 |
||||||||
Компонента |
Компонента |
||||||||
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
||
Q1a coming from a wealthy family? |
,488 |
,626 |
,517 |
,575 |
|||||
Q1b having well-educated parents? |
,868 |
,863 |
|||||||
Q1c having a good education yourself? |
,670 |
,447 |
,699 |
,398 |
|||||
Q1d having ambition? |
,793 |
,811 |
|||||||
Q1e hard work? |
,826 |
,829 |
|||||||
Q1f knowing the right people? |
,696 |
,705 |
|||||||
Q1g having political connections? |
,818 |
,814 |
|||||||
Q1h giving bribes? |
,742 |
,750 |
|||||||
Q1i a person's race? |
,792 |
,802 |
|||||||
Q1j a person's religion? |
,844 |
,845 |
|||||||
Q1k being born a man or a woman? |
,782 |
,795 |
Приложение 2 (САТРСА)
Таблица 1
Сводка для модели
Размерность |
Альфа Кронбаха |
Объясненная дисперсия |
|
Итог (Собственное значение) |
|||
1 |
,768 |
3,309 |
|
2 |
,470 |
1,745 |
|
3 |
,263 |
1,315 |
|
4 |
,115 |
1,117 |
|
5 |
-,457 |
,707 |
|
6 |
-,475 |
,699 |
|
7 |
-,550 |
,667 |
|
Всего |
,985a |
9,558 |
|
a. Итоговая альфа Кронбаха основана на совокупном собственном значении. |
Таблица 2
Сводка для модели
Размерность |
Альфа Кронбаха |
Объясненная дисперсия |
|
Итог (Собственное значение) |
|||
1 |
,768 |
3,310 |
|
2 |
,546 |
1,987 |
|
3 |
,249 |
1,293 |
|
4 |
,101 |
1,101 |
|
Всего |
,957a |
7,691 |
|
a. Итоговая альфа Кронбаха основана на совокупном собственном значении. |
Таблица 3
Оцифровка
Категория |
Частота |
Оцифровка |
Координаты центроида |
Координаты вектора |
|||||||
Размерность |
Размерность |
||||||||||
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
||||
Not important at all |
654 |
-1,373 |
-,985 |
-,098 |
,304 |
-,461 |
-,938 |
,143 |
,427 |
-,333 |
|
Not very important |
1414 |
-,881 |
-,590 |
,102 |
,319 |
-,187 |
-,602 |
,092 |
,274 |
-,214 |
|
Fairly important |
1604 |
-,051 |
-,016 |
,117 |
,027 |
-,002 |
-,035 |
,005 |
,016 |
-,012 |
|
Very important |
1226 |
,970 |
,655 |
,021 |
-,305 |
,307 |
,663 |
-,101 |
-,302 |
,235 |
|
Essential |
521 |
1,974 |
1,333 |
-,536 |
-,661 |
,318 |
1,349 |
-,206 |
-,613 |
,479 |
|
Пропущенные |
Подобные документы
Отношение математики и социологии. Понятие эмпирических и математических систем. Примеры наблюдаемых и латентных переменных. Социологический опрос как инструмент сбора информации об объекте. Применение математических методов при измерении в социологии.
эссе [75,8 K], добавлен 02.10.2014Социальная жизнь общества как предмет изучения социологической науки. Теоретическое и эмпирическое уровни познания, их цели и методы. Общие и специфические законы в социологии, способы их проявления. Функции социологии как самостоятельной отрасли знаний.
контрольная работа [23,0 K], добавлен 22.12.2013Понятие контент-анализа в социологии, общая характеристика метода. Методология и технология интервью. Сущность анкетирования, типы анкетных вопросов. Социологическое наблюдение: особенности применения. Основные положения социологического эксперимента.
курсовая работа [46,9 K], добавлен 13.02.2011Становление социологии как науки об обществе. Метод обобщения характеристик, условия реализации. Метод попарных сравнений Тьюки, недостатки. Методы множественных сравнений и многомерного шкалирования. Новый политический порядок в международных отношениях.
контрольная работа [21,8 K], добавлен 14.02.2012Понятие статистического анализа как представления объекта в качестве комплекса элементов и связей, образующих единое целое. Абсолютные и относительные величины. Применение средних величин в правовой статистике. Статистические методы анализа взаимосвязей.
контрольная работа [64,7 K], добавлен 29.03.2013Понятие и сущность анкетных опросов, требования к их проведению и классификация вопросов. Анализ проблемы достоверности получаемой информации. Виды, принципы и правила проведения интервью. Основные методы анализа и классификации документов в социологии.
реферат [38,8 K], добавлен 01.02.2010Общие принципы измерения в социологии. Использование математических методов сбора и обработки первичной социальной информации для измерения социального неравенства. Концепции прожиточного минимума и относительной бедности. Методы измерения бедности.
курсовая работа [181,1 K], добавлен 25.01.2016Предпосылки возникновения социологии как науки. Объект и предмет социологической науки. Основные функции социологии. Понятие о "позитивизме". Развитие человеческого духа. Основные положения концепции Конта. Социология в системе наук об обществе.
презентация [1,0 M], добавлен 29.11.2013Социология как наука и учебная дисциплина. Отличие предмета социологии от предметов других наук об обществе. Структура (уровни) социологического знания. Основные функции, законы и категории социологии. Специфика исследовательского метода социологии.
реферат [27,3 K], добавлен 29.10.2011История становления социологии. Зарождение социологии: предыстория (от мифологии до Нового времени). Вклад Огюста Конта в историю социологии: место его учения в становлении социологической науки, его значимые положения. Основные социологические методы.
курсовая работа [46,8 K], добавлен 07.02.2010