Решетки формальных понятий для анализа данных социологических опросов
Проведение опросов и анализ их результатов как одна из используемых форм социологических исследований. Преимущества использования методов ФАП (формальный анализ понятий) для анализа результатов. Условия применения вложенных диаграмм решеток понятий.
Рубрика | Социология и обществознание |
Вид | статья |
Язык | русский |
Дата добавления | 02.02.2019 |
Размер файла | 31,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Евразийский национальный университет им. Л.Н.Гумилева, Астана
Решетки формальных понятий для анализа данных социологических опросов
Сатекбаева А.Ж., Тусупов Д.А.
Проведение опросов и анализ их результатов - одна из наиболее часто используемых форм социологических исследований. В настоящее время в арсенале социологов для решения этих задач существует богатый инструментарий методов, в основном это математико-статистические методы (описательные статистики и тестирование гипотез) и родственные им кластерный и факторный анализ. Основной недостаток методов использующих тестирование гипотез заключается в необходимости их предварительной формулировки, что бывает довольно сложно сделать на ранних этапах исследования. Еще одним ограничением традиционно используемых средств социологического анализа данных является сложность передачи результатов в доступном для понимания виде неспециалистам в области математической статистики (например, заказчикам исследований). Ключевой вопрос, которым мы задаемся в этой статье: «Что может предложить дискретная математика для преодоления указанных недостатков и ограничений?» Предлагаемый нами подход основан на формальном анализе понятий (ФАП), алгебраической дисциплине, представляющей собой прикладную ветвь теории решеток и нашедшей широкое применение в анализе объектно-признаковых данных [1]. Потому основная цель этой работы - показать на примере реальных социологических исследований пользу применения методов ФАП для анализа результатов опросов. Суть применения ФАП состоит в том, что в полученных результатах опросов респонденты могут быть рассмотрены как объекты, а ответы на вопросы опросных листов как признаки, которыми они обладают. По этим данным выявляется множество групп объектов, обладающих общими признаками. Далее на множестве таких пар вида (объекты, признаки), называемых формальными понятиями, задается частичный порядок по отношению вложения первой компоненты. Это отношение является частичным порядком и определяет так называемую решетку понятий. Граф покрытия этого отношения удобно использовать для визуализации выявленных групп, что дает возможность эксперту (социологу) сделать выводы об их размерах, пересечениях, общих признаках и наличии некоторых других закономерностей. Помимо выделения групп респондентов и их визуализации, ФАП предоставляет возможность поиска признаковых зависимостей в виде импликаций, что позволяет делать выводы о взаимосвязи исследуемых социальных явлений. После извлечения с помощью решеток понятий из результатов опросов знаний, исследователь может сформулировать гипотезы на их основе и воспользоваться инструментами статистического анализа для дальнейшей проверки. Немаловажным аспектом социологического исследования является представление данных опросов в виде пригодном для последующего анализа, поэтому часть работы посвящена технике шкалирования, применяемой в ФАП. Зачастую размер решетки понятий (число формальных понятий) оказывается слишком большим для того, чтобы ее диаграмму можно было отобразить в удобном для аналитика виде. Мы также обсудим способы отбора релевантных формальных понятий.
Дадим основные определения ФАП и поясним их на примерах.
Определение 1. Формальный контекст K=(G, M, I) состоит из двух множеств G и M, и отношения I инцидентности между ними. Элементы G называются (формальными) объектами, а элементы M (формальными) признаками.
Пример 1. Формальный контекст удобно представлять в виде объектно-признаковой таблицы. При этом запись glm читается как «объект g обладает признаком m».
Определение 2. Операторами Галуа называется пара отображений вида и , таких что для отображение определяет множество всех признаков общих для всех объектов из и для отображение определяет множество всех объектов общих для всех признаков из .
Пример 2. Для контекста из примера 1 , а.
Определение 3. Формальным понятием контекста K=(G, M, I) называется пара вида (A,B), где AB, BM, A=B и B=A Множество A называется объемом понятия, а множество B его содержанием. Запись B(G, M, I) означает все множество формальных понятий контекста K:=(G, M, I).
Пример 3. Для контекста из примера 1 пара ({g1,g2},{m2,m4}) является формальным понятием, а пара ({m2,m3}{g2} нет.
Определение 4. Для двух формальных понятий и некоторого контекста, называется подпонятием если (эквивалентно ). В этом случае является надпонятием , и это обозначают как . Множество всех понятий контекста , упорядоченных по вложению объемов, обозначается и называется решеткой понятий.
В привычном смысле слово «признак» означает не только свойство, которое может присутствовать или отсутствовать у объекта. Под признаками понимают, например, цвет, вес, пол, возраст и др. Такие признаки мы будем называть многозначными, в отличие от однозначных признаков, рассмотренных ранее.
Определение 5. Многозначный контекст (G, M, W, I) состоит из множеств G, M и W, и тернарного отношения IGMW для которого выполняется (g,m,w)I и (g,m,v)I влечет w=v. Элементы множеств G, M и W называются объектами, (многозначными) признаками и значениями признаков соответственно.
Пример 4. Рассмотрим пример многозначного контекста, характерного для социологических опросов.
G/M |
цвет |
жесткий |
гладкий |
форма |
фрукт |
|
яблоко |
желтое |
нет |
да |
круглое |
+ |
|
грейпфрут |
желтый |
нет |
нет |
круглый |
+ |
|
киви |
зеленое |
нет |
нет |
овальное |
+ |
|
слива |
синяя |
нет |
да |
овальная |
+ |
|
кубик |
зеленый |
да |
да |
кубический |
- |
|
яйцо |
белое |
да |
да |
овальное |
- |
|
теннисный мяч |
белый |
нет |
нет |
круглый |
- |
Возникает естественный вопрос, как можно построить формальные понятия по такому многозначному контексту? Как правило, это осуществляется приведением многозначного контекста к однозначному.
Процесс приведения многозначного контекста к однозначному называется (понятийным) шкалированием и оставляет место интерпретации. Поэтому множество понятий одного и того же многозначного контекста зависит от типа шкалирования выбранного для того или иного признака.
Определение 6. Шкалой признака m многозначного контекста называется (однозначный) контекст Sm=(Gm, Mm, Im), для которого m(g)Gm (здесь m(g) обозначает значение признака m для объекта g). Объекты такого контекста называются значениями шкалы, а признаки - признаками шкалы.
Определение 7. Для многозначного контекста (G, M, W, I) и шкал Sm, mM приведенным контекстом называется контекст , где и определено отношение и .
Опишем на примерах основные типы шкал, которые мы использовали в примере.
G/M |
фрукт |
|||||||||||
яблоко |
x |
x |
x |
x |
+ |
|||||||
грейпфрут |
x |
x |
x |
x |
+ |
|||||||
Киви |
x |
x |
x |
x |
+ |
|||||||
слива |
x |
x |
x |
x |
+ |
|||||||
кубик |
x |
x |
x |
x |
- |
|||||||
яйцо |
x |
x |
x |
x |
- |
|||||||
теннисный мяч |
x |
x |
x |
x |
- |
Отметим, что техника шкалирования, подразумевающая акт интерпретации значений исходных данных и выбора шкалы, хорошо описывается в терминах нечеткой логики и формализована с помощью нечетких решеток понятий в работах чешских исследователей [11]. Несмотря на ряд проблем, заключающихся в интерпретации нечетких объектов как респондентов и большем количестве понятий, валидация подхода на основе нечетких решеток понятий к анализу данных социологических опросов является направлением дальнейших исследований. Еще одним полезным для социолога средством может оказаться применение вложенных диаграмм решеток понятий, особенно при выявлении взаимосвязи различных вопросов [4].
социологический опрос формальный понятие
Литература
1. Ganter B., Wille R. Formal Concept Analysis// Mathematical Foundations. - Berlin: Springer, 1999.
2. Freeman L. Cliques, Galois Lattices and the Structure of Human Social Groups // Social Networks. - 1996. - №18. - С.173-187.
3. White D.R., Duquenne V. Social Network and Discrete Structure Analysis// Introduction to a Special Issue. Social Networks. - 1996. - №18. - P.169-172.
4. Roth C., Obiedkov S., Kourie D.G. Towards Concise Representation for Taxonomies of Epistemic Communities// Proceedings of the 4th International Conference on Concept Lattices and their Applications (CLA). -2006.
5. Кедров С.А., Кузнецов С.О. Исследование групп пользователей Интернет-ресурсами методами анализа формальных понятий и разработки данных (Data Mining)//Бизнес-информатика. - 2007. - №1. - С.45-51.
6. Kuznetsov S.O., Ignatov D.I. Concept Stability for Constructing Taxonomies of Web-site Users//Proceedings Satellite Workshop "Social Network Analysis and Conceptual Structures: Exploring Opportunities" at the 5th International Conference Formal Concept Analysis (ICFCA'07, Clermont-Ferrand, France). - 2007. - P.19-24.
Размещено на Allbest.ru
Подобные документы
Теоретическое обоснование проблемы интерпретации результатов социологических исследований. Определение и виды социологических исследований, процедура анализа их результатов. Практическое применение интерпретации данных социологических исследований.
курсовая работа [52,3 K], добавлен 10.01.2011Понятие и типы социологических исследований, этапы их проведения, подготовительные и основные. Методы эмпирических социологических исследований, анализ и оценка, интерпретация полученных результатов, существующие проблемы и их решение, управление.
контрольная работа [22,8 K], добавлен 14.06.2015Сбор социологических данных. Диалектика общего, особенного и единичного. Качественные и количественные методы социологических исследований. Обработка полученных данных. Анализ социальной действительности. Механизм адаптации людей к социальным изменениям.
реферат [26,8 K], добавлен 27.01.2013Методологические основы сбора информации о социальных явлениях и процессах. Анализ социологических методов научного исследования, используемых в практике экономических, социальных, политических и психологических исследований; отличительные черты опросов.
курсовая работа [33,4 K], добавлен 12.09.2013Современные методы прикладных социальных исследований. Социологическая информация и ее виды. Данные, содержащиеся в официальных документах. Информация, собираемая с помощью массовых опросов. Данные, полученные с помощью опросов экспертов, а также СМИ.
курсовая работа [36,6 K], добавлен 09.11.2008Понятие и сущность анкетных опросов, требования к их проведению и классификация вопросов. Анализ проблемы достоверности получаемой информации. Виды, принципы и правила проведения интервью. Основные методы анализа и классификации документов в социологии.
реферат [38,8 K], добавлен 01.02.2010Методологические проблемы социологических исследований. Функции социологии. Разработка программы социологического исследования. Обобщение и анализ данных, полученных в процессе его проведения. Описание и применение разных методов и методик в социологии.
учебное пособие [339,5 K], добавлен 14.05.2012Понятие метода и методики социологических исследований. Метод опроса в социологическом исследовании. Методы механической, серийной, гнездовой и квотной выборки. Создание широких сетей интервьюеров. Качественные методы анализа социологических данных.
курсовая работа [32,4 K], добавлен 27.05.2015Научные предпосылки социологических исследований. Методы сбора, анализ социальной информации. Принципы составления анкеты, виды вопросов. Техника проведения интервью. Обработка собранного материала. Использование результатов социологического исследования.
реферат [35,1 K], добавлен 22.07.2015Определение возрастного контингента и гендерной составляющей интернет-аудитории. Рассмотрение её социально-демографического портрета. Анализ интересов интернет-пользователей по данным опросов в социальных сетях. Оценка доли интернет-зависимых россиян.
реферат [437,3 K], добавлен 24.04.2019