Селективное запоминание информации людьми, отказывающимися от курения
Роль медиа в предотвращении табакокурения. Особенности социально-когнитивной теории. Выявление факторов селективного запоминания информации, связанной с курением, у людей, отказывающихся от курения. Мотивационные модели поведения, связанного со здоровьем.
Рубрика | Психология |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 03.07.2017 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Таким образом, в данном разделе мы познакомились с главными факторами социально-когнитивной теории и увидели, что, согласно этой модели, научение индивида посредством наблюдения за другими людьми при условии самоэффективности. В то же время применительно к отказу от курения, теория требует включения дополнительных факторов, а именно фактора «боязни срыва», протестированного в работе Стречера Там же. P.216.
2.2 Модель убеждений о здоровье
Health Belief model (модель убеждений о здоровье) в свою очередь - теория, направленная на объяснение поведения, связанного со здоровьем Stretcher V. Rosenstock I. The Health Belief Model. // Cambridge Handbook Of Psychology, Health And Medicine. - 1997. -p. 113-117.. Эта теория является одной из теорий ожиданий и ценностей (Expectancy - Value Theory). Теории такого рода обязательно включают два компонента. Первый компонент - это «ожидание», которое определяется как вероятность того, что принятие определенного решения приведет к желаемому результату. Второй компонент - это ценность, которая определяется как позитивная или негативная оценка индивидом результатов поведения. Health Belief Model представляет собой частный случай таких теорий и также имеет в качестве основных предикторов переменные, связанные с результатом от определенных действий и позитивной или негативной оценкой этих результатов.
Конструкты этой теории призваны объяснить поведение человека через его представления о своем здоровье и о том, как совершаемые им действия и стратегии могут повлиять на здоровье и самочувствие сейчас и в будущем.
Среди конструктов этой теории, как правило, выделяются пять главных факторов - воспринимаемая тяжесть, воспринимаемая подверженность заболеваниям (уязвимость), воспринимаемые барьеры, воспринимаемая выгода, а также стимулы и призывы к действию. Для объяснения поведения, связанного со здоровьем человека, они могут использоваться как все вместе, так и по отдельности Е.И. Рассказова, Т.Ю. Иванова Мотивационные Модели Поведения, Связанного Со Здоровьем: Проблема «Разрыва» Между Намерением И Действием. // Психология. Журнал Высшей Школы Экономики. - 2015. - #1 С. 130..
Среди конструктов этой теории - воспринимаемая тяжесть, (perceived severity) и воспринимаемая подверженность (уязвимость) заболеваниям (perceived susceptibility). Согласно Health Belief Model, чем больше человек осознает степень тяжести своего заболевания или подверженности этому заболеванию, тем больше усилий он будет готов предпринять, чтобы избежать заболевания в будущем или избавиться от него. Степень тяжести и степень подверженности (уязвимость) может осмысливаться человеком как через предупреждения от врачей и знакомых, так и из собственных опасений. Оба конструкта имеют положительную корреляцию с количеством усилий, которые человек готов предпринять, чтобы избавиться от болезни или вредной привычки.
Другими важными конструктами выступают воспринимаемая выгода (perceived benefits) и воспринимаемые препятствия (perceived barriers). Воспринимаемая выгода - это то, насколько ценным и важным для человека кажется поведение, направленное на избавление или избежание болезни. Иными словами, это оценка человека того, насколько те или иные действия уменьшают вероятность заболеть. Если человек уверен, что определенное действие уменьшит его подверженность к проблемам со здоровьем, то он имеет большую вероятность это действие предпринять. Воспринимаемая выгода прямо пропорциональна тому, насколько человек готов предпринять то или иное действие для того, чтобы быть здоровым.
Обратное влияние имеет конструкт воспринимаемых препятствий. Это воспринимаемые человеком трудности, мешающие ему предпринять действие. Таким образом, для того чтобы предпринять действие, направленное на избавление от болезни или ее предотвращение, важно, чтобы преимущества перевешивали препятствия Stretcher V. Rosenstock I. The Health Belief Model. // Cambridge Handbook Of Psychology, Health And Medicine. - 1997. -p. 117.. Мета-аналитические исследования показывают, что воспринимаемые барьеры в большинстве исследований стали самым влиятельным фактором в объяснении поведения Janz N. Becker H. The Health Belief Model: a decade later. // Health Education 1984, -#14. - p. 17,. В этой теории также обращается внимание на такие конструкты, как «стимулы, призывы к действию» (Cues to action), определяемые как внутреннее (боль, симптомы) и внешнее (медиа, социальное окружение) влияние на действия индивида.
Важно обратить внимание, что теории Social Cognitive Theory (социально-когнитивная теория) и Health Belief Model (модель убеждений о здоровье) не взаимоисключают друг друга. Напротив, многие их конструкты очень похожи. Многие исследователи разработали схемы интеграции двух теорий и способы операционализации конструктов Wang S. Borland R. Determinants of intention to quit: confirmation and extension of western theories in male chinese smokers // Psychology And Health. - 2005. - #20. - P.31.. Так, например, фактор Cues to action из Health Belief Model связан с фактором окружающей среды из Social Cognitive Theory. Многие исследователи также обращали внимание на то, что воспринимаемые преимущества и препятствия из Health Belief Model тесно связаны с результатами действий (подкреплениями) из Social Cognitive Theory Stretcher V. Rosenstock I. The Health Belief Model. // Cambridge Handbook Of Psychology, Health And Medicine. - 1997. -p. 112.. В данном исследовании в качестве объяснительной модели будет использоваться один из вариантов интеграции конструктов двух теорий, а именно вариант, предложенный в исследовании WangWang S. Borland R. Determinants of intention to quit: confirmation and extension of western theories in male chinese smokers // Psychology And Health. - 2005. - #20. - P.31..
Таким образом, в данной главе были рассмотрены две мотивационные модели поведения, связанные со здоровьем, а именно социально-когнитивная теория и модель убеждений о здоровье. Были рассмотрены основные конструкты этих теорий и описаны их возможности для объяснения поведения, связанного со здоровьем. Также был предложен возможный вариант интеграции двух теорий в качестве объяснительной модели для данного исследования.
Глава 3. Выявление факторов селективного запоминания информации, связанной с курением, у людей, отказывающихся от курения
Для объяснения запоминания сообщений, связанных с курением, в первую очередь было необходимо выделить и обосновать факторы, которые будут использоваться для объяснения. Данное исследование делает попытку объяснить запоминание сообщений, с помощью фактора релевантности и использует конструкты из мотивационных моделей поведения, связанных с курением.
В данном исследовании мы предполагаем, что в данном случае релевантность сообщения связана с мотивацией к отказу от курения. Человек, который более мотивирован к отказу от курения, считает сообщения, направленные против курения, более релевантными. В связи с этим считаем оправданным использование модели, объясняющей мотивацию к отказу от курения в качестве показателя воспринимаемой релевантности сообщения. Факторами исследования были выбраны «Воспринимаемая подверженность заболеваниям из-за курения», «Боязнь срыва», «Курящие люди в окружении», «Самоэффективность (Self-efficacy)», «Воспринимаемая выгода», «Воспринимаемые барьеры».
3.1 Конструирование индексов и шкал
В первую очередь было необходимо разработать шкалу для целевого признака, то есть признака, который необходимо объяснить через другие признаки-предикторы.
В исследовательской практике существует несколько способов измерить то, насколько индивид склонен к тому или иному вид информации. В своей работе Клэй, Барбер и Шук выделили такие методы изучения селективной экспозиции как:
1) Ретроспективный подход,
2) Подход «поведенческих намерений» (Behavioral intentions)
3) Подход «наблюдаемого поведения» (Observed behaviour) Clay R. Shook N. Techniques For Measuring Selective Exposure: A Critical Review Communication Methods And Measures, 2013. p.10.
Ретроспективный подход основан на том, что респондентов просят вспомнить, насколько часто они встречались с информацией по той или иной теме. Таким образом, этот подход основан на обращении к опыту респондентов и их воспоминаниям. Именно этот метод применяется наиболее часто в исследовании селективной экспозиции информации о курении в силу ряда причин.
Основная проблема исследований селективной экспозиции и селективного мышления - эффект социальной желательности респондентов. Подход наблюдаемого поведения и поведенческих намерений предлагают респонденту сделать выбор, т.е. продемонстрировать определенное поведение в момент заполнения анкеты. Обращение же к воспоминаниям позволяет респонденту быть более искренним.
Помимо этого, ретроспективный подход не предполагает подготовки никакого «стимульного» материала, который мог бы сам по себе повлиять на ответы респондентов.
Использование открытого вопроса для измерения позволяет индивиду самостоятельно сформулировать ответ и назвать именно то, что он хочет и готов назвать. Именно поэтому в данном исследовании был реализован ретроспективный подход с открытыми вопросами. Так, респонденту задавались два вопроса - в первом ему предлагалось назвать как можно больше случаев, в которых он сталкивался с информацией, которая, по его мнению, отвращает от курения. Во втором ему предлагалось назвать как можно больше случаев, в которых он сталкивался с информацией, которая, по его мнению, подталкивает к курению.
Следует также обосновать, что именно имеется в виду под «информацией, подталкивающей к курению» и «информацией, отвращающей от курения». Под «информацией, подталкивающей к курению» понимается любая информация, которая была воспринята респондентам как склоняющая к курению (encouraging smoking). Под «информацией, отвращающей от курения», понимается любая информация, которая была воспринята респондентам как отвращающая от курения (discouraging smoking).
Очевидно, что для одного человека сообщение может показаться «подталкивающим к курению», а для другого нет. Здесь стоит сделать акцент на том, что важно было именно то, каким образом оно было воспринято и запомнено респондентом. В исследовании селективного запоминания информации важно не столько, что именно пытался передать создатель сообщения, сколько то, каким образом оно было интерпретировано и запомнено в сознании человека.
После сбора данных ответы респондентов были закодированы следующим образом: засчитывалось количество названных случаев в ответах респондентов на первый и второй вопрос. Было необходимо составить индекс, который учитывал бы разность между количеством упомянутых сообщений, воспринимаемых как отвращающие от курения курение, и количеством упомянутых сообщений, воспринимаемых как подталкивающие к курению. Индекс подсчитывался следующим образом. Каждое названное респондентом сообщение, упомянутое как отвращающие от курения (в ответе на первый вопрос), отнимало балл. Каждое сообщение, которое было упомянуто как подталкивающее к курению (в ответе на второй вопрос), добавляло один балл. Таким образом, индекс отражал разницу между числом упомянутых сообщений, подталкивающих к курению и числом сообщений, упомянутых как отвращающие от курения, и показывал, сообщений какого вида он назовет больше. Поскольку ни один респондент не назвал более 4 сообщений, отвращающих от курения, и ни один респондент не назвал более 4 сообщений, подталкивающих к курению, шкала приобрела восемь градаций. Число, полученное в результате подсчета баллов, прибавлялось к четырем. Таким образом, итоговая шкала представляет собой континуум из восьми градаций. Ноль по данной шкале означает, что респондент упомянул только сообщения, отвращающие от курения. Восемь по данной шкале обозначает, что респондентом были названы только сообщения, подталкивающие к курению. Продвижение от нуля до восьми означает увеличение доли упомянутых сообщений, подталкивающих к курению, по сравнению с долей упомянутых сообщений, отвращающих от курения.
Использование такой шкалы не является новацией. C помощью похожей шкалы во время телефонных интервью исследовательская компания Nielsen на протяжении многих лет изучает экспозицию различных групп населения Szczypka G, Emery S, Wakefield M, Chaloupka F. The adaptation and use of Nielsen Media Research commercial ratings data to measure potential exposure to televised smoking-related advertisements. // ImpacTeen Research Paper Series. 2003. - #29. - p.27. Похожая шкала использовалась в исследовании Бардан Bardin B. Et Al. Exposition Sйlective Aux Informations Deprйvention Et Attitude Implicite Envers Le Tabac // Psychologie Franзaise. 2015. P. 47..
Следующей задачей было составление шкал для выбранных для исследования факторов, то есть признаков-предикторов. Для измерения факторов были выбраны шкалы из теорий Social Cognitive Theory и Health belief model, которые использовались в предыдущих работах для измерения мотивации к отказу от курения, а также имеют большой потенциал в прогнозировании успеха в отказе от курения. Поскольку эти теории и их конструкты используются в исследовательских работах уже давно, шкалы и формулировки вопросов для них также уже разработаны и протестированы. По словам исследователей, большинство шкал демонстрируют высокий уровень надежности (Коэффициент Альфа Кронбаха > 0.8).
В таблице ниже приведены шкалы и исследовательские работы, из которых эти шкалы были заимствованы.
Таблица 1. Источники шкал и индексов, используемых в исследовании. Источник: Составлено автором.
Целевой признак: |
||
Запоминание информации о курении |
Nielsen Research, Bardin 2015 |
|
Предикторы: |
||
Воспринимаемая подверженность заболеваниям из-за курения |
Mao, Lee. 2009 |
|
Боязнь срыва |
Strecher et al. 1984 |
|
Курящие люди в окружении |
Wang, Borland. 2005 |
|
Самоэффективность (Self-efficacy) |
Ockene et al. 1981 Ockene J, Nutall R, Benfari RC, Hurwitz I, Ockene I: A Psychosocial Model of Smoking Cessation and Maintenance of Cessation. Preventive Medicine. - 1981. - #10. - 628.. Wang, Borland. 2005 |
|
Воспринимаемая выгода |
Wang, Borland. 2005 |
|
Воспринимаемые барьеры |
Wang, Borland. 2005 |
Для измерения признака респонденту задавался закрытый вопрос, на который ему предлагалось ответить с помощью шкалы. Предлагаемые ответы на вопросы были представлены 7-балльными шкалами Ликерта. Респондент мог ответить на вопрос указав, число по шкале от «0» до «7». Такие шкалы представляют собой линейный континуум, в котором градации переменной мыслятся как одинаковые, что позволяет оценить степень, в которой выражен тот или иной признак у респондента, а также позволяют с некоторым огрублением подтверждать или опровергать гипотезы о статистической связи переменных в регрессионном и корреляционном анализах.
Вопросы, использованные в исследовании для измерения признаков, приведены в Таблице №2.
Для измерения большинства признаков задавался один вопрос. Ответ на него был выбранным респондентом числом на шкале Ликерта. Это же число впоследствии и было кодом переменной.
Однако для измерения признаков «самоэффективности» (self-efficacy) и «курения в окружении» были использованы несколько вопросов. Вопросы были заимствованы из предыдущих исследований Ванг и Борланд Wang S. Borland R. Determinants of intention to quit: confirmation and extension of western theories in male chinese smokers // Psychology And Health. - 2005. - #20. - P.36., Мао и Стречера Strecher V. Psychosocial Aspects Behavior of Changes in Cigarette-Smoking // Patient Education and Counselling. - #7. - 296.. Из этих исследований была позаимствована технология кодирования эти признаков. Для кодирования переменных по обоим признакам создавался индекс, который определялся как среднее арифметическое из указанных респондентом ответов.
Так, например, самоэффективность по методологии измерялась с помощью нескольких вопросов о том, насколько вероятно, что он закурит в определенных ситуациях. Каждый вопрос направлен измерение того, насколько, по мнению респондента, он закурит в ситуации, в которых срывы происходят наиболее часто (в машине, во время употребления алкоголя и т.д.). Индекс для измерения самоэффективности высчитывается как среднее арифметическое по ответам респондентов в каждой из ситуаций. Этот индекс являлся градацией переменной в анализе.
Структура анкеты
Для составления анкеты и рассылки ее респондентам была выбрана платформа Google Forms. Эта платформа дает достаточную гибкость для формулирования вопросов и измерения всех признаков и предоставляет статистику ответов, позволяя экспортировать их в нужных для обработки форматах. Более того, Google Форма - достаточно популярный способ организовать анкетирование, знакомый многим. Так, многие пользователи знают, что Google Формы выдают создателю анкеты результаты в анонимном виде, если респондент сам не укажет где-либо в анкете своё имя.
Исследовательская анкета начинается с приветственного слова и инструкций по заполнению анкеты.
Сначала задаются вопросы, для измерения целевого признака, далее задаются вопросы о признаках-предикторах. Именно такой порядок был выбран потому, что ответы на вопросы о предикторах, заданные в начале могли бы мотивировать ответы респондентов по целевому признаку и таким образом добавлять систематическую ошибку, снижая валидность исследования. В конце анкеты респонденту задаются вопросы о его поле, возрасте, месте проживания, а также о том, как давно он бросает курить.
3.2 Сбор эмпирических данных
Работа в поле включала в себя рассылку анкеты респондентам. в качестве площадки была выбрана социальная сеть для бросающих курить Quitnet. Интерфейс для этой сети существует только на английском языке, а пользователи сети - преимущественно жители США. Из-за отсутствия аналогичной сети в нашей стране на русском языке, выбор был сделан именно в сторону этой сети. В этой сети люди делятся своими успехами и неудачами в процессе отказа от курения, дают друг другу советы и дают публичные обещания. В этой сети, чтобы обратиться к участникам, можно использовать «стену», где любой человек может написать сообщение, а остальные смогут его прочитать, или использовать сервис личных сообщений.
Обращение через личные сообщение было выбрано, как более оптимальный вариант, поскольку на публичные призывы могли отвечать участники, с определенными характеристиками, то есть был бы нарушен принцип случайности. Это могло бы повредить надежности и валидности исследования. Более того, такой призыв позволяет набрать лишь ограниченное количество респондентов, поскольку вызывает у многих участников недоверие и сомнения.
Отбор респондентов и обращение через личные сообщения осуществлялось следующим образом. Один из сервисов этой социальной сети - это цепочка обещаний. Каждое утро участникам предлагают стать звеном в цепи обещаний наряду с другими участниками и таким образом «публично заявить» о том, что сегодня не будешь курить. При этом можно увидеть всех участников цепи. Выбор респондентов осуществлялся путем случайного отбора респондентов из этой цепи и обращением к ним с помощью сервиса личных сообщений. Это все же нарушает принцип случайности, ведь участвуют все равно только добровольцы, но намного меньше, чем публичный открытый призыв. К тому же, персонализированные приглашения позволяют набрать больше респондентов. Участники могли задать вопросы и получить на них ответы, убедиться, что их приглашает живой человек, а не машина, что повышает уровень доверия. Более того, при публичном призыве высказывание одного участника о недоверии могло вызвать недоверие в других. Персонализированные сообщения позволяют сдержать передачу недоверия от одного участника к другому.
Подобный способ сбора данных имеет, тем не менее, некоторые недостатки. В частности, качество заполнения анкеты абсолютно не контролируется исследователем. Респондент может откликнуться на приглашение в исследовании, но при этом ответить на вопросы случайным образом. Чтобы преодолеть этот недостаток и проконтролировать качество заполнения анкеты, исследователи, как правило, включают в анкету контрольный вопрос, который может продемонстрировать, насколько внимательно респондент читает задания И. Ф. Девятко. Методы Социологического Исследования. Екатеринбург Издательство Уральского Университетаю -1998. Стр. 72.. В силу того, что анкета в данном исследовании достаточно нагружена шкалами, предлагать респонденту еще один вопрос было бы неоправданно, ведь увеличение вопросов в анкете также снижает качество её заполнения (в том числе, в силу того, что респондент просто устаёт). Более того, проведение исследования не предполагало никакой мотивации и поощрения респондентов за их ответы, кроме как возможностью получить результаты исследования.
Описание выборки
Изначальная выборка после работы в поле составила 112 человек. Некоторые респонденты заполнили менее 70% анкеты или не ответили на вопрос целевой переменной. Таких респондентов оказалось 15. Все они были исключены из выборки. Итоговая выборка составила 97 ответ.
В выборке, подготовленной для анализа респонденты указали возраст от 19 до 56 лет. Средний возраст респондентов составил 45,76 лет (SD = 8,9 лет ). Выборка оказалась достаточно смещенной по возрасту. Около 65% респондентов оказались старше 30 лет. Это обусловлено возрастным составом пользователей социальной сети Quitnet, в которой присутствуют, в основном, люди более старшего возраста.
Половое распределение также оказалось не совсем равномерным. (63% женщин и 37% мужчин), что может быть обусловлено демографическим составом пользователей социальной сети.
Описание переменных и данных
Во время проведения опроса были была собрана информация по 6 признакам. На основе информации об этих признаках были сформированы переменные, которые принимали участи в количественном анализе данных для проверки гипотез и нахождения взаимосвязей. Этими переменными стали: «Воспринимаемая подверженность заболеваниям из-за курения», «Боязнь срыва», «Курящие люди в окружении», «Самоэффективность (Self-efficacy)», «Воспринимаемая выгода», «Воспринимаемые барьеры».
Данные о средних значениях переменных и их стандартных отклонениях приведены в таблице.
Таблица 3. Средние и стандартные отклонения переменных
Источник: Подготовлено автором с помощью R
Запоминание контента о курении |
Self-efficacy |
Боязнь срыва |
Воспринимаемая подверженность заболеваниям из-за курения |
Курящие люди в окружении |
Воспринимаемая выгода |
Воспринимаемые барьеры |
||
MEAN |
2.71 |
1.98 |
4.05 |
4.33 |
1.2 |
3.14 |
3.67 |
|
SE |
1.7 |
1.4 |
1.31 |
1.49 |
1.26 |
2.02 |
1.61 |
3.3 Применение методов
3.3.1 Scatterplot Matrix
Для первичной оценки возможных взаимосвязей между переменными-предикторами и целевыми переменными широко используется график рассеяния (Scatterplot matrix).
Графиком рассеяния называют совокупность графиков, которые получаются при попарном совмещении всех данных каждой переменной. Таким образом, графики рассеяния позволяют визуально оценить наличие или отсутствие взаимосвязи всех переменных. В частности, на данном графике, эти графики рассеяния расположены слева от диагонали прямоугольника. Графики, демонстрирующие пересечения всех переменных-предикторов на интересующую нас целевую переменную расположены в самом первом столбце.
Рисунок 1. Scatterplot matrix.
Источник: Подготовлено автором с помощью R. Модуль ggplot2 Примечание: Для работы со статистическим пакетом переменные были закодированы следующим образом: «Recall»- «Запоминание контента о курении», «Self-efficacy» -«самоэффективность», «Ilness.susceptibility» - «Подверженность заболеваниям из-за курения» «Anxiety» - «боязнь срыва», «Environment» - «курящие люди в окружении», «Benefits» - «воспринимаемая выгода», «Barriers» - «воспринимаемые барьеры»..
Для визуальной оценки наличия зависимости в данных необходимо рассмотреть расположение точек. Надо такой график, в котором высокому значению одной переменной соответствовали бы высокие значения второй переменной и низкому значению одной переменной соответствовали бы низкие значения другой переменной. В этом случае речь идет о положительной зависимости - с возрастанием одной переменной возрастает и другая переменная. Также возможен случай отрицательная зависимости - при возрастании одной переменной другая переменная убывает. В этом случае на графике необходимо найти такой график, в котором низкому значению одной переменной соответствовали бы высокие значения второй переменной и высокому значению одной переменной соответствовали бы низкие значения другой переменной.
Чтобы визуально оценить зависимость, с данными была проведена манипуляция. Поскольку данные относятся к порядковому уровню измерения, напрямую на графике оценить по ним взаимосвязь невозможно. Переменные в данном исследовании имеют по семь или восемь градаций. Таким образом, точки могут располагаться только на пересечениях этих градаций, что не позволяет оценить их «концентрацию» на графике. В целях демонстрации данных, к ним был применен метод встряхивания (jitter) из R. Этот метод добавляет небольшую величину возмущения к данным. В результате, данные получаются немного смещены, но теперь не обязательно соответствуют целым числам-градациям переменных.
На первый взгляд, по расположению точек можно увидеть, что между целевой переменной и переменной, обозначающей уязвимость к заболеваниям из-за курения есть отрицательная зависимость. Можно также увидеть, что между целевой переменной и переменной, обозначающей время, прошедшее после последней выкуренной сигареты есть положительная зависимость. Другие же переменные визуально показывают достаточно слабый уровень зависимости с целевой переменной. Эти данные достаточно разрознены. На графиках это можно увидеть таким образом: высокие значения одной переменной соответствуют как высоким значениям другой переменной, так и её низким значениям и наоборот. Получить подтверждение или опровержения предположениям поможет корреляционный анализ.
3.3.2 Корреляционный анализ
Парный корреляционный анализ - это статистический метод, позволяющий оценить степень взаимосвязи между двумя переменными на основе коэффициента корреляции. Коэффициент корреляции Пирсона рассчитывается по следующей формуле:
Рисунок 2. Формула корреляции Пирсона.
Данная формула оценивает уровень связи следующим образом. Предполагается, что при положительной связи переменных низкому значению одной переменной будет соответствовать низкое значение другой переменной. Высокому значению одной переменной будет соответствовать высокое значение другой переменной.
При отрицательной связи переменных, напротив низкому значению одной переменной будет соответствовать высокое значение другой переменной. Высокому значению одной переменной будет соответствовать низкое значение другой переменной.
Формула фиксирует наличие подобной связи и нормирует полученный результат с помощью значений стандартных отклонений в диапазон [-1;1].
Таким образом, в результате обработки данных по этой формуле выводится коэффициент корреляции, который численно находится в интервале [-1;1]. Данный коэффициент необходимо интерпретировать следующим образом. Чем ближе коэффициент к 0, тем менее сильна связь между данными. Чем ближе коэффициент к -1 или к 1, тем сильнее связь между данными. При этом если коэффициент корреляции отрицательный, связь отрицательная. Положительный коэффициент корреляции говорит о положительной связи.
Таким образом, для поиска переменных, связанных с целевой, необходимо рассмотреть их коэффициенты корреляции. Библиотека ggplot2 в R позволяет расширить графики Scatterplot, разместив на треугольнике справа от диагоналей коэффициент корреляций попарно между всеми переменными.
Первая строка на этом графике показывает коэффициенты корреляции всех переменных предикторов с целевой переменной. На первой строке мы обнаружим, что наиболее удаленные от нуля коэффициенты у переменных «уязвимость к заболеваниям из-за курения» (r = -0.61), «боязнь срыва» (r = -0.47) и «воспринимаемые барьеры» (r = 0.48). (На графике можно увидеть другие цифры, поскольку на графике приведены коэффициенты с учетом того, что к данным был применен метод jitter («встряхивание»), о котором говорилось ранее). Эти коэффициенты корреляции говорят о достаточно сильном уровне связи.
Чтобы проверить статистическую значимость коэффициента корреляции, необходимо проверить гипотезы об отсутствии связи для каждого коэффициента корреляции. В рамках этого процесса будут приниматься нулевые гипотезы об отсутствии связи. Затем они будут не отвергаться или отвергаться в пользу конкурирующих гипотез при помощи статистического критерия. За допустимое значение критерия согласия (p-value) принимается 0.05.
H0: коэффициент корреляции равен нулю (R = 0). Связи между переменными нет.
H1: коэффициент корреляции не равен нулю (R = 0). Связь между переменными присутствует.
Для проверки гипотезы был использован статистический критерий распределения Стьюдента.
Проверка с помощью R показала, что во всех трех случаях вероятность того, что коэффициент равен нулю мала и значительно меньше доверительного уровня.
Для признака «уязвимость к заболеваниям из-за курения» p-value (вероятность того, что коэффициент корреляции равен нулю) составил 0.0013. Для признака «боязнь срыва» - 0.003. Для признака «воспринимаемые барьеры» -0. 013
Таким образом, визуальная оценка данных и корреляционный анализ показали, что существует отрицательная взаимосвязь целевого признака с предикторами «уязвимость к заболеваниям из-за курения», «боязнь срыва» и положительная взаимосвязь с признаком «воспринимаемые барьеры». Для подтверждения этого, а также для построения объяснительной модели и возможности сравнения величины влияния различных предикторов на целевую переменную, обратимся методу линейной регрессии.
3.3.3 Регрессионный анализ
Регрессионный анализ - это статистический метод для оценивания связи между переменными. Это метод, который позволяет предсказывать значение одной переменной на основании одной или более других переменных. Модель регрессионного анализа включает в себя целевую переменную (зависимую) и переменные-предикторы (независимые). Целевая переменная - эта та переменная, которую исследователь пытается предсказать или объяснить с помощью переменных-предикторов. Переменные предикторы, включенные в модель, участвуют в объяснении переменной. Результатом регрессионного анализа является функция, которая позволяет с помощью любых значений предикторов предсказать теоретическое значение целевой переменной. Эта в линейной форме эта функция имеет вид:
В функции регрессии оценивается статистическая значимость влияния каждого предиктора с помощью значений p-value, что позволяет проверить гипотезу о наличии статистической связи между предиктором и целевой переменной. В формуле регрессии каждый предиктор также получает коэффициент, позволяющий оценить силу его влияния на целевую переменную и сопоставить с силой влияния других факторов.
Для классического линейного регрессионного анализа, как правило, используются переменные интервального уровня измерения. Интервальный уровень измерения (наряду с номинальным и порядковым) - это тот уровень измерения, который позволяет определить равные расстояния между категориями И. Ф. Девятко. Методы Социологического Исследования. Екатеринбург Издательство Уральского Университетаю -1998. Стр 86..
Регрессионный анализ позволяет включать в модель один или более предиктор. При этом, модель также позволяет также судить о том, какие именно факторы хорошо объясняют целевую переменную не только по отдельности, но и вместе с помощью показателя R-SQUARED. Иными словами, показатель R-SQUARED позволяет судить о том, какая именно из всех возможных комбинаций предикторов наиболее хорошо подходит для объяснения целевой переменной.
В текущем исследовании использовалась именно эта модель, поскольку целью исследования было выявить зависимость между целевой и предполагаемыми факторами из моделей Social Cognitive Theory и Health Belief Model, которые в этой модели заняли место предикторов. Именно модель регрессионного анализа позволяет установить наличие или отсутствие связи между целевой переменной и отдельными предикторами, а также рассмотреть различные комбинации предикторов и их потенциал для объяснения целевой переменной. Кроме того, полученная регрессионная функция позволит сравнить силу влияния предикторов между собой
Стоит также обратить внимание на одну особенность данного исследования. Как уже отмечалось выше, регрессионный анализ зачастую используется в исследованиях с интервальным уровнем измерения. В текущем же исследовании в качестве предикторов используются шкалы порядкового уровня (т.е. шкалы, градации которых различаются в порядке. О градациях можно судить лишь в терминах «больше» и «меньше»). Если быть точнее, в качестве предикторов используются 7-балльные шкалы типа Ликерта.
Хотя переменные являются порядковыми, их использование в данном случае в регрессионном анализе легитимно. Исследовательский опыт и статистические исследования показывают, что 7-балльная размерность шкалы достаточна, чтобы делать достаточно точные выводы из модели регрессионного анализа. Более того, в пользу использования порядковых 7-балльных шкал Ликерта говорит следующий аргумент. Ключевой признак интервальной шкалы - это одинаковые интервалы между градациями шкалы, которые позволяют выполнять между ними арифметические действия. Шкала, которая включает в себя 7-баллов, позволяет предположить, что шкала с восемью делениями (от нуля до восьми) будет проинтерпретирована как порядок уровней того или иного признака с одинаковыми интервалами между этими уровнями Glass, G.V., Peckham, P.D. & Sanders, J.R. Consequences of failure to meet assumptions underlying the fixed effects analyses of variance and covariance. // Review of Educational Research. - 1972. - 42, p.238..
Одна из задач регрессионного анализа - выявление оптимальной модели, объясняющей целевую переменную. Ключевую роль в выявлении оптимальной модели играет выбор предикторов. Иными словами, чтобы выбрать хорошую объяснительную модель необходимо выбрать те признаки, которые бы вместе (то есть при совместном включении в модель) хорошо объясняли разброс целевой переменной.
Одним из методов выбора признаков является метод шаговой регрессии Стрижов Крымова Методы Выбора Регрессионных Моделей Москва: Вычислительный Центр РАН, 2010. С.16.. Этот метод работает следующим образом и состоит из нескольких итераций. В первой итерации в модель включаются все факторы одновременно. После этого оценивается общий показатель качества модели R-SQUARED, а также результаты проверки гипотез о равенстве коэффициентов регрессии (p-value).
Далее из модели поочередно удаляются факторы. С помощью показателя R-SQUARED и показателей p-value оценивается, удаление какого из предикторов улучшает модель. Если удаление факторов не улучшает модель, значит, вероятно, модель со всеми включенными в нее предикторами оптимальна. Если удаление какого-либо фактора увеличило R-SQUARED, наступает следующая итерация. Новая итерация также поочередно удаляет факторы в поисках наиболее хорошей модели.
Таким образом, из множества моделей выбирается та, которая даёт наиболее высокий R-SQUARED и наиболее низкие p-value при проверках гипотез о статистической значимости коэффициентов.
Данная модель выбора набора предикторов была использована в этом исследовании. Сначала в модель были включены все факторы. Затем они последовательно удалялись в поисках лучшей модели. После проведения процедуры шаговой регрессии оказалось, что две модели работают одинаково хорошо.
Первая модель
Первая модель объясняет целевую переменную через признаки «воспринимаемые барьеры» и «уязвимость заболеваниям из-за курения». Регрессионная формула этой модели такова:
где Y- селективное запоминание информации.
(Ноль по данной шкале означает, что респондент упомянул только сообщения, отвращающие от курения. Восемь по данной шкале обозначает, что респондентом были названы только сообщения, подталкивающие к курению).
- воспринимаемые барьеры,
- «воспринимаемая подверженность заболеваниям из-за курения».
Проверка нулевых гипотез для регрессионных коэффициентов показала, что коэффициенты равны нулю с крайне малой вероятностью.
Таблица 4. Статистические показатели первой регрессионной модели. Источник: Составлено автором на основе расчетов R Примечание: Для работы со статистическим пакетом переменные были закодированы следующим образом: Barriers - «воспринимаемые барьеры» Ilness.susceptibility - «Подверженность заболеваниям из-за курения»
На основании данных по стандартным отклонениям можно построить доверительные интервалы для коэффициентов регрессии. Рассчитанные доверительные интервалы с вероятностью 95% рассчитаны ниже:
Таблица 5. Доверительные интервалы первой регрессионной модели. Источник: Составлено автором
Переменная |
Значение оценки |
Доверительный интервал |
|
(Intercept) |
4.2651 |
(2.77; 5.17) |
|
Воспринимаемые барьеры |
0.2861 |
(0.18;0.5) |
|
Подверженность заболеваниям из-за курения |
-0.5861 |
(-0.81;-0.31) |
Полученная регрессионная формула и данные о доверительных интервалах позволяют говорить о том, что:
1) С увеличением признака «воспринимаемые барьеры» на единицу запоминание информации, подталкивающей к курению, увеличивается на число в интервале от 0.18 до 0.5
2) С увеличением признака «уязвимость заболеваниям из-за курения» на единицу запоминание информации, подталкивающей к курению, уменьшается на число в интервале от 0.31 до 0.81
3) Человек, у которого значения признаков «воспринимаемые барьеры» и «уязвимость заболеваниям из-за курения» равны нулю, имеет показатель признака «запоминание информация, подталкивающей к курению» равный от 3 до 5.
Признаки измерены в 8-балльных шкалах
Данная модель объясняет примерно половину дисперсии целевой переменной в соответствии с показателем Adjusted R-SQUARED.
Вторая модель
Вторая модель объясняет целевую переменную через признаки «воспринимаемые барьеры» и «боязнь срыва». Регрессионная формула этой модели такова:
где Y- селективное запоминание информации.
(Ноль по данной шкале означает, что респондент упомянул только сообщения, отвращающие от курения. Восемь по данной шкале обозначает, что респондентом были названы только сообщения, подталкивающие к курению.).
- воспринимаемые барьеры,
- «боязнь срыва».
Проверка нулевых гипотез для регрессионных коэффициентов показала, что коэффициенты равны нулю с крайне малой вероятностью.
Таблица 6. Статистические показатели первой регрессионной модели Источник: Составлено автором на основе расчетов R Примечание: Для работы со статистическим пакетом переменные были закодированы следующим образом: «Anxiety» - «боязнь срыва», «Barriers» - «воспринимаемые барьеры».
Доверительные интервалы для коэффициентов регрессии. Рассчитанные доверительные интервалы с вероятностью 95% рассчитаны ниже:
Таблица 7. Статистические показатели первой регрессионной модели Источник: Составлено автором на основе расчетов R
Переменная |
Значение оценки |
Доверительный интервал |
|
(Intercept) |
3.4299 |
(1.91; 4.15) |
|
Воспринимаемые барьеры |
0.3848 |
(0.17;0.61) |
|
Боязнь срыва |
-0.5102 |
(-0.78;-0.24) |
Полученная регрессионная формула и данные о доверительных интервалах позволяют говорить о том, что:
1) С увеличением признака «воспринимаемые барьеры» на единицу запоминание информации, подталкивающей к курению, увеличивается на число в интервале от 0.17 до 0.61.
2) С увеличением признака «уязвимость заболеваниям из-за курения» на единицу запоминание информации, подталкивающей к курению, уменьшается на число в интервале от 0.24 до 0.78.
3) Человек, у которого значения признаков «воспринимаемые барьеры» и «боязнь срыва» равны нулю, имеет показатель признака «запоминание информация, подталкивающей к курению» равный от 2 до 4.
Так же, как и в первой модели, признаки измерены в 8-балльных шкалах.
Данная модель объясняет около 43% дисперсии целевой переменной в соответствии с показателем Adjusted R-SQUARED.
Определенно, влиятельными факторами оказались «воспринимаемые барьеры», «уязвимость заболеваниям из-за курения» и «взволнованность из-за возможности срыва». В обеих моделях используется фактор «воспринимаемые барьеры» и в обеих моделях он прямо связан с целевой переменной.
В обеих моделях сравнить относительную силу влияния факторов достаточно сложно, поскольку пересекаются доверительные интвервалы. Как правило, в таких случаях коэффициенты регрессии признают равными по силе.
Построение двух раздельных моделей вместо одной модели, объединившей все факторы обусловлено тем, что факторы «уязвимость заболеваниям из-за курения» и «взволнованность из-за возможности срыва» формируют более хорошие модели по отдельности, чем вместе, и потому требуют построения двух моделей. При этом эти факторы по отдельности создают модели, сходные по объяснительной силе. Это может быть связано с тем, что эти факторы, выступая в модели в качестве предикторов, имеют хороший уровень связи между собой. Включение коррелирующих предикторов в одну модель создает проблему мультиколлинеарности и снижает уровень значимости коэффициентов предикторов (увеличивают вероятность того, что коэффициент регрессии равен нулю), а также снижает уровень R-SQUARED.
Так, модель, которая включает три фактора одновременно имеет значительно более низкий уровень R-SQUARED и более высокие вероятности того, что коэффициенты регрессии равны нулю. Её показатель Adjusted R-SQUARED, равный 0.42 свидетельствует о том, что эта модель объясняет меньше дисперсии, чем две модели рассмотренные ранее (R-SQUARED = 0.49 в первой модели и R-SQUARED = 0.45 во второй модели). Более того, стоит отметить, что модель, включающая три фактора одновременно, не позволяет отвергнуть нулевую гипотезу для фактора «боязнь срыва» на уровне 0.05 (p-value = 0.07). Тем не менее, модель можно использовать, приняв уровень значимости, равный 0.1
Анализ качества модели регрессии
Метод регрессионного анализа предъявляет некоторые предпосылки к полученным данным. Нарушение предпосылок делает регрессионный анализ слабо валидным методом для изучения взаимосвязи между переменными. Чтобы убедиться в валидности модели, необходимо проверить модели по некоторым критериям.
Ключевыми требованиями для работы с множественной регрессией являются:
Нормальное распределение остатков.
Это требование вводится в модель в качестве одного из условий, поскольку при его несоблюдении аппроксимирующая прямая может давать результат о наличии взаимосвязи и её силе в том числе для переменных, связь между которыми нелинейна и не монотонна.
Нормальное распределение остатков можно оценить визуально при помощи графика QQ-Plot. QQ-Plot - график, который показывает, насколько нормально распределена та или иная переменная. В условиях абсолютно нормального распределения все точки располагаются по диагонали, не отклоняясь от нее. Чем более точки отклоняются от диагонали, тем дальше распределение переменной от нормального.
(В данном случае, это точками обозначены остатки по каждому из респондентов. Под остатком понимается разность между предсказанием модели и наблюдаемыми данными).
Таблицы ниже демонстрируют, что точки лежат на диагонали, незначительно отклоняясь от нее в некоторых случаях. Это позволяет говорить о нормальности распределения остатков в двух моделях.
Рисунок 3. Q-Q-Plot для первой регрессионной модели.
Источник: Составлено автором на основе расчетов R
Рисунок 4. Q-Q-Plot для второй регрессионной модели.
Источник: Составлено автором на основе расчетов R
Отсутствие мультиколлинеарности
Наличие мультиколлинеарности в данных можно проверить с помощью показателя VIF, метода инфляционных векторов. В основании метода лежит определение коэффициента множественной корреляции между каждой переменной, участвующей в модели и другими переменными.
Показатель VIF имеет минимальное значение, равное 1, обозначающее полное отсутствие мультиколлинеарности. С возрастанием показателя возрастает мультиколлинеарность. Принято считать, что при VIF >10 для одного из предикторов модель имеет мультиколлинеарность. Для двух рассматриваемых моделей данные по VIF приведены в таблице
Первая модель
Таблица 8. Метод инфляционных векторов первой регрессионной модели. Источник: Составлено автором на основе расчетов R
Воспринимаемые барьеры |
Уязвимость к болезням из-за курения |
||
VIF |
1.102139 |
1.13 |
Вторая модель
Таблица 9. Метод инфляционных векторов второй регрессионной модели. Источник: Составлено автором на основе расчетов R
Воспринимаемые барьеры |
Боязнь срыва |
||
VIF |
1.19 |
1.24 |
Показатель VIF демонстрирует низкую мультиколлинеарность моделей.
Гомоскедастичность
Гомоскедастичность предполагает однородный разброс значений наблюдений. Иными словами, гомоскедастичность подразумевает, что для каждого значения переменной-предиктора дисперсия остатков одинакова.
В противном случае, когда при изменении значения переменной-предиктора дисперсия также изменяется, можно говорить о гетероскедастичности остатков. Это условие введено в регрессионный анализ, поскольку аппроксимация теряет свою валидность в тех случаях, когда данные имеют различные значения меры разброса остатков при различных значениях факторов. Это делает модель более сильной для объяснения целевой переменной при определенных значениях предикторов и более слабой при других значениях предикторов.
Один из способов проверки модели на гетероскедастичность - построение графика Fitted-Residuals. В этом графике на одной из осей располагаются значения остатков (Residuals). На другой - значения, определенные моделью (fitted). При условии нормального разброса остатков, не зависящего от значений модели, данные на всем графике разбросаны равномерно. Это можно увидеть на графиках модели, что свидетельствует об отсутствии гетероскедастичности.
Рисунок 5. График Residuials-Fitted для первой регрессионной модели. Источник: Составлено автором на основе расчетов R
Рисунок 6. График Residuals-Fitted для второй регрессионной модели. Источник: Составлено автором на основе расчетов R
Таким образом, мы убедились в том, что модели из нашего исследования соответствуют главным требованиям регрессионного анализа.
3.3.4 Метод деревьев классификации
В рамках регрессионного анализа не удалось выявить фактор, оказывающий наиболее сильное влияние на селективное запоминание сообщений. Чтобы сравнить влияние факторов, для выявления характерных сегментов, а также для более подробного знакомства с факторами был проведен анализ деревьев классификации на основе алгоритма CHAID.
Метод Деревьев классификации - это статистический метод, используемый для решения задач классификации. Этот метод подразумевает классификацию некоторой совокупности объектов по целевой переменной на основе признаков предикторов.
Результатом применения метода деревьев классификации является «дерево», которое состоит из «ветвей» и «листьев». Листья в этом дереве обозначают совокупность объектов, которые имеют сходные значения по целевой переменной и определенному набору переменных-предикторов одновременно.
В текущем исследовании этот метод позволит выявить однородные сегменты респондентов и установить похожие характерные группы, а также удостовериться в правильности результатов, полученных в рамках корреляционного и регрессионного анализов.
Для применения метода Деревьев классификации использовалась технология CHAID, реализованная с помощью пакета SPSS AnswerTree. Анализ CHAID CHI-Squared automatic interaction detection основан на многократных итерациях применения статистического критерия Хи-Квадрат (Chi-Squared). Чтобы выявить фактор, наиболее хорошо объясняющий целевую переменную на данном этапе, алгоритм применяет к целевой переменной все предикторы и выбирает предиктор с лучшим показателем p-value. Выбрав наилучший предиктор, алгоритм на основе критерия Хи-квадрат выбирает лучшую классификацию по переменной-предиктору, образуя таким образом «листья» дерева решений. Подобная процедура производится для каждого «листа» дерева решений, пока одно из правил остановки алгоритма не сработает.
Рисунок 7. Применение метода деревьев классификации.
Подготовлено автором на основе SPSS AnswerTree. Примечание: Для работы со статистическим пакетом переменные были закодированы следующим образом: «Recall»- «Запоминание контента о курении», , «Ilness.susceptibility» - «Подверженность заболеваниям из-за курения» «Anxiety» - «боязнь срыва», «Barriers» - «воспринимаемые барьеры».
В текущем исследовании наиболее влиятельным фактором, лучше всех объясняющим выборку с точки зрения критерия Хи-квадрат стал «воспринимаемая подверженность заболеваниям из-за курения». Гипотеза о независимости переменных отвергнута (p-value = 0). Также алгоритм указал наиболее значимые сегменты по переменной-предиктору. Ими стали сегменты [0-2), [2:4], (4-7). Иными словами, сегментирование респондентов по признаку «воспринимаемая подверженность заболеваниям из-за курения» на группы [0-2), [2:4], (4-7) наиболее хорошо подходит для объяснения целевой переменной.
Группа респондентов, выбравшая значение переменной «воспринимаемая подверженность заболеваниям из-за курения» в диапазоне [0-2) имеет наибольшее среднее по целевой переменной (4.6). (Mean = 4.6 SD =1.1) Таким образом, респонденты, которые имеют низкую воспринимаемую подверженность заболеваниям из-за курения более других склонны запоминать сообщения, подталкивающие к курению и менее других запоминать сообщения, отвращающие от него.
Подобные документы
Общие представления о памяти, ее материальные основы и структура. Представление информации в памяти, структура знаний и событий, процесс запоминания. Особенности памяти у младших школьников, прием деятельного запоминания, методика применения пиктограмм.
курсовая работа [350,8 K], добавлен 01.06.2010Понятие памяти и механизма запоминания. Методы изучения запоминания. Исследование непроизвольного запоминания и условий его продуктивности. Исследование динамики процесса заучивания. Непосредственное и опосредствованное запоминание.
курсовая работа [37,5 K], добавлен 19.09.2003Изучение памяти как психического процесса. Разработка методов измерения важных закономерностей процессов запоминания, сохранения, воспроизведения, забывания. Способы обработки запоминаемой информации, мнемические действия и операции, ментальные структуры.
курсовая работа [34,8 K], добавлен 26.05.2015Общее понятие памяти и ее виды. Характеристика ее основных процессов. Особенности развития памяти у дошкольников. Анализ процесса запоминания информации у детей. Упражнения, направленные на развитие памяти. Сущность механического и смыслового запоминания.
дипломная работа [273,9 K], добавлен 03.01.2012Техника запоминания информации. Системное запоминание, перемещение в памяти как по файлам в компьютере. Часто используемые образные коды. Развитие визуального мышления. Тренировка устойчивости внимания (путем увеличения объема запоминаемых сведений).
учебное пособие [2,5 M], добавлен 15.05.2012Запоминание материала, его сохранение и последующее воспроизведение как одно из удивительных свойств мозга. Механизм действия памяти человека. Основные виды памяти, отклонения в ее функционировании и патологии. Методики улучшения запоминания информации.
курсовая работа [78,1 K], добавлен 06.07.2015Основные закономерности формирования материала правдивых показаний в допроцессуальной стадии. Словесное оформление и передача информации допрашиваемым, прием и переработка ее следователем. Запоминание и сохранение информации. Создание ложной информации.
реферат [132,1 K], добавлен 08.06.2010Эффективность опосредованного (с опорой на пиктограммы) воздействия на запоминание, проверка гипотезы. Сравнение продуктивности непосредственного и опосредованного запоминания. Значения критерия Т. Вилкоксона для уровней статистической значимостей.
контрольная работа [242,3 K], добавлен 13.09.2011Определение памяти и её физиологический механизм. Влияние различных видов деятельности на запоминание. Методы и приёмы улучшения памяти человека. Приемыв и упражнения для развития памяти по Ф. Лёзеру. Основные принципы запоминания новой информации.
курсовая работа [51,8 K], добавлен 16.02.2011Общие представления, виды, особенности, индивидуальные различия памяти у людей. Теории и законы, формирование и развитие памяти. Эффективность запоминания событий, влияющих на впечатления человека, причины потери и способы восстановления памяти.
реферат [34,5 K], добавлен 06.06.2011