Побудова індексу на підставі індикаторів методики GSR-5 із використанням моделі ґрадуйованих відповідей

Побудова індексу для індикаторів методики GSR-5. Методика дає змогу вимірювати загальні установки щодо держави загального добробуту. Найпростішим способом є побудова адитивного індексу: розрахунок сумарного балу відповідей респондента на пункти методики.

Рубрика Социология и обществознание
Вид статья
Язык украинский
Дата добавления 26.03.2023
Размер файла 443,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Побудова індексу на підставі індикаторів методики GSR-5 із використанням моделі ґрадуйованих відповідей

Руслана Москотіна,

PhD із соціології, фахівець 1 категорії лабораторії прикладних соціологічних досліджень факультету соціології Київського національного університету імені Тараса Шевченка

РУСЛАНА МОСКОТІНА

Побудова індексу на підставі індикаторів методики GSR-5 із використанням моделі ґрадуйованих відповідей

Статтю присвячено побудові індексу для індикаторів методики GSR-5. Методика дає змогу вимірювати загальні установки щодо держави загального добробуту. Найпростішим способом є побудова адитивного індексу: розрахунок сумарного балу відповідей респондента на пункти методики. Такий індекс хоч і є простим в інтерпретації, має певні недоліки. По-перше, він передбачає, що всі індикатори мають однакову вагу. Проте логічно припустити, що це не завжди так. По-друге, вважається, що відстані між варіантами відповідей є однаковими для всіх пар сусідніх альтернатив кожного з індикаторів. Однак якщо маємо справу з порядковими змінними, ця умова може не виконуватись. Таким чином, виникає потреба в інструменті, який дасть змогу сконструювати індекс, котрий усував би вказані недоліки. Одним з таких інструментів може стати модель ґрадуйованих відповідей; вона призначена для роботи з порядковими змінними. Передусім було з'ясовано, чи доцільною є побудова адитивного індексу для індикаторів методики GSR-5. Побудувавши однофакторну модель конфірматорного факторного аналізу з однаковими факторними навантаженнями для пунктів, було з'ясовано, що вона не демонструє прийнятної відповідності даним. Звідси випливає, що розрахунок адитивного індексу для індикаторів GSR-5 недоцільний. Тому постає потреба в альтернативній моделі. Оскільки пункти методики GSR-5 мають порядкову шкалу, для них було побудовано одновимірну модель ґрадуйованих відповідей (модель GRM). Вона продемонструвала хорошу відповідність даним. Модель GRM дала можливість сконструювати такий індекс, який враховує різну вагу пунктів та відстані між варіантами відповідей для кожного з індикаторів. Він характеризується кращою диференціювальною здатністю, ніж адитивний. Крім того, модель ґрадуйованих відповідей з метою полегшення інтерпретації дає змогу зберегти значення латентної змінної у шкалі значень адитивного індексу. В цьому полягає перевага моделі ґрадуйованих відповідей, порівняно з моделями конфірматорного факторного аналізу. Останні теж можуть бути застосовані як інструменти для побудови адитивних індексів, однак не передбачають перетворення латентних змінних з однієї шкали в іншу.

Ключові слова: модель ґрадуйованих відповідей, GSR-5, латентна змінна, конфірматорний факторний аналіз, адитивний індекс

РУСЛАНА МОСКОТИНА

Построение индекса на основе индикаторов методики GSR-5 с использованием модели градуированных ответов

Статья посвящена построению индекса для индикаторов методики GSR-5. Методика позволяет измерять общие установки по отношению к государству всеобщего благосостояния. Простейшим способом является построение аддитивного индекса: расчет суммарного балла ответов респондента на пункты методики. Такой индекс является простым в интерпретации, но имеет определенные недостатки. Во-первых, он предполагает, что все индикаторы имеют одинаковый вес. Но логично предположить, что так бывает не всегда. Во-вторых, считается, что расстояния между вариантами ответов одинаковы для всех пар соседних альтернатив каждого индикатора. Однако если мы имеем дело с порядковыми переменными, это условие может не выполняться. Таким образом, возникает потребность в инструменте, который позволил бы сконструировать индекс, устраняющий указанные недостатки. Одним из таких инструментов является модель градуированных ответов; она предназначена для работы с порядковыми переменными. Прежде всего, была определена целесообразность построения аддитивного индекса для индикаторов методики GSR-5. После построения однофакторной модели конфирматорного факторного анализа с одинаковыми факторными нагрузками для пунктов было установлено, что она не демонстрирует приемлемого соответствия данным. Отсюда следует, что расчет аддитивного индекса для индикаторов GSR-5 нецелесообразен. Потому возникла потребность в альтернативной модели. Так как пункты методики GSR-5 имеют порядковую шкалу, для них была построена одномерная модель градуированных ответов (модель GRM). Она продемонстрировала хорошее соответствие данным. Модель GRM позволила сконструировать индекс, учитывающий разный вес пунктов и расстояния между вариантами ответов для каждого индикатора. Он характеризуется лучшей дифференцирующей способностью, чем аддитивный. Кроме того, модель градуированных ответов с целью облегчения интерпретации позволяет сохранить значение латентной переменной в шкале значений аддитивного индекса. В этом состоит преимущество модели градуированных ответов по сравнению с моделями конфирматорного факторного анализа. Последние тоже могут быть применены в качестве инструментов построения аддитивных индексов, однако не предполагают преобразования латентных переменных из одной шкалы в другую.

Ключевые слова: модель градуированных ответов, GSR-5, латентная переменная, конфир- маторный факторный анализ, аддитивный индекс

RUSLANA MOSKOTINA

Construction of the index based on the GSR-5 items using the graded response model

This article is about building of the index for GSR-5 items (questions). They measures general attitudes towards the general welfare state. The simplest way is to calculate an additive index (a total score of the respondent's answers to GSR-5 items). Such an index is easy to interpret but it has some limitations. Firstly, it assumes that all the questions have the same weight. But it is logical to suppose that this is not always the case. Secondly, it is expected that the distances between the neighboring answer options are the same for each item. However, if we are dealing with variables that are measured on an ordinal scale this condition may not be fulfilled. Therefore, we need an appropriate tool allows us to construct an index that overcomes the limitations are mentioned above. One such a tool is a graded response model; it is designed to work with variables that are measured on an ordinal scale. First of all, it is found out is there appropriate to construct an additive index for GSR-5 items. After building the single factor CFA model (confirmatory factor analysis model) with the same factor loadings for each question it turned out that this model does not show an acceptable fit to the data. Thus, the calculation of the additive index for GSR-5 items is not appropriate. Therefore, there is a need for an alternative model. Since GSR-5 items are measured on an ordinal scale a unidimensional graded response model (GRM model) is applied. It shows a good fit to the data. With the GRM model it is possible to build the index which takes into account different weights of the questions and distances between the answer options for each item. The index is constructed with the graded response model shows more variability than the additive index. In addition the graded response model (in order to facilitate interpretation) allows us to represent values of the latent variable as the additive index values. This is the advantage of the graded response model com-pared to confirmatory factor analysis models. The latter can also be used as tools for constructing addi-tive indices but they do not provide the transformation of latent variables from the one scale to another.

Keywords: graded response model, GSR-5, latent variable, confirmatory factor analysis, additive index

Тестові методики, як правило, асоціюються із психологічними дослідженнями. Але вони також застосовуються у соціологічних дослідженнях. Тестом є набір пунктів (індикаторів), призначених для вимірювання латентної характеристики [Paek, Cole, 2020: p. 1]. Латентними характеристиками можуть бути як психологічні (якщо йдеться про психологічні тести), так і соціальні (якщо йдеться про соціологічні тести) феномени. Серед ключових властивостей соціологічних тестів можна виокремити інтеґральність, яка передбачає можливість об'єднання індикаторів тесту в один інтеґральний показник [Дембицкий, 2016: с. 143; Дембіцький, 2019: с. 36; Головаха, Панина, 1997: с. 5]. Інтеґральний показник є числовим вираженням латентної характеристики. До інтеґральних показників належать, в тому числі, індекси.

Серед теорій, які стосуються розроблення тестів, можна виокремити класичну теорію тестів (classical test theory) та сучасну теорію тестів (item response theory, або IRT). Одиницею аналізу у класичній теорії тестів виступає, як правило, сумарний бал відповідей респондента на запропонований набір пунктів [Paek, Cole, 2020: p. 1]. Тобто маємо справу з адитивним індексом. Серед переваг адитивних індексів можна виокремити простоту обрахунку та інтерпретації їхніх значень. Однак вони мають і певні недоліки. Розраховуючи значення адитивного індексу, ми виходимо з того, що кожен пункт має однакову вагу. Проте логічно припустити, що так буває не завжди. Також передбачається, що відстані між варіантами відповідей є однаковими для всіх пар сусідніх альтернатив кожного з індикаторів. Наприклад, якщо всі індикатори мають 3-бальну шкалу, відстань між варіантами відповідей 1 та 2 вважається такою ж, як відстань між альтернативами 2 і 3. Та якщо йдеться про порядкові шкали, ця умова може не виконуватись. Тож потрібен інструмент побудови індексів, що усував би вказані недоліки. Один з таких інструментів -- модель ґрадуйованих відповідей -- пропонує сучасна теорія тестів.

Сучасна теорія тестів та модель ґрадуйованих відповідей

Сучасна теорія тестів позначає низку математичних моделей зв'язку між латентною змінною та пунктами тесту -- моделей IRT. Кожен респондент займає якусь позицію на шкалі латентної змінної, що визначає імовірність того, чи обере він той або інший варіант відповіді для певного пункту [Bean, Bowen, 2021]. Латентна змінна позначається як в. Сучасна теорія тестів ґрунтується на низці припущень [Paek, Cole, 2020: p. 4; de Ayala, 2022: pp. 21-23]:

1. Слід визначити розмірність моделі IRT. Під розмірністю розуміють кількість латентних змінних, в які можна об'єднати пункти тесту. Моделі можуть бути одновимірними (тобто всі індикатори об'єднуються в одну латентну змінну) та багатовимірними.

2. Пункти тесту мають бути локально незалежними. Зокрема, локальна незалежність для одновимірних моделей передбачає, що однієї латентної змінної достатньо для пояснення всіх зв'язків між відповідями на пункти тесту.

3. Варто обрати функцію, що описує залежність між імовірністю відповіді респондента на той чи інший пункт тесту й латентною змінною. Її ще називають функцією відповідей на завдання (item response function). Вибір функції, своєю чергою, залежить від вибору моделі IRT.

Обираючи модель IRT, слід виходити з того, який тип шкали має кожен з пунктів тесту. Для дихотомічних змінних застосовуються модель Раша, 2-па- раметрична логістична модель, 3-параметрична логістична модель, 4-параме- трична логістична модель. Для порядкових шкал досить часто використовується модель ґрадуйованих відповідей (graded response model) [Samejima, 1997]. На ній зупинимося більш детально, адже в нашому випадку побудова індексу здійснюватиметься на підставі індикаторів, що мають порядкову шкалу. Модель ґрадуйованих відповідей передбачає побудову функцій для кожного варіанту відповіді кожного з пунктів тесту -- функцій відповідей для категорій (category response functions). Вони характеризують імовірність вибору певного варіанту відповіді на той чи інший пункт тесту залежно від значення латентної змінної. Спочатку розраховуються ймовірності вибору варіанту відповіді k і більше на кожен з пунктів тексту залежно від значення в. Це можна подати у вигляді такої формули [Meade, Lautenschlager, 2004: p. 365; Bean, 2021]:

де -- імовірність того, що респондент s з певним значенням в обере варіант відповіді k і більше на пункт тесту i; a -- параметр дискримінації, дає змогу визначити, наскільки пункт тесту і диференціює респондентів з різними значеннями в (також може розглядатись як характеристика сили зв'язку між в і пунктом тесту і); b -- параметр розташування. Інтерпретується як значення в, для якого респондент з імовірністю 0,5 обере варіант відповіді k і більше на пункт тесту і. Кількість параметрів b становить n-1, де n -- кількість варіантів відповіді для пунктів тесту.

Знаючи імовірність вибору варіанта відповіді k і більше на кожен з пунктів тесту, можна розрахувати імовірність вибору варіанту відповіді k залежно від значення латентної змінної. Це можна виразити у вигляді такої формули:

де ) -- імовірність того, що респондент s з певним значенням в обере варіант відповіді k на пункт тесту і.

Графіки функцій мають вигляд кривих, побудованих для кожного варіанту відповіді кожного з пунктів тесту -- кривих відповідей для категорій (category response curves). Наприклад, якщо індикатори мають 7-бальну порядкову шкалу, для кожного з них будується графік, на який нанесено 7 кривих. За допомоги їх можна візуально відобразити імовірність вибору варіанта відповіді k на той чи інший пункт тесту для кожного значення в.

У сучасній теорії тестів використовують поняття «інформація». Інформацію можна визначити як кількісний показник знань про латентну змінну, отриману на підставі балу пункту тесту чи загального балу за шкалою [Nugent, 2017]. Кількість інформації для пункту тесту залежить від значень параметра дискримінації а та параметрів розташування b. Чим більше значення а, тим точніше цей пункт дає змогу оцінити значення латентної змінної. Також чим більша відстань між значеннями параметрів b, тим точніше пункт тексту дає змогу оцінити значення латентної змінної [Bean, 2021]. Визначити, наскільки точно кожен з пунктів дає змогу оцінити значення в, можна графічно, за допомоги інформаційних кривих (item information curves). Чим більшою є площа під кривою, тим точніше цей пункт тесту дає змогу оцінити значення в.

Модель ґрадуйованих відповідей дає змогу згенерувати значення в; ця змінна і буде шуканим індексом. в набуває як додатних, так і від'ємних значень, нерідко має стандартний нормальний розподіл із середнім значенням 0 та стандартним відхиленням 1. Це може викликати незручності в інтерпретації змінної. Модель ґрадуйованих відповідей дає змогу співвіднести значення змінної в з очікуваними значеннями адитивного індексу Якщо точніше, то модель ґрадуйованих відповідей співвідносить значення в з істинними балами (true scores). Істинний бал -- це сумарний бал відповідей респондента на індикатори тесту. Саме таким чином розраховується адитивний індекс.. Графічно це можна зобразити у вигляді характеристичної кривої для тесту (test characteristic curve). Крім того, можна зберегти значення змінної в у шкалі значень адитивного індексу, що полегшує її подальшу інтерпретацію. В цьому полягає перевага моделі ґрадуйованих відповідей порівняно з моделями конфірматорного факторного аналізу. Останні теж можуть бути використані для обрахунку значень індексів, що враховують різну вагу індикаторів та відстані між варіантами відповідей для кожного з них, але не пропонують інструментів їх перетворення в іншу шкалу.

Методика GSR-5: побудова індексу

Схарактеризувавши модель ґрадуйованих відповідей, перейдемо безпосередньо до побудови індексу для індикаторів методики GSR-5 Від словосполучення «generalized state reality». Як можна здогадатися з назви, методика включає 5 індикаторів., розробленої С. Дембіцьким [Дембіцький, 2022]. Кожен з них має 3-бальну порядкову шкалу Кожен з пунктів включає варіант «Важко відповісти», а отже, вони мають номінальну шка-лу. Цю альтернативу було перекодовано у пропущені значення, таким чином, змінні стали порядковими. (див. табл. 1). Методика вимірює загальні установки щодо держави загального добробуту. Вони характеризують фонове ставлення населення до своєї країни (а саме до України). З одного боку, це ставлення зумовлене особливостями функціонування державних інститутів, подіями, що мають місце в Україні. З іншого боку, воно визначається стереотипними оцінками цих інститутів і подій. Індикатори методики GSR-5 стосуються різних часових вимірів. Пункти B4 і B2 характеризують уявлення респондентів про минуле та майбутнє української держави. Решта індикаторів стосуються уявлень про теперішній стан справ у країні. Ми спиралися на дані опитування Соціологічної групи «Рейтинґ», проведеного у травні 2022 року. Застосовувався метод CATI, вибіркова сукупність становила 2000 респондентів, що репрезентували населення України віком від 18 років і старше Детальнішу інформацію про опитування групи «Рейтинґ» та його результати мож-на переглянути за посиланням: https://ratmggroup.ua/research/ukrame/dvenadcatyy_obsche- nacionalnyy_opros_dinamika_ocenki_obraza_gosudarstva_18-19_maya_2022.html.

Таблиця 1

Індикатори GSR-5

Індикатори

Варіанти відповідей

В1. Як Ви оцінюєте ефективність української держави на цьому етапі?

1. Центральні органи влади майже не справляються зі своїми обов'язками

2. Частково справляються

3. Справляються майже зі всіма своїми обов'язками

В2. Що ви думаєте про майбутнє України?

1. Найімовірніше ситуація буде погіршуватися

2. Ситуація не буде погіршуватися, але навряд чи покращиться

3. Найімовірніше ситуація буде покращуватися

В3. Якими, на Ваш погляд, є умови життя в Україні для більшості населення?

1. Загалом погані

2. Загалом задовільні

3. Загалом гарні

В4. Що Ви скажете про досягнен

ня та невдачі України, починаючи з 1991 року і до сьогоднішнього дня?

1. Переважали невдачі

2. Невдачі і досягнення компенсували одне одного

3. Переважали досягнення

В5. Якою мірою Ви задоволені подіями, які відбуваються в нашій країні зараз?

1. Радше не задоволені

2. Наскільки задоволені, настільки і не задоволені

3. Радше задоволені

Вважається, що «чим більшою мірою, на думку дослідника, результати вимірювання зумовлені різними дискурсами і/або навколишньою соціальною дійсністю респондента, тим вагомішою є необхідність конструювання індексу» [Дембіцький, 2019: с. 269]. Вище зазначалося, що загальні установки щодо держави загального добробуту залежать від особливостей функціювання державних інститутів, від подій, що відбуваються в країні. Стереотипні уявлення респондентів про роботу державних інститутів та щодо подій в Україні, зі свого боку, теж чинять вплив. Однак, по-перше, ці стереотипні уявлення сформовані зовнішніми чинниками. Зокрема, тим, як у тих чи інших ЗМІ подається інформація про ситуацію в країні. По-друге, респонденти можуть переглянути власні стереотипні уявлення у відповідь на зміни, що відбуваються в країні. З цього робимо висновок, що результати вимірювання все ж досить суттєво визначаються навколишньою дійсністю респондента. Це свідчить на користь того, що ми можемо будувати індекс для індикаторів методики GSR-5.

Рис. 1. Модель конфірматорного факторного аналізу (факторні навантаження та дисперсії стандартизовано)

Спершу визначимо, чи має сенс побудова адитивного індексу для пунктів методики. Слід переконатися, що індикатори мають однакову вагу. З цією метою було проведено конфірматорний факторний аналіз (КФА) у програмному середовищі R (пакет «lavaan»). Позаяк дані виміряні у порядковій шкалі, було застосовано метод DWLS, адже він забезпечує більш точні оцінки параметрів [Mindrila, 2010: p. 61]. Модель КФА передбачала виокремлення однієї латентної змінної, до якої входили всі індикатори методики GSR-5, що мали однакові факторні навантаження (див. рис. 1). Аналіз відповідності моделі даним оцінювався за показниками CFI, TLI, RMSEA, SRMR Значення CFI (Comparative Fit Index) знаходяться в діапазоні від 0 до 1. TLI (Tucker-Lewis Index) набуває значень від 0 до 1, але подекуди вони можуть виходити за вказані межі. Зна-чення RMSEA (Root Mean Square Error of Approximation) та SRM(S)R (Standardized Root Mean Square Residual) перебувають в межах від 0 до 1.. Якщо значення CFI та TLI перевищують 0,95, а значення RMSEA та SRMR є меншими за 0,06 та 0,08 відповідно, це свідчить про хорошу відповідність моделі даним [West et al., 2012].

Як виявилося, модель КФА не демонструє прийнятної відповідності даним: значення CFI становить 0,838, значення TLI -- 0,820, а RMSEA та SRMR -- 0,091 та 0,092 відповідно. Можна припустити, що індикатори мають різну вагу, а отже, виникає потреба в альтернативній моделі. Тож побудовано одновимірну модель ґрадуйованих відповідей (пакет «mirt» в R).

Щоб перевірити відповідність моделі ґрадуйованих відповідей (моделі GRM) даним, застосовувалася статистика С2. Її розроблено для порядкових шкал; її перевагою є також те, що вона не накладає обмежень на кількість індикаторів залежно від кількості варіантів відповіді на кожен з них На відміну від статистики М2*, також розробленої для порядкових змінних (хоча загалом вона може бути застосована і для дихотомічних змінних). Вона накладає обмеження на кіль-кість індикаторів залежно від кількості варіантів відповіді. Наприклад, для розрахунку ста-тистики потрібно щонайменше 6 дихотомічних змінних, а якщо індикатори мають 5-бальну шкалу, їх потрібно не менш як 12 [Paek, Cole, 2020; Cai, Hansen, 2013]. Нагадаємо, що ми маємо справу з 5 індикаторами, які мають 3-бальну шкалу; якщо керуватися вказаними критеріями, ми не маємо змоги розрахувати статистику М2*. [Paek, Cole, 2020; Cai, Monroe, 2014]. Для статистики розраховується рівень значимості. Якщо він перевищує 0,05, модель відповідає даним. У нашому випадку рівень значимості для С2 перевищує 0,05, що свідчить про відповідність моделі GRM даним.

Відповідність моделі даним також оцінювалась за показниками CFI, TLI, RMSEA, SRMSR. Якщо CFI та TLI більші або дорівнюють 0,95, а RMSEA та SRMSR не перевищують 0,05, це свідчить про хорошу відповідність моделі даним [Noe-Grijalva et al., 2022]. Значення CFI та TLI становлять 0,999, RMSEA -- 0,007, SRMSR -- 0,015. Такі значення свідчать про хорошу відповідність моделі GRM даним. Так як побудована нами модель є одновимірною і демонструє гарну відповідність даним, це свідчить на користь того, що однієї латентної змінної достатньо для пояснення зв'язків між відповідями на пункти методики GSR-5.

Також слід визначити, наскільки пункти методики відповідають моделі GRM. У разі невідповідності індикатора моделі ми, за потреби, можемо його вилучити. Для оцінювання відповідності пунктів застосовувалась статистика S-%2, на її основі розраховується показник RMSEA. Якщо його значення для індикатора не перевищує 0,06, він добре відповідає побудованій моделі [Bean, 2021]. Значення RMSEA менші, ніж 0,06, для кожного з індикаторів методики, а отже, всі вони добре відповідають побудованій моделі (див. табл. 2).

Таблиця 2

Відповідність індикаторів методики GSR-5 побудованій моделі

Індикатори

RMSEA на підставі S-%2

В1. Як Ви оцінюєте ефективність української держави на цьому етапі?

0,030

В2. Що ви думаєте про майбутнє України?

0,013

В3. Якими, на Ваш погляд, є умови життя в Україні для більшості населення?

0,000

В4. Що Ви скажете про досягнення та невдачі України, починаючи з 1991 року і до сьогоднішнього дня?

0,019

В5. Якою мірою Ви задоволені подіями, які відбуваються в нашій країні зараз?

0,031

Пересвідчившись, що модель демонструє хорошу відповідність даним, перейдемо до аналізу значень її параметрів -- параметра дискримінації а і параметрів розташування b (див. табл. 3).

Як уже зазначалося, параметр а характеризує силу зв'язку між пунктами та латентною змінною в. Індикатор В1 демонструє найбільшу силу зв'язку з латентною змінною, а В5 -- найменшу. Різні значення параметру дискримінації вказують на те, індикатори мають неоднакову вагу. Модель GRM дає змогу цю обставину взяти до уваги при розрахунку значень латентної змінної.

Таблиця 3

Параметри моделі GRM

Індикатори

a

b1

b2

В1. Як Ви оцінюєте ефективність української держави на цьому етапі?

1,636

-2,617

-0,170

В2. Що ви думаєте про майбутнє України?

1,571

-2,212

-1,113

В3. Якими, на Ваш погляд, є умови життя в Україні для більшості населення?

1,327

-0,962

2,225

В4. Що Ви скажете про досягнення та невдачі України, починаючи з 1991 року і до сьогоднішнього дня?

0,562

-1,499

2,703

В5. Якою мірою Ви задоволені подіями, які відбуваються в нашій країні зараз?

0,474

0,299

3,429

Також маємо параметри b: їхня кількість становить n - 1, де n -- кількість варіантів відповіді, що мають індикатори. В нашому випадку індикатори мають по 3 варіанти відповідей, тож у нас два параметри b. Параметр b інтерпретується як значення в, для якого респондент з імовірністю 0,5 обере варіант відповіді k і більше для того чи іншого пункту. Тобто якщо b1 становить -2,617, це означає, що для в = -2,617 респондент з імовірністю 0,5 обере варіанти відповіді «Частково справляються» або «Справляються майже зі всіма своїми обов'язками» для індикатора B1. А коли b2 дорівнює -0,170, це означає, що для вказаного значення в респондент з імовірністю 0,5 обере варіант «Справляються майже зі всіма своїми обов'язками» для індикатора B1. Значення параметрів b також показують, які ділянки шкали в охоплюють варіанти відповіді того чи іншого індикатора. Так, індикатори B1 і B2 характеризуються найбільшою силою зв'язку з латентною змінною, але краще «працюють» для лівої (від'ємної) частини шкали в. B3 і B4 покривають ліву і праву (додатну) частини шкали змінної в. А індикатор B5 краще «працює» для правої частини шкали в.

Рис. 2. Криві відповідей для категорій (модель GRM)

Імовірність вибору варіантів відповіді кожного з пунктів методики GSR-5 можна зобразити у вигляді кривих відповідей для категорій (див. рис. 2). Як бачимо, перший варіант відповіді (P1) для індикаторів B1-B4 покриває, більшою мірою, від'ємну частину шкали в. Для індикатора B5 він охоплює фактично всю шкалу латентної змінної. Третій варіант відповіді (P3) переважно покриває додатну частину шкали в. Для пункту B2 він охоплює значну ділянку шкали латентної змінної. Другий варіант відповіді (P2) для індикаторів B1 і B2 покриває переважно від'ємну частину шкали. Причому для пункту B2 цей варіант відповіді охоплює порівняно невелику ділянку шкали в. Для індикатора B3 другий варіант відповіді охоплює і додатні, і від'ємні значення шкали латентної змінної. Те саме можна сказати і про індикатори B4 й B5. Ми бачимо, що деякі варіанти відповідей для певних пунктів можуть охоплювати значну ділянку шкали латентної змінної, а деякі -- лише її невелику частину. Так, перший і другий варіант відповіді індикатора B2 займають майже всю ділянку шкали змінної в. Тож можна поставити під сумнів те, що для кожного з пунктів методики GSR-5 відстані між парами сусідніх альтернатив сприймаються респондентами однаково. Модель GRM при побудові латентної змінної враховує відстані між варіантами відповідей кожного з індикаторів.

Аналіз кривих відповідей для категорій допомагає в подальшій інтерпретації значень латентної змінної. в може набувати як додатних, так і від'ємних значень. Перший варіант відповіді для індикаторів методики характеризує неґа- тивні уявлення про Україну. І цей же варіант відповіді охоплює, як правило, ліву частину шкали в. Тобто від'ємні значення латентної змінної характеризують не- ґативні установки щодо держави загального добробуту. Третій варіант відповіді покриває переважно праву частину шкали в і характеризує позитивні уявлення про Україну. Тобто додатні значення в свідчать про позитивні установки щодо держави загального добробуту.

Побудуємо інформаційні криві для індикаторів методики (див. рис. 3). Чим більша площа під кривою, тим точніше пункт методики дає змогу оцінити значення латентної змінної. Найбільшою площею під кривою характеризуються пункти B1 і B2, а найменшою -- індикатори B4 та B5. Причому B1 та B2 точніше оцінюють значення від'ємної частини шкали латентної змінної. Особливо добре це помітно для пункту B2. А індикатор B3, хоч і характеризується помітно меншою площею під кривою, «працює».

Нарешті побудуємо характеристичну криву для тесту, яка дасть змогу співвіднести значення змінної в та адитивного індексу (див. рис. 4). Значення останнього перебуває в межах від 5 до 15. Чим більшим є значення індексу, тим більш позитивними є загальні установки щодо держави загального добробуту. За допомоги цієї кривої ми можемо оцінити, яке значення адитивного індексу відповідає тому чи іншому значенню в. Так, якщо в дорівнює -3, значення адитивного індексу становить 6,25. А якщо в становить 3, значення адитивного індексу дорівнює 13,42.

Рис. 3. Інформаційні криві (модель GRM) Соціологія: теорія, методи, маркетинг, 2022, 3

Ми маємо змогу зберегти в у шкалі значень адитивного індексу. Причому, як видно з характеристичної кривої, перетворення значень латентної змінної в у шкалу значень адитивного індексу є нелінійним.

Новостворений індекс характеризується кращою диференціювальною здатністю (його шкала має більшу кількість ґрадацій), ніж адитивний індекс. Для обох індексів -- адитивного та розрахованого за допомоги моделі GRM (індекс GRM) -- було побудовано боксплоти (див. рис. 5).

Рис. 4. Характеристична крива для тесту (модель GRM)

Рис. 5. Порівняння значень індексів (адитивного та розрахованого за допомоги моделі GRM)

Бачимо, що адитивний індекс має більший розмах та більший міжквартиль- ний розмах. Значення першого квартилю для адитивного індексу менше, а тре-тього квартилю більше, ніж для розрахованого за допомоги моделі GRM. Мі-німальне значення для адитивного індексу менше, а максимальне є більшим порівняно з індексом GRM. При цьому медіани для них візуально не дуже відрізняються. Для адитивного індексу медіанне значення становить 11,00, а для індексу GRM -- 10,74.

Висновки

Ми вели мову про побудову індексу для індикаторів методики GSR-5 за до-помоги моделі ґрадуйованих відповідей. Найпростіший спосіб його конструю-вання -- знайти сумарний бал відповідей респондента на пункти методики. Адитивний індекс передбачає, що індикатори мають однакову вагу. Однак побу-дувавши однофакторну модель КФА з однаковими факторними навантаження-ми для пунктів, ми з'ясували, що вона не демонструє прийнятної відповідності даним. Відтак розрахунок адитивного індексу не є доцільним. Тож було засто-совано одновимірну модель ґрадуйованих відповідей, яка продемонструвала хорошу відповідність даним. З одного боку, такий спосіб розрахунку індексу є більш трудомістким, ніж обрахунок адитивного індексу. З іншого боку, індекс, побудований із використанням моделі ґрадуйованих відповідей, має кілька пе-реваг. По-перше, він враховує те, що індикатори мають різну вагу та роблять неоднаковий внесок в індекс. По-друге, враховано відстані між варіантами відповідей, адже вони не обов'язково є однаковими. Завдяки цьому індекс має вищу диференціювальну здатність порівняно з адитивним. Крім того, модель ґрадуйованих відповідей з огляду на полегшення інтерпретації дає змогу подати бали в у шкалі значень адитивного індексу. У цьому полягає її перевага порівняно з моделями конфірматорного факторного аналізу, які теж можуть бути викори-стані для побудови індексів, але не дають змоги здійснювати перетворення ла-тентних змінних з однієї шкали в іншу.

Модель ґрадуйованих відповідей має справу зі змінними з порядковою шка-лою. А індикатори методики GSR-5 включають варіант відповіді «Важко відпо-вісти», що робить 'їх номінальними. Після перекодування альтернативи «Важко відповісти» у пропущені значення (як це було зроблено в нашому випадку) змінні стають порядковими. Однак ми втрачаємо певну кількість респондентів, котрі теж надали відповіді на ті чи інші пункти методики GSR-5. Тож наступним кроком може стати побудова інтеґрального показника, який уможливить ура-хування відповідей тих респондентів, котрі обрали варіант «Важко відповісти».

Джерела

індекс індикатор добробут соціальний

Головаха, Е., Панина, Н. (1997). Интегральный индекс социального самочувствия (ИИСС): конструирование и применение социологического теста в массовых опросах. Киев: Ин-т со-циологии НАН Украины.

Дембицкий, С. (2016). Социологические тесты: сущность и валидизация. Социология: теория, методы, маркетинг, 3, 140-155.

Дембіцький, С. (2019). Розробка соціологічних тестів: методологія і практики її застосу-вання. Київ: Інститут соціології НАН України.

Дембіцький, С. (2022). Загальні установки щодо держави загального добробуту: концепт та особливості вимірювання. [Препринт наданий автором.]

Bean, G.J., Bowen, N.K. (2021). Item response theory and confirmatory factor analysis: Comple-mentary approaches for scale development. Journal of Evidence-Based Social Work, 18 (6), 597-618.

Bean, J. (2021). Using R for Social Work Research. Retrieved from: https://bookdown.org/bean_ jerry/using_r_for_social_work_research/

Cai, L., Hansen, M. (2013). Limited-information goodness-of-fit testing of hierarchical item factor models. British Journal of Mathematical and Statistical Psychology, 66 (2), 245-276. DOI: https:// doi.org/10.1111/j.2044-8317.2012.02050.x

Cai, L., Monroe, S. (2014). A new statistic for evaluating item response theory models for ordinal data (CRESSTReport 839). Los Angeles: University of California, National Center for Research on Evaluation, Standards, and Student Testing (CRESST).

de Ayala, R.J. (2022). The theory and practice of item response theory. S.l.: Guilford Press.

Meade, A.W., Lautenschlager, G.J. (2004). A comparison of item response theory and confirmatory factor analytic methodologies for establishing measurement equivalence/invariance. Organizational Research Methods, 7 (4), 361-388. DOI: https://doi.org/10.1177/1094428104268027

Mindrila, D. (2010). Maximum likelihood (ML) and diagonally weighted least squares (DWLS) estimation procedures: A comparison of estimation bias with ordinal and multivariate non-normal data. International Journal of Digital Society, 1 (1), 60-66.

Noe-Grijalva, M., Polo-Ambrocio, A., Gomez-Bedia, K., Caycho-Rodriguez, T. (2022). Spanish Translation and Validation of the COVID Stress Scales in Peru. Frontiers in psychology, 13, 840302. DOI: https://doi.org/10.3389/fpsyg.2022.840302

Nugent, W.R. (2017). Understanding DIF and DTF: Description, methods, and implications for social work research. Journal of the Society for Social Work and Research, 8 (2), 305-334. DOI: https:// doi.org/10.1086/691525

Paek, I., Cole, K. (2020). Using R for item response theory model applications. S.l.: Routledge. 36

R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing. Vienna. Retrieved from: https://www.R-project.org/

Samejima, F. (1997). Graded response model. In: WJ. Van der Linden, R.K. Hambleton (Eds.), Handbook of modern item response theory (pp. 85-100). New York: Springer.

West, S.G., Taylor, A.B., Wu, W. (2012). Model fit and model selection in structural equation modeling. In: R.H. Hoyle (Ed.), Handbook of structural equation modeling (pp. 209-231). S.l.: Guilford Press.

References

Bean, G.J., Bowen, N.K. (2021). Item response theory and confirmatory factor analysis: Complementary approaches for scale development. Journal of Evidence-Based Social Work, 18 (6), 597-618.

Bean, J. (2021). Using R for Social Work Research. Retrieved from: https://bookdown.org/bean_ jerry/using_r_for_social_work_research/

Cai, L., Hansen, M. (2013). Limited-information goodness-of-fit testing of hierarchical item factor models. British Journal of Mathematical and Statistical Psychology, 66 (2), 245-276. DOI: https://doi.org/10.1111/j.2044-8317.2012.02050.x

Cai, L., Monroe, S. (2014). A new statistic for evaluating item response theory models for ordinal data (CRESST Report 839). Los Angeles: University of California, National Center for Research on Evaluation, Standards, and Student Testing (CRESST).

de Ayala, R.J. (2022). The theory and practice of item response theory. S.l.: Guilford Press.

Dembitskyi, S. (2016). Sociological tests: the essence and validation. [In Russian]. Sociology: theory, methods, marketing, 3, 140-155. [=Дембицкий 2016].

Dembitskyi, S. (2019). Development of sociological tests: methodology and practice of its application. [In Ukrainian]. Kyiv: Institute of Sociology, National Academy of Sciences of Ukraine. [=Дембіць- кий 2019].

Dembitskyi, S. (2022). General attitudes towards the general welfare state: concept and measurement. [In Ukrainian]. Preprint provided by the author. [=Дембіцький 2022].

Golovakha, E., Panina, N. (1997). Integral index of social well-being (IISS): Design and application of a sociological test in mass surveys. [In Russian]. Kyiv: Institute of Sociology, National Academy of Sciences of Ukraine. [=Головаха, Панина 1997].

Meade, A.W., Lautenschlager, G.J. (2004). A comparison ofitem response theory and confirmatory factor analytic methodologies for establishing measurement equivalence/invariance. Organizational Research Methods, 7 (4), 361-388. DOI: https://doi.org/10.1177/1094428104268027

Mindrila, D. (2010). Maximum likelihood (ML) and diagonally weighted least squares (DWLS) estimation procedures: A comparison of estimation bias with ordinal and multivariate non-normal data. International Journal of Digital Society, 1 (1), 60-66.

Noe-Grijalva, M., Polo-Ambrocio, A., Gomez-Bedia, K., Caycho-Rodriguez, T. (2022). Spanish Translation and Validation of the COVID Stress Scales in Peru. Frontiers in psychology, 13, 840302. DOI: https://doi.org/10.3389/fpsyg.2022.840302

Nugent, W.R. (2017). Understanding DIF and DTF: Description, methods, and implications for social work research. Journal of the Society for Social Work and Research, 8 (2), 305-334. DOI: https:// doi.org/10.1086/691525

Paek, I., Cole, K. (2020). Using R for item response theory model applications. S.l.: Routledge.

R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing. Vienna. Retrieved from: https://www.R-project.org/

Samejima, F. (1997). Graded response model. In: WJ. Van der Linden, R.K. Hambleton (Eds.), Handbook of modern item response theory (pp. 85-100). New York: Springer.

West, S.G., Taylor, A.B., Wu, W. (2012). Model fit and model selection in structural equation modeling. In: R.H. Hoyle (Ed.), Handbook of structural equation modeling (pp. 209-231). S.l.: Guilford Press.

Размещено на Allbest.ru


Подобные документы

  • Специфікація показників якості й типологія шкал вимірювання. Рівномірність і нерівномірність шкал інтенсивних властивостей. Структура інтегрального кількісного показника політичної участі, конструювання її емпіричної моделі стратифікації та індексу рівня.

    курсовая работа [719,6 K], добавлен 06.10.2012

  • Методи збирання інформації в соціологічних дослідженнях. Процес соціологічного дослідження. Групове опитування у трудових колективах. Масові і спеціалізовані опитування. Адаптація респондента до завдань дослідження. Одержання достовірних відповідей.

    контрольная работа [25,7 K], добавлен 25.04.2009

  • Сущность и основные характеристики общественного мнения. Становление и развития методики опросов общественного мнения в США. Практическое применение методики Гэллапа на примере социологического исследования "Каким видят россияне будущего президента".

    курсовая работа [48,5 K], добавлен 30.01.2011

  • Загальні критерії наукового дослідження в соціології. Систематичність при проведенні спостережень, обробці матеріалу і розгляді результатів. Способи і методи збору соціологічного матеріалу для отримання відповідей на питання. Типи соціологічних теорій.

    реферат [24,4 K], добавлен 25.07.2010

  • Сучасна психодинамічна модель соціальної роботи — це модель практики, яка фокусується на внутрішньому світі індивіда. Психодинамічна, когнітивна, біхевіористська моделі методики. Гуманістичні моделі. Теоретичне осмислення методів соціальної роботи.

    реферат [21,3 K], добавлен 18.08.2008

  • Розгляд конвергенції як обмеженої кількості побічних ефектів глобалізаційного процесу. Сучасна проблема держави загального добробуту і глобалізації. Необхідність створення глобального політичного контролю над світовим ринком. Криза інституційного устрою.

    реферат [33,5 K], добавлен 14.01.2011

  • Класифікація зайнятості на ринку праці Полтавського регіону. Три основні проблеми, існування яких потребує змін стратегії сучасної держави загального добробуту. Короткий зміст Конвенції 102. Основні параметри здійснення соціальної політики в суспільстві.

    контрольная работа [134,1 K], добавлен 24.12.2010

  • Характеристика основних положень теорії соціальної мобільності П. Сорокіна. Розгляд засад соціологічного прогнозування. Обчислення соціометричних індексів, побудова соціограми. Підготовка програми дослідження на тему "Трудові конфлікти в організації".

    контрольная работа [95,9 K], добавлен 20.09.2014

  • Опис організації та методів збору статистичної інформації. Зведення та групування даних по віку, професії та заробітній платі персоналу. Визначення відносних та середніх величин, побудова рядів динаміки, перенесення даних на генеральну сукупність.

    курсовая работа [492,9 K], добавлен 22.10.2014

  • Исследование методов и их комбинаций, используемых для достижения оптимального уровня этнопсихологического исследования. Анализ факторов, определяющих возникновение межэтнических конфликтов: этническое деление территорий, развитие культуры общества.

    реферат [34,3 K], добавлен 26.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.