Теория и методология выборки
Главные значения понятия выборки в статистике и социологии. Основное правило ее составления. Содержание разновидностей статистической выборки: случайной (вероятностной) и неслучайной (невероятностной). Разграничения и процедура расчета ее объемов.
Рубрика | Социология и обществознание |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 02.06.2011 |
Размер файла | 50,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Курсовая работа
по дисциплине «Методология и методика социологических исследований»
Тема: «Теория и методология выборки»
План
Введение
1. Основные понятия и сущность выборочного метода
2. Типы и методы выборки
2.1 Методы вероятностной (случайной) выборки
2.2 Методы невероятностной (неслучайной) выборки
3. Расчет объема и ошибки выборки
Заключение
Введение
Сущность выборочного метода заключается в том, что на основе изучения некоторой части сравнимых по избранным параметрам объектов (в социологии это называется выборочной совокупностью) можно сделать неполное, но правильное умозаключение обо всей совокупности исследуемых объектов (генеральной совокупности). Не случайно среди социологов популярен афоризм о том, что выборка есть прикладная философия социологии. Качество выборки - важнейший критерий точности и качества всего социологического исследования. Только корректная организация выборки в социологических исследованиях дает возможность получить правильное и точное социологическое знание.
Выборочный метод занимает в социологии особое место. В этой области широко используются достижения математической и общей статистики, сложилась особая терминология, частный категориальный аппарат.
Этим и объясняется актуальность выбранной темы.
Целью данной курсовой работы является рассмотрение теории и методологии выборки, ее специфики.
1. Основные понятия и сущность выборочного метода
Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование именуется выборочным.
Выборочное обследование представляет собой способ систематического сбора данных о поведении и установках людей посредством опроса специально подобранной группы респондентов, дающих информацию о себе и своем мнении. Оно является более экономичным и не менее надежным методом, чем сплошное исследование, хотя требует более изощренной методики и техники.
Выборка или выборочная совокупность -- множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
При построении социологической выборки используется множество специальных терминов, в том числе два важнейших -- генеральная и выборочная совокупности.
Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки, или выборочной совокупности. Объем генеральной совокупности обозначается символом N, а объем выборочной совокупности -- п. Обычно эти символы размещают в заголовке таблице, которая получилась у социолога после анализа данных, либо в подлежащем таблицы.
Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно -- на основе информации о выборочной совокупности).
В англоязычной литературе дословного аналога термину «репрезентативность» не существует. Вместо него используется другой -- «популяция» (population), который, как и русское слово «генеральная совокупность», имеет два значения. Первое -- генеральная совокупность, т.е. все люди, на которых мы хотим распространить полученные в своем исследовании выводы и на которых направлен наш теоретический интерес. В англоязычных источниках так и пишут: «population of interest».
Второе значение -- список людей, на основании которого составляется позже выборочная совокупность. Их называют единицами наблюдения. Они считаются элементами генеральной совокупности. Список единиц наблюдения, который нумеруется с использованием таблицы случайных чисел, в отечественной литературе специального названия не имеет, как не имеет он такового и в англоязычной социологии.
Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях.
¦ Выборка (как результат действия) -- представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности.
¦ Выборка (как способ или процесс действия) -- способ отбора объектов генеральной совокупности в выборочную.
Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).
Выборочная совокупность -- уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т.е. темой, выступает экономическая активность пенсионеров. Все пенсионеры -- пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет -- будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тыс. пенсионеров. Это и станет его выборочной совокупностью.
Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку. Но как этого добиться? Прежде всего надо узнать как можно больше свойств, или параметров генеральной совокупности, например разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией, конкретные величины возраста -- значениями, а совокупность всех значений образует переменную.
Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0--5, 6--10, 11--15 лет и т.д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.
Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность -- это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса5. Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее.
Итак, совокупность людей, на которую вы распространяете свои выводы, называется генеральной совокупностью, популяцией, группой интереса (такое название происходит от направленности теоретического интереса ученого).
Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность, решают математические методы. Если социолог намеревается взглянуть на Афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать придется небольшую часть -- выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, возможно, затрудняющих его поиск, должен иметь одинаковую вероятность попасть в выборочную совокупность.
Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов -- об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.
2. Типы и методы выборки
Типами выборки называются основные разновидности статистической выборки: случайная (вероятностная) и неслучайная (невероятностная). Вместо термина «тип выборки» часто употребляют слова «вид» и «разновидность», что также правильно. Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.
Методом выборки будем называть способ построения того типа выборки, название которого этот метод носит, например метод вероятностной выборки. В социологии методом называют основной способ сбора, обработки или анализа данных; правила и процедуры, с помощью которых устанавливается связь между фактами, гипотезами и теориями.
Для каждого типа выборки разработаны свои математические аппараты и процедуры. Так, в простой случайной выборке все элементы из списка людей, составляющих основу выборки, пронумеровываются и с помощью таблицы случайных чисел из них отбирается искомая совокупность.
2.1 Методы вероятностной (случайной) выборки
Случайная (вероятностная) выборка -- это выборка, для которой каждый элемент генеральной совокупности имеет определенную, заранее заданную вероятность быть отобранным. Это позволяет исследователю рассчитать, насколько правильно выборка отражает генеральную совокупность, из которой она выделена (спроектирована). Такую выборку иногда называют еще случайной.
Вероятностные методы включают:
¦ простой случайный отбор,
¦ систематический отбор,
¦ кластерный отбор,
¦ стратифицированный отбор.
Реализовать случайную выборку можно двумя приемами: лотерейным методом и с помощью таблицы случайных чисел. С помощью случайной выборки строится подавляющее большинство телефонных опросов и опросов на основе избирательных списков. Для построения такой выборки необходимо иметь полный список всех элементов генеральной совокупности.
Простой случайный отбор
Простой случайный отбор предполагает, что вероятность быть включенным в выборку известна и является одинаковой для всех единиц совокупности. Он реализуется двумя методами:
¦ отбор вслепую (другое название -- метод лотереи или жребия),
¦ отбор не вслепую (происходит с помощью таблицы случайных чисел).
Итак, в одном случае вы осуществляете свой выбор не глядя, в другом -- все, осознавая, но для того, чтобы самому не вмешаться и ничего не испортить, обращаетесь к специальным таблицам.
Кроме того, простой случайный отбор подразделяется на две разновидности уже по другому критерию, а именно -- возвращению или невозвращению лотерейного шара (вместо него может быть фамилия респондента) обратно в корзину. В этом случае выделяют:
¦ случайный повторный (с возвращением) отбор,
¦ случайный бесповторный (без возвращения) отбор.
В чем сходство и различие двух классификаций? В первом случае -- вслепую/не вслепую -- ученый мог смотреть на то, как осуществляется отбор, хотя никак не мог ему помешать (если отбор проводился вслепую), или выбор осуществляли не его руки, вынимающие из корзины шар, а таблица случайных чисел. Во втором случае -- повторный/бесповторный -- дело заключается не в исследователе (если отбор проводился не вслепую), а в лотерейном шаре: его либо возвращают для нового выбора, либо не возвращают и продолжают процесс без него.
Соединив оба членения простого случайного метода в декар-тову систему координат, получим четыре модальности.
Сразу оговоримся, что получившаяся схема не является в строгом смысле изображением логического квадрата, с помощью которого принято показывать отношения совместимости, эквивалентности, противоположности (контрарности), частичной совместимости (субконтрарности), подчинения и противоречивости суждений. В нашей схеме лишь некоторые квадраты дают новый тип случайного отбора или свидетельствуют о том, что данная комбинация действий осуществима. При использовании метода выборки вслепую единицы генеральной совокупности (фамилии, названия или просто номера из списка) можно вносить в карточки, а карточки в перемешанном виде поместить в какую-то непрозрачную емкость (ящик, коробку). Из этой емкости кто-то случайным образом вы-тягивает число карточек, определяемое объемом выборки. После каждого вытягивания и регистрации карточки ее можно возвращать, а можно не возвращать назад. В первом случае говорят о повторном, во втором -- о бесповторном отборе. Их комбинация дает два квадрата, имеющих реальное содержание: можно вслепую выбирать из корзины шары и возвращать их для нового выбора, а можно их откладывать в сторону. Однако выборка не вслепую предполагает использование таблицы случайных чисел. Возвращать в нее выбранный номер невозможно, стало быть, образуемые вдоль этой оси квадраты не являются реальными.
Вероятностную выборку целесообразно применять только при наличии соответствующих условий. Первое условие осуществления вероятностной выборки -- наличие полного списка всех элементов генеральной совокупности (отсутствие или недоступность которого чаще всего и препятствует ее реализации) от 1 до N, где N-- общее число всех элементов. Если же он имеется, то производится нумерация, после чего можно использовать вышеописанные методики. При использовании лотерейного метода (или метода жребия) жетоны с номерами всех элементов помещают в урну, тщательно перемешивают и извлекают последовательно п жетонов, где п -- число элементов выборочной совокупности. Элементы генеральной совокупности, имеющие номера, оказавшиеся на извлеченных жетонах, будут составлять выборочную совокупность. Это довольно трудоемкая и продолжительная (при больших размерах выборки) операция, к тому же достаточно трудоемкая, поскольку «для обеспечения равного шанса выбора требуется тщательное перемешивание жетонов»13 после каждой выемки очередного номера.
Второе условие вероятностной выборки -- хорошая перемешанность элементов генеральной совокупности. Если выборка элементов производится из ящика, то его содержимое следует тщательно перемешать и уже после этого брать карточки случайным образом. Только при таких условиях все они имеют одинаковую вероятность попасть в выборку. Часто для образования случайной выборки элементы генеральной совокупности предварительно нумеруются, а каждый номер записывается на отдельной карточке. В результате получается пачка карточек, число которых совпадает с объемом генеральной совокупности. После тщательного перемешивания из этой пачки берут по одной карточке. Объект (респондент), имеющий одинаковый номер с карточкой, считается попавшим в выборку. При этом возможны два принципиально различных способа образования выборочной совокупности.
Первый -- вынутая карточка после фиксации ее номера возвращается в пачку, после чего карточки снова тщательно перемешиваются. Повторяя такие выборки по одной карточке, можно образовать выборочную совокупность любого объема. Выборочная совокупность, образованная по такой схеме, получила название случайной возвратной выборки.
Второй-- каждая вынутая карточка после ее записи обратно не возвращается. Повторяя по такой схеме выборки по одной карточке, можно получить выборочную совокупность любого заданного объема. Выборочную совокупность, образованную по данной схеме называют случайной безвозвратной выборкой. Она возможна лишь в том случае, если из тщательно перемешанной пачки сразу берут нужное число карточек.
Заметим, что различие между случайными выборками с возвратом и без возврата стирается, если они составляют незначительную часть большой генеральной совокупности.
Систематический отбор является вторым по научной значимости, но первым по популярности употребления видом простого случайного отбора. Его называют еще механическим отбором и считают упрощенным вариантом простого случайного отбора.
Примером служат разного рода квартирные выборки: выбираются улицы, на которых интервьюер проводит квартирный опрос. Квартиры выбираются по определенной схеме (крайняя квартира справа от лестницы на последнем этаже первого подъезда и т.д.).
Если под рукой таблицы случайных чисел нет, а генсовокупность относительно невелика14, то можно воспользоваться алфавитным списком, например, персонала предприятия (картотека всегда есть в отделе кадров) или избирательного участка (при опросе по месту жительства). Процедура систематического отбора проста: количество единиц генеральной совокупности, предположим 2000 работников предприятия, делится на количество анкет, скажем 200, и определяется шаг выборки. Он предполагает, что, начиная с любого номера из списка, опрашивается каждый десятый (2000:200 = 10). В формализованном виде данная процедура выглядит так. Из пронумерованного списка через равные интервалы Ј отбирается заданное число респондентов. При этом шаг выборки к рассчитывается по простой формуле:
выборка статистика социология
где N-- численность генеральной совокупности, п -- численность выборочной совокупности.
Таким образом, шаг выборки, а его еще называют «интервалом скачка» или просто «интервалом», -- это математический показатель, рассчитанный как отношение объема генеральной совокупности к объему выборки. Он показывает, сколько номеров в списке фамилий людей, вошедших в генеральную совокупность, надо пропустить (через сколько перешагнуть), чтобы в итоге получить список выборочной совокупности. Буквально шаг выборки означает расстояние между соседними фамилиями респондентов, измеренное количеством отбракованных фамилий из списка генеральной совокупности.
Районированная и стратифицированная выборки
Если генеральная совокупность велика, а такое в эмпирическом исследовании случается очень часто, то приходится разделять обследуемую совокупность на более или менее однородные части, а затем осуществлять отбор единиц внутри этих частей. Такую раздробленную на части выборку правильнее всего было бы называть расслоенной. Однако в русском языке подобный термин не утвердился, видимо, как не соответствующий нормам правильного произношения.
Поскольку в отечественной социологии очень много иностранных слов -- и это правильно с точки зрения унификации научной терминологии, приведения ее к международным стандартам, -- то слову «расслоенная» попытались найти эквивалент. В числе претендентов оказались две наилучшие кандидатуры, а именно термины «районированная» и «стратифицированная».
В русском языке первое слово явно тяготеет к географическому языковому ареалу и обозначает территориальную зону. Поскольку генеральную совокупность, особенно очень большую, например население всей страны, можно разбивать, в том числе и по региональному признаку, в отечественной литературе утвердился термин «районированная выборка». Но наряду с тем генеральную совокупность можно расслаивать и по стратам (полу, возрасту, доходам и т.д.), получая в качестве критерия уже не географический район, а социальную группу.
В итоге сложилась практика различения двух разновидностей расслоенной выборки. Если деление происходит по стратам (социальным группам), то выборку именуют стратифицированной, если по экономико-географическим районам, то -- районированной.
В литературе (да и в маркетинговой практике) два термина -- районированная и стратифицированная выборки -- нередко считаются эквивалентными. Происходит это потому, что в основе той и другой лежит одна и та же процедура расслоения, а расслаивать в социологии можно двояко: либо по социальным группам (тогда речь идет о социальной структуре и стратификации как ее частном виде), либо по географическим районам. Когда объединяют оба понятия в одно, как правило, дают обобщающее определение подобной выборки, например, такое:
Районированная выборка -- вид выборки, при котором отбору предшествует процедура районирования (расслоения, стратификации), т.е. разделения исходной совокупности на статистически или качественно однородные подсовокупности, называемые слоями, стратами или типичными группами. Отбор единиц, который может носить как случайный, так и направленный характер, производится независимо из каждого слоя, поэтому районированная выборка равносильна ряду выборок, извлеченных из меньших совокупностей-страт15.
В этом определении исходное понятие «районированная выборка» без ущерба для дела можно заменить на «стратифицированную выборку». Таким образом, одинаково правильно будет как разделять одну выборку на две самостоятельные разновидности, районированную и стратифицированную, так и подавать их как единое целое. За единство двух приемов выступает практика социологических исследований. Оказывается, в крупномасштабных проектах социологи начинают с районированной выборки, а затем переходят на стратифицированную. Так, например, в обследованиях Центра «Социо-Экспресс» Института социологии РАН в основе построения районированной выборки лежат десять экономико-географических зон, в каждой из которых выделяются крупные города (численностью свыше 500 тыс. населения), средние города (50-500 тыс.), малые города (до 50 тыс.) или поселки городского типа, а также сельские населенные пункты. Внутри отобранных городов респондентов отбирают случайным методом. Репрезентативность контролируется по региональным пропорциям численности населения, пропорциям между городским и сельским населением, пропорциям между населением указанных типов населенных пунктов16.
В международной практике не используется русское слово «район» как географическая зона (ареал, регион, часть территории), поэтому здесь не встретишь и термина «районированная выборка». Вместо него употребляют термин «стратифицированная выборка», подразумевая, что, разбивая единое целое на части, не обязательно точно указывать, что они собой представляют -- группы или районы.
В таком случае стратифицированная выборка (stratified sampling) -- вероятностная выборка, обеспечивающая равномерное представительство в выборочной совокупности различных частей, типов, групп и слоев населения.
В английском языке слово «стратификация» мало чем отличается от слов «расслоение», «разделение», «разбиение». Это социологи придали стратификации социальный смысл, а в геологии, откуда мы позаимствовали термин, стратификация означает вертикальное расслоение земли на однородные пласты. Ни классов, ни доходов, ни социальных групп здесь нет.
Надо учитывать и другой нюанс. Дело в том, что в зарубежных словарях, прежде всего американских и главным образом ведущих, все, что связано с территориальным признаком, в том числе и расслоение по районам, относится к квотной выборке. К примеру, в знаменитом Оксфордском словаре социологии на термин «stratified sampling» стоит отсылка: см. sampling. Открываем с. 576--577 и читаем о том, что в случае стратифицированной вероятностной {random) выборки речь идет о разбиении совокупности на подгруппы, т.е. страты, например мужчин и женщин, а о районированной выборке в нашем понимании не говорится ни слова. Близкий к районам термин «local areas» употребляется Гордоном Маршаллом (а он считается знатоком в этом деле) только в связи: 1) с первой стадией многоступенчатого отбора, 2) с квотной выборкой17.
Возвращаясь от лингвистических тонкостей к методическим, подчеркнем вот еще что: отбор единиц, который может носить как случайный, так и направленный характер, производится независимо из каждого слоя или района, поэтому районированно-стра-тифицированная выборка (если можно так выразиться) равносильна ряду выборок, извлеченных из меньших совокупностей-страт (районов).
Стратифицированная случайная выборка (в узком значении) основана на выборке по каждой страте отдельно. Это повышает точность результатов либо уменьшает время, силы и стоимость исследования, допуская меньшие размеры выборки при заданном уровне точности. Например, известно, что бедность наиболее часто встречается среди пожилых, безработных и в монородительских семьях. Исследуя проблемы бедности, можно с равным успехом выбрать в качестве объекта любую из трех страт. В отобранных районах или стратах выбор единиц обследования проводится по вероятностному методу.
Основная цель всякого расслоения -- повышение точности выборочных оценок. Слои выделяются таким образом, чтобы дисперсия изучаемых переменных внутри слоев была значительно меньше, чем между ними. При расслоении вариация между слоями не входит в среднюю ошибку выборки, а компенсируется самой процедурой выделения слоев. Поэтому расслоение позволяет5 добиться более высокой степени точности оценок по сравнению с простым случайным отбором. Если каждый слой представляет собой статистически однородную группу, то для любого из них даже выборка малого объема позволит получить достаточно точные оценки, которые, будучи объединены, дадут хорошую оценку для всей совокупности.
Различают стратификацию одномерную и многомерную в зависимости от того, один или несколько признаков положены в основу разделения совокупности. Эти признаки должны иметь тесную связь с изучаемыми переменными, от их выбора в высокой степени зависит эффективность расслоения.
Гнездовая выборка
Противоположность районированной и стратифицированной выборке составляет гнездовая выборка.
Гнездовая выборка -- вид выборки, при котором отбираемые объекты представляют собой группы или гнезда (кластеры) более мелких единиц. Гнездом называют единицу отбора высшей ступени, состоящую из более мелких единиц низшей ступени. В выборку могут быть включены как все единицы низшего уровня, так и их часть. Число единиц, образующих гнездо, называют его размером.
В качестве гнезд выступают населенные пункты, районы, дома, подъезды, предприятия, цехи, бригады.
Гнездовой отбор обладает большими организационными преимуществами -- проще осуществлять отбор и обследование нескольких компактных групп, чем десятков или сотен отдельных единиц. Технические преимущества гнездового отбора особенно ощутимы при построении территориальной выборки. Отбор небольшого числа территориальных сегментов (населенных пунктов, районов, жилых кварталов и т.п.), затем выборочный или сплошной опрос проживающего в них населения существенно уменьшают стоимость исследования и сроки проведения.
Процедурно такой метод применить легче, чем вероятностный либо районированный. Проблемы, которые возникают здесь, связаны с определением величины гнезда, количеством гнезд, которые надо обследовать, их размещением в генеральной совокупности.
Основные рекомендации при выборе гнезд сводятся к тому, чтобы различия между гнездами были бы по возможности более неоднородными. Это правило прямо противоположно основному принципу расслоения, в соответствии с которым выигрыш в точности тем больше, чем более однородными будут выделенные слои. Другая рекомендация касается выбора размера гнезд: большое число малых гнезд предпочтительнее малого числа крупных.
2.2 Методы невероятностной (неслучайной) выборки
Неслучайная (невероятностная) выборка -- это способ отбора единиц, при котором мы не можем заранее рассчитать вероятность попадания каждого элемента в состав выборочной совокупности, что, разумеется, не дает возможности рассчитать, насколько правильна (репрезентативна) выборка. По этой причине предпочтение обычно отдается вероятностной выборке, хотя иногда по условиям исследования оказывается единственно возможным провести неслучайную выборку.
Таким образом, можно заранее сказать, что по содержательным критериям невероятностная (она же целевая и целенаправленная) выборка не хуже вероятностной, а может быть, и лучше. Ее недостатки: невозможность установить степень репрезентативности и более высокая стоимость (с точки зрения затрат она обычно превосходит вероятностную на несколько порядков). Но есть и преимущества -- более глубокое, качественное и всестороннее раскрытие предмета по сравнению с вероятностной.
Выделяют два основных вида неслучайного отбора:
¦ направленный отбор (другие названия -- целенаправленный, целевой, выбор по усмотрению);
¦ стихийный.
Направленный отбор характеризуется выбором единиц по какому-либо заранее определенному принципу. Наиболее распространенными формами направленного отбора считаются: выбор типичных объектов (методов типичных представителей), метод «снежного кома» и выбор квотами.
Метод типичных представителей часто оказывается удобным на высших ступенях отбора, когда необходимо ограничиться небольшим количеством объектов. Отбор типичных объектов может в достаточной мере обеспечить репрезентативность полученных данных только в том случае, если приняты меры по обоснованию выбора объектов. Для этого необходимо иметь дополнительную информацию по ряду признаков, которые могут рассматриваться в качестве контрольных.
Метод «снежного кома» (snowball sampling) -- разновидность целенаправленного выбора, при котором предполагается, что отбор дополнительных (последующих) респондентов производится после ссылки на них первоначально отобранных. Такая процедура используется при изучении особенных, редких, неслучайных совокупностей.
Этот метод обычно применяется для отбора экспертов и редко встречающихся групп респондентов (так называемых редких элементов) -- например потребителей, обладающих очень высокими доходами, или представителей элитных групп. По сути, это техника поиска и отбора респондентов с определенным сочетанием свойств в таких условиях, когда трудно очертить границы генеральной совокупности. Особенность метода состоит в том, что, за исключением первого шага, выбор каждого очередного респондента совершается по указанию респондентов, включенных в выборку на предыдущем шаге. Каждый респондент указывает интервьюеру, где можно найти интересующих его людей (и даже сам связывается с ними и рекомендует интервьюера), и выборка с каждым шагом разрастается, подобно снежному кому.
Метод стихийного отбора только внешне похож на случайный отбор, поскольку социолог, приблизительно зная, кого ему надо опросить, идет на улицу или останавливается у станции метро, опрашивая всех, кого удастся или кто похож на представителей генеральной совокупности, например людей в возрасте от 30 до 40 лет. Никаких математических процедур при составлении выборки здесь не применяется, и соблюсти контроль за обеспечением репрезентативности невозможно. Чаще всего фиксируется мнение тех, кто имеет возможность и желание поговорить с интервьюером. Стихийный отбор может принимать иную форму, когда не социолог подходит к первому встречному на улице, а первый встречный звонит на телевидение, откликаясь на обращение принять участие в так называемом интерактивном опросе, ставшем особенно модным у нас с конца 1990-х гг.
Стихийные выборки формируются произвольно и часто независимо от самого исследователя. Примерами стихийного отбора могут служить опросы с помощью средств массовой информации, выборка «первого встречного», опросы покупателей в залах супермаркетов, пассажиров на остановках и в общественном транспорте и т.д. Одна из особенностей стихийной выборки состоит в том, что мы зачастую не можем заранее предсказать ее размеров (как, например, при опросах с помощью СМИ -- достаточно вспомнить опросы интерактивного телевидения). Главный недостаток стихийных выборок состоит в том, что для них часто невозможно уточнить, какую генеральную совокупность они представляют.
К стихийному отбору тесно примыкает метод основного массива. Метод основного массива представляет опрос 60--70% генеральной совокупности. Процедура его крайне проста: из жителей данного района или работников предприятия опрашивается простое большинство. В результате средние генеральной и выборочной совокупностей сближаются, а выборочная совокупность составляет преимущественную часть генеральной и перекрывает возможное смещение. К подобному методу в прошлом часто прибегали заводские социологи, не искушенные в математических процедурах составления сложной выборки, зато располагающие материальными и временными ресурсами для опросов.
Кроме того, к невероятностным методам отбора относятся также:
¦ отбор на основе принципа удобства;
¦ отбор на основе суждений.
Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиции доступности респондентов. Формирование выборки на основе суждений основано на использовании мнений квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.
Квотная выборка
Квотная выборка -- микромодель объекта социологического исследования, формируемая на основе статистических сведений (параметров квот) преимущественно о социально-демографических характеристиках элементов генеральной совокупности. Нужные данные обычно берут из статистических справочников.
Квотный метод выборки предполагает предварительное наличие статистических сведений по ряду существенных либо коррелирующих с ними характеристик генеральной совокупности. Однако эти сведения не используются для определения объема выборки, так как в последующем отбор респондентов осуществляется не случайно, а целенаправленно, при помощи интервьюеров.
Принцип квотной выборки, или же принцип отбора единиц наблюдения по методу квот, восходит к представлению о подобии объектов в случае пропорциональности их структурных элементов. Этот метод основан на целенаправленном формировании структуры выборочной совокупности. Анкетер получает задание опросить некоторое количество лиц определенного возраста, пола, образования и профессии. Удельный вес квоты в выборочной совокупности должен соответствовать ее удельному весу в генеральной совокупности.
Обычно квотная выборка используется на последних ступенях отбора и завершает процесс районирования (стратифицирования) и применения вероятностных процедур. Социолог разыскивает респондента определенного пола, статуса и возраста в заданном районе и беседует с ним.
Приведем пример расчета выборки по таким параметрам квоты, как пол и возраст, в реальном социологическом исследовании. Обосновывая репрезентативность выборки при опросе избирателей в ходе избирательной кампании по выборам депутатов Городской думы Нижнего Новгорода, мы опирались на данные Облкомстата о половозрастной структуре населения районов города.
3. Расчет объема и ошибки выборки
Из всех вопросов, которые задают сотрудникам знаменитого Института опросов общественного мнения Гэллапа, самым популярным является такой: как вы можете, проинтервьюировав 1000 человек, судить о том, что думают 250 млн. американцев.
Для ответа на этот вопрос нужно упомянуть не только высокую квалификацию и огромный практический опыт сотрудников, но и использование ими статистики и математики. Если методы опроса не основаны на науке, результаты могут ввести вас в заблуждение.
В статистике приняты следующие разграничения объемов выборки. Объем выборки, достаточный для взаимопогашения случайностей и получения статистических характеристик закономерного характера, равен 30. Выборка такого объема называется малой. Характер распределения значений признака в малых выборках приближается к нормальному с ростом числа испытаний. Минимальный объем выборки, позволяющий получить средние значения признака с указанием доверительных вероятностей, равен 5. Выборки такого объема называются сверхмалыми. Распределение значений признака в таких выборках характеризуется распределением Стьюдента. Но чаще всего в социологии имеют дело с гораздо большим объемом выборки.
При планировании выборочного обследования наступает момент, когда нужно решить, сколько человек опрашивать, т.е. каким должен быть объем выборки. Это решение чрезвычайно важно, поскольку слишком большая выборка потребует излишних затрат, а слишком маленькая понизит качество результатов.
Объем выборки -- общее число единиц наблюдения, включенных в выборочную совокупность.
Поскольку выборочная совокупность -- это часть генеральной совокупности, отобранная с помощью специальных методов, -- важно, чтобы эта часть не искажала представления о целом, т.е. репрезентировала его. Социологов, часто проводящих эмпирические исследования, постоянно волнует вопрос о том, как много надо опрашивать человек, чтобы получить достоверную информацию?
Специалисты считают, что наилучшая выборка -- не обязательно большая. Конечно, чем больше объем выборки, тем выше точность ее результатов. Однако даже огромная выборка не гарантирует успеха, если генеральная совокупность «плохо перемешана», т.е. является неоднородной. Однородной считается такая совокупность, в которой контролируемый признак распределен равномерно, не образует пустот или сгущений. В этом случае, опросив нескольких человек, можно получить точную информацию о распределении этого признака в генеральной совокупности.
Таким образом, на репрезентативность данных влияют не количественные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупности -- степень ее однородности.
В социологии еще не придумано единой и четкой формулы, используя которую можно рассчитать оптимальный объем выборочной совокупности, -- такой формулы просто не существует в природе. И объясняется это весьма просто. Дело в том, что определение объема выборочной совокупности -- проблема не столько статистическая, сколько содержательная. Иными словами, объем выборочной совокупности зависит от множества факторов, в том числе от целей и задач, теоретической модели, гипотез и методов исследования, степени однородности генеральной совокупности, наконец, требующейся точности получаемой информации.
Надо всегда помнить, что каждый процент прироста точности информации в исследовании приводит к резкому увеличению расходов на его проведение. Знаменитый институт Гэллапа, на протяжении многих десятилетий проводящий опросы в США, выявил, что при общенациональной выборке в 100 человек -- ошибка выборки будет в пределах ±11%; 200 человек - ±8%; 400 - ±6%; 600 - ±5%; 750 -- ±4%; 1000 - ±4%; 1500 - ±3%; 4000 человек - +2%. Именно поэто-му он проводит общенациональные опросы в США на выборке в 1500-2000 человек. Как видно, он предпочитает увеличение ошибки на 1% многократному увеличению стоимости исследования.
Практика показывает, что для многих социологов обоснование объема выборки является камнем преткновения, несмотря на значительное количество литературы, посвященной выборочным
методам и, в частности, расчету объема выборки. Причин несколько: 1) дефицит специальной литературы на периферии; 2) нехватка времени для самообразования; 3) неумение пользоваться математическим аппаратом. В связи с этим возникает необходимость без сложных математических формул изложить стратегию и тактику обоснования объема выборки.
Процедура расчета объема выборки -- цепь бесконечных компромиссов между стремлением к точности и ограниченностью ресурсов, дефицитом времени и неполнотой сведений об изучаемом явлении. Вместе с тем это наука и искусство, познание которых доступно каждому человеку. Однако для этого нужно знать стратегии расчета объема выборки (предварительного расчета, последовательной и комбинированной стратегии), а также факторы, влияющие на объем выборки (объем генеральной совокупности, варьирование ответов респондентов, точность оценивания, характер предполагаемого распределения ответов, метод исследования, процедура обработки).
Стратегия предварительного расчета состоит в том, что объем выборки определяется до проведения основного исследования. В наиболее простом случае можно воспользоваться уже наработанным опытом, например, института Гэллапа, где используется объем выборки приблизительно в 1500--2000 человек. Для среднестатистического отечественного исследования объема выборки -- примерно 400--600 человек.
Для расчета объема случайной выборки надо знать желаемую точность оценивания, величину риска получаемого ответа и степень изменчивости ответа. Традиционно точность оценивания принимают за 5%, а величину риска -- за 0,95. Иными словами, если по данным выборочного исследования 60% опрошенных удовлетворены работой, то можно утверждать, что в генеральной совокупности доля удовлетворенных составит от 55 до 65% в 95% случаев, а в 5% случаев такая доля может выйти за этот интервал.
Стратегия последовательного расчета объема выборки. При расчете объема выборки желательно знать разброс оценок и некоторые другие параметры. Однако они-то, как правило, неизвестны. Для того чтобы не допустить ошибки, лучше предположить, что они максимальны. Плата за наше незнание -- разбухание объема выборки сверх необходимого и дополнительные финансовые и временные затраты (приходится опрашивать большее число людей). Для сохранения затрат применяется последовательная стратегия -- объем выборки не рассчитывается заранее, а ставится в зависимость от конечных результатов исследования. Например, опрашивают 100 человек, затем устанавливают величину разброса оценок и уже в зависимости от этого рассчитывают необходимый объем выборки. Если оказывается, что 100 человек достаточно, то исследование заканчивается. В противном случае добирается необходимое количество респондентов, но не до бесконечности. Известен пример из практики Дж. Гэллапа, который в начале своей карьеры активно экспериментировал с объемами выборки. В 1936 г. американцам был задан вопрос: «Хотели бы вы возобновления закона о восстановлении национальной промышленности?» Выяснился странный парадокс: Дж. Гэллап вначале опросил 500 человек и замерил ошибку выборки, а затем последовательно наращивал число респондентов до 30 тыс. К своему сожалению, он обнаружил, что прибавление 29,5 тыс. опрошенных увеличило точность информации менее чем на 1%. Следовательно, опрос можно было прекращать уже при 500 опрошенных. Этот пример показывает, что, применяя последовательную стратегию, можно добиваться значительного снижения необходимого числа наблюдений по сравнению с предварительным расчетом объема выборки.
Однако стратегия последовательного расчета объема выборки приносит желаемый результат лишь в том случае, если социолог может производить необходимые расчеты в ходе самого опроса, например телефонного, с применением компьютерных систем. Социолог вводит ответы респондента в свой персональный компьютер, с него результаты сразу поступают на компьютер руководителя исследования, обрабатываются, и на экране дисплея выдается информация не только об одномерных частотах, распределенных по тому или иному вопросу, но и о требуемом объеме выборки.
Если существует опасность, что объем выборки может оказаться катастрофически большим, надо совместить оба вида стратегии -- предварительную и последовательную, т.е. применить комбиниро- ванную стратегию. Рассчитывая выборку по предварительной стратегии, получаем верхние допустимые значения для последовательной стратегии или, иначе говоря, ту величину объема выборки, при достижении которой прекращается опрос по последовательной стратегии.
Наиболее обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов, в: основе которого лежит ряд базовых понятий математической статистики (вариация, среднее квадратическое отклонение, доверительный интервал, средняя квадратическая ошибка).
Для расчета необходимого размера выборки в количественном исследовании чаще всего используют два статистических понятия -- доверительный интервал и доверительную вероятность. Доверительный интервал представляет собой заранее задаваемую вами погрешность выборки. Например, если вы задаете доверительный интервал в 3% и конкретный ответ на конкретный вопрос исследования составит 48%, это значит, что даже при проведении опроса всей генеральной совокупности реальное значение попадет в интервал между 45 (48-3) и 51% (48 + 3). Доверительная вероятность показывает, насколько вы можете быть уверены в полученных результатах, в том, что характеристики выборки соответствуют характеристикам всей генеральной совокупности -иными словами, с какой вероятностью случайный ответ попадет в доверительный интервал. Обычно используют доверительную вероятность 95 и 99%. Чаще всего используется 95% -- этого вполне достаточно в подавляющем большинстве исследований. Если объединить доверительную вероятность и доверительный интервал, то можно сказать, что ответы на вопрос с 95%-ной вероятностью попадут в интервал между 45 и 51%.
Весьма полезна следующая приблизительная оценка надежности результатов выборочного обследования. Повышенная надежность допускает ошибку выборки до 3%, обыкновенная -- от 3 до 10% (доверительный интервал распределений на уровне 0,03-0,1), приближенная -- от 10 до 20%, ориентировочная -- от 20 до 40%, а прикидочная -- более 40%33.
На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки, которые предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки.
В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать, и очевидно, что ценность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.
Исследовательская практика подсказывает следующее правило: объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20--50 наблюдений для каждой второстепенной классификационной составляющей. Первостепенные классификационные составляющие соответствуют наиболее критичным, а второстепенные -- наименее критичным ячейкам перекрестной классификации, принятой в данном исследовании34. Теоретические расчеты и практика доказывают, что для получения достоверных данных о мнении и предпочтениях населения такого крупного города, как Санкт-Петербург, достаточно опросить 700--800 человек. Однако большинство опросов населения здесь проходят на выборках объемом до 1,5 тыс. человек.
Ошибка выборки
Как мы уже знаем, репрезентативность -- свойство выборочной совокупности представлять характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности -- мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности. Предположим, что средний ежемесячный семейный доход пенсионеров в генеральной совокупности составляет 2 тыс. руб., а в выборочной -- 6 тыс. руб. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, а в его исследование вкралась ошибка репрезентативности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями -- генеральной, на которую направлен теоретический интерес социолога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, которая выступает одновременно как объект обследования и средство получения информации о генеральной совокупности.
Наряду с термином «ошибка репрезентативности» в отечественной литературе можно встретить другой -- «ошибка выборки». Иногда они употребляются как синонимы, а иногда «ошибка выборки» используется вместо «ошибки репрезентативности» как количественно более точное понятие.
Ошибка выборки -- отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.
На практике ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов. В качестве контрольных параметров обычно применяются социально-демографические признаки. Сравнение средних генеральной и выборочной совокупностей, на основе этого определение ошибки выборки и ее уменьшение называется контролированием репрезентативности. Поскольку сравнение своих и чужих данных можно сделать по завершении исследования, такой способ контроля называется апостериорным, т.е. осуществляемым после опыта.
В опросах Института Дж. Гэллапа репрезентативность контролируется по имеющимся в национальных переписях данным о распределении населения по полу, возрасту, образованию, доходу, профессии, расовой принадлежности, месту проживания, величине населенного пункта. Всероссийский центр изучения общественного мнения (ВЦИОМ) использует для подобных целей такие показатели, как пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной ста- туе респондента, которые заимствуются в Государственном комитете по статистике РФ. В том и другом случае генеральная совокупность известна. Ошибку выборки невозможно установить, если неизвестны значения переменной в выборочной и генеральной совокупностях.
Специалисты ВЦИОМ обеспечивают при анализе данных тщательный ремонт выборки, чтобы минимизировать отклонения, возникшие на этапе полевых работ. Особенно сильные смещения наблюдаются по параметрам пола и возраста. Объясняется это тем, что женщины и люди с высшим образованием больше времени проводят дома и легче идут на контакт с интервьюером, т.е. являются легко достижимой группой по сравнению с мужчинами и людьми «необразованными»35.
Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки.
Ошибки выборки подразделяются на два типа -- случайные и систематические. Случайная ошибка -- это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности.
Второй тип ошибок выборки -- систематические ошибки. Если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка.
Таким образом, систематические ошибки -- результат деятельности самого исследователя. Они наиболее опасны, поскольку приводят к довольно значительным смещениям результатов исследования36. Систематические ошибки считаются страшнее случайных еще и потому, что они не поддаются контролю и измерению.
Подобные документы
Задача построения выборки и стратегии ее решения. Выборочный метод как один из аспектов социологического исследования, его основные цели и задачи. Ознакомление с типами выборки, выявление их достоинств и недостатков. Определение достоверности наблюдений.
контрольная работа [33,6 K], добавлен 14.12.2010Этапы планирования и проведения выборки, их сложность и правильная реализация. Способ систематического сбора данных о поведении, установках людей посредством опроса специально подобранной группы респондентов. Основные разновидности статистической выборки.
контрольная работа [19,8 K], добавлен 07.09.2015Суть выборочного метода и его роль в социологии. Понятие случайной и систематической ошибки. Генеральная и выборочная совокупность. Случайные и неслучайные выборки в социологии. Стратификация и кластеризация, определение параметров дизайн-эффекта.
контрольная работа [130,9 K], добавлен 06.08.2013Возникновение задачи построения выборки в социологических исследованиях. Вероятностная (случайная) выборка как наилучшая модель отбора. Типы и размеры вероятностных выборок, их реализация. Целевой отбор: выборка доступных, типичных и критических случаев.
курсовая работа [52,0 K], добавлен 16.02.2011Основные структурные компоненты выборочного исследования состояния успеваемости студентов. Вычисление объемов повторной и бесповторной выборки, определение дисперсии и допустимой погрешности. Разработка опросного листа по изучению состояния успеваемости.
контрольная работа [595,0 K], добавлен 01.11.2012Статистическое исследование, получение первичной статистической информации. Систематизация данных, сводная характеристика всей совокупности фактов при помощи обобщающих статистических показателей. Определение статистической закономерности. Ошибки выборки.
реферат [37,7 K], добавлен 06.03.2009Методология изучения в статистике и социологии. Теоретические аспекты оценки доходов и уровня жизни населения. Выявление дифференциации статистическими методами. Социологический подход к изучению бедности и благосостояния, дифференциации доходов.
курсовая работа [973,3 K], добавлен 12.05.2014Опрос - метод сбора социологической информации. Устный и письменный опросы. Анкетирование, интервью, тесты. Простая и сложная выборки при интервьюировании. Тест как инструмент получения информации о склонностях, предрасположенностях и реакциях индивидов.
контрольная работа [15,8 K], добавлен 25.03.2010Виды, структура, свойства и функции этнических стереотипов. Анкетирование как метод социологического опроса, его характеристика и принципы составления выборки. Выявление этнических стереотипов о представителях этнических групп в восприятии студентов.
курсовая работа [622,7 K], добавлен 09.04.2011Методологическая и методическая составляющие программы социологического исследования. Определение объекта исследования, генеральная и выборочная совокупность. Методы выборки, разработка инструментария социологического исследования, основные понятия.
контрольная работа [28,3 K], добавлен 29.09.2010