Применение математических методов в социологии
Математические методы как средство познания социальных явлений. Роль математизации научного знания. Априорная модель изучаемого явления. Цели применения математических методов в социологии. Актуальность задач, решаемых математической статистикой.
Рубрика | Социология и обществознание |
Вид | реферат |
Язык | русский |
Дата добавления | 26.09.2011 |
Размер файла | 48,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
- 1. Математические методы как средство познания социальных явлений
- 1.1 Роль математизации научного знания
- 1.2 Априорная модель изучаемого явления
- 1.3 Основные цели применения математических методов в социологии
- 2. Актуальность для социологии задач, решаемых математической статистикой
- 2.1 Основные задачи математической статистики с позиции потребностей социологии
- 2.2 Случайные величины и распределения вероятностей как основные объекты изучения математической статистики и эмпирической социологии
1. Математические методы как средство познания социальных явлений
1.1 Роль математизации научного знания
О роли математизации научного знания в литературе говорится довольно много. Ниже мы коснемся лишь некоторых аспектов соответствующей проблемы, играющих, на наш взгляд, серьезную роль в организации эмпирического социологического исследования.
К сожалению, в кругу социологов часто бытует мнение о том, что математические методы как бы противостоят настоящей "гуманистической" социологии. И в этом смысле термин "математический" отождествляется с термином "количественный", понимаемым в приведенном выше смысле (имеем в виду известную пару "количественная социология" - "качественная социология"). А это, с нашей точки зрения, - кардинально неправильное положение, мешающее эффективному развитию социологии. Поясним это.
Везде, где мы хотим говорить о науке, требуется определенный уровень четкости, конструктивности рассматриваемых положений. Никакой "поток сознания", исходящий от респондента, взгляды которого изучаются "мягкими" методами, не позволит нам говорить о научных выводах, если мы в этом "потоке" не выделили некоторые "жесткие" логические конструкты (заметим, что, проанализировав подходы, используемые авторами качественных исследований, можно придти к выводу, что научный характер эти разработки приобретают, благодаря отображению каждого респондента в некую лингвистическую полуформализованную структуру и получение теоретических выводов на базе определенной агрегации подобных структур, полученных от разных респондентов, принадлежащих к одной субкультуре), а определенный уровень четкости этих конструктов позволяет говорить об использовании математического языка. Математика, собственно говоря, начинается везде, где нам удается достаточно четким образом обрисовать интересующую нас жизненную ситуацию. Например, математический аппарат можно использовать уже на стадии изучения формирования понятия в сознании респондентов [Толстова, 1996б]. Другой пример - сами "качественники" говорят о том, что последовательная реализация соответствующего подхода приводит к рождению понятия переменной [Семенова, 1998.С. 198], а это - уже вполне "количественная" ситуация, делающая естественным использование математического аппарата. Да и в типично качественном исследовании, как мы уже отмечали (и как свидетельствует приведенный в конце работы список публикаций) математика активно используется.
Иногда при серьезном изучении мнений респондента удается использовать традиционный математический язык и соответствующие математические теории. Скажем, плюралистичность мнения одного респондента (т.е. то обстоятельство, что он в разное время, при разных условиях, вообще говоря, будет по-разному оценивать один и тот же объект), о которой мы говорили в п.1.2 может быть четко описана фразой: мнение одного респондента об одном объекте имеет нормальное распределение. Именно это описание было использовано в упомянутой там терстоуновской модели метода парных сравнений. О том, какую роль математический язык играл в творчестве известных специалистов в области социологического измерения, говорится в [Толстова, 1998].
Бывают ситуации, когда известные математические теории “ не работают ”, и тогда рождается новая ветвь математики. Так родились теория измерений, многомерное шкалирование. Известный американский социолог П.Ф. Лазарсфельд, глубоко анализируя соотношение наблюдаемого и ненаблюдаемого (ответов респондентов на вопросы анкеты и скрытых факторов, определяющих эти ответы), разработал соответствующую теорию, сформулированную им на математическом языке и названную латентно-структурным анализом. Отметим также попытки создания математической социологии такими известными исследователями, как Г.М. Блейлок, предложивший базирующуюся на причинном анализе теорию конфликта [Blalock, 1989]; Дж. Коулмен, создавший теорию анализа временных рядов, математическую теорию коллективного действия [Coleman, 1990].
Ярким примером математизации сугубо "гуманитарных" взглядов исследователя является детерминационный анализ, автор которого отверг традиционные подходы к шкалированию, счел неадекватным сути социологии использование в ней математической статистики, но, тем не менее, пришел к математике - правда, весьма своеобразной, являющейся обобщением аристотелевской силлогистики [Чесноков, 1982, 1985].
Для творчества каждого названного ученого характерно то, что, по большому счету, в нем речь идет о предложении определенного языка, адекватно описывающего рассматриваемые социальные процессы.
Однако, конечно, следует отметить, что в наше время вряд ли мы можем говорить о состоятельности претензии кого бы то ни было на разработку математической социологии. Пока соответствующей формализации поддались лишь сравнительно простые социологические образования. Математика всегда отражает все же относительно простые ситуации (здесь представляется целесообразным вспомнить Конта, который в своей классификации наук математику отнес к самым простым, а социологию - к самым сложным [Конт, 1996]). Правда, это говорит еще и о наличии серьезных проблем с разработкой социологических теорий.
1.2 Априорная модель изучаемого явления
Эмпирическая и математическая системы.
Чтобы прочувствовать специфику использования математических методов как средства познания социальных явлений, взглянем на отношение математики к реальности с несколько иных позиций, чем это было сделано выше. То, о чем пойдет речь, как бы лежит “за кадром” всего сказанного ранее в разделе 1.
В озможность применения математики возникает тогда, когда исследователь абстрагируется от многих конкретных черт изучаемого объекта и предполагает адекватной сути решаемой задачи определенную формализацию рассматриваемого явления. Подчеркнем последний момент. Речь идет о том, что априори, т.е. прежде, чем осуществлять какой бы то ни было математический анализ данных (и даже прежде, чем получать эти данные), необходимо сформировать определенное представление о том, каков характер подлежащего изучению явления (эти представления лежат в основе того, что в п.1.3 названо априорной содержательной и концептуальной моделями). Совокупность таких представлений можно назвать априорной моделью этого явления, должны быть достаточны для того, чтобы на их основе можно было выбрать (разработать) и способы сбора данных, и подходы к их интерпретации, и формальный аппарат для непосредственного анализа данных, и принципы интерпретации результатов применения этого аппарата. И роль социолога при формировании описанной априорной модели является главной (по сравнению с ролью математика).
Переходя к более подробному логическому анализу рассматриваемого процесса, можно сказать следующее. Применение математики опирается на то, что мы считаем возможным (1) выделить некоторый фрагмент реальности; (2) построить (посредством измерения) его математическую модель (т.е. получить исходные данные); (3) изучить эту модель традиционными для математики способами (в нашем случае - применить тот или иной алгоритм анализа данных) и прийти к некоторым выводам о ее "устройстве" (в результате анализа данных получить какой-то математический результат: вычислить точное значение коэффициента корреляции, найти параметры уравнения регрессии и т.д.); (4) проинтерпретировать эти выводы на содержательном языке (т.е., как говорят обычно, проинтерпретировать результаты анализа данных) и получить таким образом новое знание о реальности. Первые два этапа обычно относят к области измерения (шкалирования), последние два - к области собственно анализа данных. Но все четыре этапа тесно связаны друг с другом, их нельзя рассматривать по отдельности. Реализация этих этапов приводит к построению сложной модели реальности, первым шагом которого является построение некоторой первичной модели - результата измерения. Соответствующий процесс обычно бывает связан с решением ряда не всегда простых (особенно для социологии, поскольку она имеет дело с весьма сложной реальностью) проблем. Рассмотрим формальную сторону этого процесса более подробно.
Строя первичную модель в процессе измерения, т.е. реализуя первые два этапа, мы должны вычленить круг рассматриваемых объектов; ограничить множество их свойств лишь теми, которые интересуют исследователя; вычленить те отношения между объектами (рассматриваемыми как носители выделенных свойств), которые должны моделироваться в процессе измерения. (В п.1.3 мы по существу с несколько иной точки зрения рассматривали тот же процесс, говоря о рождении и интерпретации понятий.)
Например, в качестве рассматриваемых объектов можно взять совокупность рабочих какой-то отрасли промышленности. Среди всех их свойств выделим только одно: эмоциональное состояние, которое можно назвать удовлетворенностью работой. В качестве моделируемых отношений выберем отношения равенства и порядка ("больше") рабочих по их удовлетворенности: считаем, что какие-то два рабочих "вступают" в отношение равенства, если их удовлетворенности в некотором содержательном плане равны, и "вступают" в отношение порядка, если, скажем уровень положительных эмоций по отношению к работе у первого рабочего больше аналогичного уровня второго.
Задачей измерения чаще всего является приписывание нашим респондентам таких чисел (подчеркнем, что результатами измерения могут быть и не числа), в которых соответствующим образом отразились бы описанные отношения: если оказалось, что двум респондентам в результате измерения оказались приписанными одинаковые числа, то мы должны быть уверены, что соответствующие эмоциональные состояния этих респондентов одинаковы; если же первому респонденту оказалось приписанным большее число, чем второму, то у нас должна быть уверенность в том, что удовлетворенность первого респондента больше удовлетворенности второго. Ясно, что это сделать не просто - в частности, потому, что не просто оценить упомянутый выше "уровень положительных эмоций".
Аналогичные рассуждения должны быть справедливыми и для рассмотренного выше примера - для той ситуации, когда изучаемым множеством объектов служит некоторая совокупность учителей и мы рассматриваем две системы отношений между ними: отвечающие качеству их работы и материальному благосостоянию соответственно. Выбор соответствующих индикаторов по существу и означал выделение учитываемых отношений.
Желание удовлетворить рассмотренным требованиям обычно сопровождается всем тем "букетом" связанных с процессом выделения понятий и их операционализацией проблем, о которых мы упоминали в п.1.3 Но в настоящей работе нас больше волнует другой аспект того же процесса моделирования (подчеркнем, что пока речь идет о той модели, которая строится в процессе измерения) - связанный с непосредственным анализом данных.
Выделяя моделируемый при измерении фрагмент реальности и строя его модель, мы должны помнить еще об одном упомянутом там же моменте: в результаты измерения нами вкладывается еще кое-какой смысл - тот, который связан с поиском интересующей нас закономерности. Другими словами, нельзя забывать о том, ради чего осуществляется измерение, о том, какого рода закономерности нас интересуют (хотя сами закономерности мы будем находить позже, в процессе анализа данных, собранных с помощью процедуры измерения). Строя модель в процессе измерения, необходимо параллельно формировать определенные представления об изучаемом явлении - представления, адекватные последующей его формализации в процессе выбора и реализации алгоритма анализа. Естественно, при этом должно происходить абстрагирование от ряда реальных сторон этого явления. Именно это имело место, когда мы, изучая зависимость между материальным положением учителя и качеством его работы, сочли возможным использовать именно коэффициент корреляции между признаками, явившимися результатом операционализации понятий. Напомним, что это неявно вкладывалось нами в интерпретацию получаемых в результате измерения чисел. В частности, мы полагали осмысленной, содержательно интерпретируемой, структуру интервалов между числами (т.е. считали последние полученными по крайней мере по шкале интервалов). Если бы мы предпочли, скажем, не менее известный коэффициент корреляции рангов Спирмена, то тем самым придали бы числам другой смысл - считали бы осмысленным лишь числовое отношение порядка (т.е. полагали бы, что при измерении была использована порядковая шкала).
Назовем выделенный нами фрагмент реальности эмпирической системой (ЭС). Таким образом, ЭС - это совокупность интересующих нас объектов вместе с системой связывающих их отношений. При этом в число таких отношений входят как те, которые мы непосредственно моделируем при измерении, так и те, которые, являясь на этапе измерения элементом интерпретации данных, будут далее использоваться в процессе анализа последних 19. Более подробно о смысле моделируемых при построении ЭС отношений, в частности, об упомянутой интерпретации идет речь в [Интерпретация и анализ., 1987, гл.1; Толстова, 1991а, 1998].
Подчеркнем, что зачастую четкое выделение как объектов и их свойств, так и черт изучаемого явления требуют довольно высокого уровня исследовательской абстракции, и что поэтому ЭС лишь условно можно назвать фрагментом реальности. Скорее речь должна идти об определенной модели последней (той концептуально-логической модели, которая практически всегда предшествует математической). Процесс перевода всех компонент описанного фрагмента реальности на формальный, математический язык, т.е. процесс измерения, позволяет нам перейти от ЭС к некоторой математической системе (МС). В описанных выше ситуациях она была числовой (хотя из сказанного выше следует, что соответствующие числа совсем не обязательно являются полноценными числами в привычном всем смысле этого слова; это не имеет места, например, при использовании шкал низкого типа). Социологическим данным часто бывают адекватными и нечисловые МС (подробнее о соответствующем обобщенном понимании измерения см. [Логика социологического исследования, 1985; Толстова, 1991а, 1996в, 1998]) 20.
Заметим, что изучая интересующее нас явление, получая те или иные содержательные выводы, т.е. конкретизируя наши априорные представления о выбранной модели явления, мы пользуемся соответствующей математической теорией, т.е. свойствами задействованной МС. По существу выше, говоря о зависимости интерпретации полученных при измерении данных от того, каким методом эти данные будут анализироваться, мы говорили именно о том, что МС должна описываться интересующей нас математической теорией. Только в том случае, если последнее обстоятельство будет иметь место, можно будет применить отвечающий этой теории метод, воспользоваться разработанными в рамках этой теории положениями.
Подчеркнем, что выбирая метод анализа данных, опирающихся на какую-то математическую теорию, мы тем самым считаем эту теорию адекватной реальности. Но ответ на вопрос о том, так ли это, в социологии далеко не всегда является простым. При обосновании соответствующей адекватности прежде всего, нужно убедиться в том, что являющиеся результатом измерения формальные объекты удовлетворяют тем свойствам, на которых базируется предполагаемая для использования математическая теория (например, аксиомам этой теории и отвечающим ей правилам вывода). После этого можно использовать известные теоремы и другие математические соотношения, выводимые в рамках упомянутой теории. Получившиеся результаты, конечно, надо будет "перевести" на содержательный язык, что отвечает шагу, в определенном смысле обратному по отношению к тому процессу формализации содержательных представлений исследователя, о котором шла речь выше 21.
Подчеркнем, однако, что для социологических исследований подобная схема справедлива далеко не всегда. Очень часто социолог использует методы, условия применимости которых либо заведомо не выполняются, либо не проверяются. Для иллюстрации этого положения, заметим, что наиболее типичным примером свойства, которому должна удовлетворять МС при использовании многих математико-статистических алгоритмов может служить требование того, что исходные данные являются случайной выборкой из подчиняющейся определенному вероятностному закону генеральной совокупности. И такого рода свойства МС как раз очень редко проверяются (и выполняются) на практике. Тем не менее, соответствующие методы используются.
Необходимость прибегать к такого рода некорректностям объясняется, в первую очередь, тем, что математических систем, вполне адекватно отражающих те стороны реальности, которые интересуют социолога, пока придумано очень мало. Небезынтересно отметить, что в последние годы подобное положение дел привело к развитию методов изучения устойчивости разных математических алгоритмов относительно нарушений (той или иной степени) условий их применимости.
1.3 Основные цели применения математических методов в социологии
Использование математических методов в процессе проведения научного исследования позволяет достичь следующих целей.
математическая статистика социология
Во-первых, применение математики побуждает исследователя четко сформулировать свои представления об изучаемом объекте. Правда, обусловленная сложностью социальных явлений неоднозначность соответствующей конкретизации приводит к необходимости комплексного использования нескольких методов, умелого сравнения интерпретации соответствующих результатов и т.д. Это, с одной стороны, конечно, усложняет анализ. Но, с другой стороны, та же комплексность позволяет обогатить наши представления о реальности. Каждый подход отражает лишь какую-то одну ее грань. И только восприятие всех граней одновременно позволяет увидеть явление во всей его полноте.
Так, желая сравнить величину связи между какими-либо признаками для разных совокупностей респондентов, мы, пытаясь построить математический критерий такой связи, волей-неволей вынуждены конкретизировать свои представления о ней. Оказывается, это возможно сделать многими способами (как мы уже упоминали, только коэффициентов парной связи между номинальными признаками известно более сотни). Каждый из этих способов отражает какую-то одну сторону "истинной" связи. И лишь имея перед собой множество таких коэффициентов, мы можем понять, что есть наша связь в реальности.
Необходимость уточнения наших представлений об изучаемом явлении, вызванная потребностью использования математики, дисциплинирует исследователя и часто дает возможность ему самому лучше разобраться в том, что он изучает. Так, скажем, используя многие алгоритмы классификации для построения содержательной типологии объектов, мы вынуждены очень тщательно проанализировать наши априорные представления об искомых типах, благодаря необходимости выбрать конкретную формальную меру близости между классифицируемыми объектами (об этом см., например, [Типология и классификация в социологических исследованиях, 1982. Гл.7]).
Во-вторых, использование математических методов позволяет четко выдержать обсужденное выше (п.2.2) абстрагирование от неисчислимого количества реальных свойств изучаемых объектов, не дает уйти в сторону от принятого исследователем понимания изучаемого явления. Конечно, в этом обстоятельстве тоже можно усмотреть и негативный аспект: любой формализм, как бы хорош он ни был, обедняет действительность; и вполне возможно, что, абстрагировавшись от чего-то, мы придем к неверным выводам из-за того, что то, от чего мы отвлекаемся, чего не принимаем в расчет, на самом деле является самым главным моментом, определяющим наше явление. Но подобных нелепостей можно избежать, если творчески, умело применять математику. Квалифицированное использование математического аппарата позволяет превратить рассматриваемую возможность последовательного абстрагирования от реальности в действенное средство помощи социологу. Ведь без использования формализма человек, к сожалению, слишком часто сбивается с единой логики рассуждения, непроизвольно подменяет одно понимание изучаемого явления другим и, естественно, в результате приходит к неверным выводам, сам того не замечая 22.
В-третьих, с помощью математики можно получить содержательные выводы, не лежащие "на поверхности", за счет расширения круга используемых логических умозаключений. Математика по существу и предоставляет социологу возможность пользоваться всеми теми интеллектуальными достижениями, которые накопило человечество при изучении именно таких-то объектов (т.е. объектов, удовлетворяющих рассматриваемым формальным свойствам; объектов - элементов МС) и именно при таком-то понимании интересующего нас явления (т.е. при адекватности заложенной в методе модели характеру этого явления).
Так, вряд ли при изучении связи между признаками без помощи математической статистики мы сможем четко сформулировать, что такое "иметь уверенность" в неслучайности отклонения наблюдаемых частот от тех, которые должны были бы иметь место при независимости. В случае использования популярного в социологии теста "Хи-квадрат" такая уверенность появляется, когда различие между эмпирическими и теоретическими частотами достаточно большое. Что же здесь означает слово "достаточно"? Где границы большого и малого? В математической статистике ответ на такие вопросы давно получен. И формулируется он на теоретико-вероятностном языке, что вполне адекватно обычным рассуждениям социолога (более подробно соответствующая логика разъясняется в п.2.3.1 II части настоящей книги; см. также [Толстова Ю.Н., 1990]).
Желание обойтись без математики в подобных ситуациях, вероятно, приведет нас к "изобретению" чего-то на нее похожего. А зачем изобретать велосипед? Тем более, что вряд ли у нас получится что-то лучше того, что уже придумано.
Приведем еще один пример, на наш взгляд, очень важный для социолога. Типичной задачей, решаемой исследователем в процессе анализа анкетных массивов, является задача нахождения таких сочетаний значений рассматриваемых признаков (что, очевидно, можно ассоциировать с соответствующей этим сочетаниям группировкой респондентов), которые детерминируют некоторое "поведение" респондента. Скажем, "поведением" может служить голосование или неголосование за некоторого политического лидера. Результатом решения подобной задачи может служить, например, вывод о том, что среди мужчин старше 40 лет с высшим экономическим образованием и живущих в сельской местности 95 % проголосовало за рассматриваемого лидера, т.е. что респонденты с названными свойствами обладают анализируемым "поведением". Процесс решения такого рода задач обычно является чисто интуитивным. Никакой гарантии обнаружения всех требующихся групп респондентов при этом не имеется. Более того, обычно нет гарантии и того, что мы найдем хотя бы одну группу, даже если такие группы в изучаемой совокупности имеются.
Каков же выход из подобного положения? Нам не хотелось бы все свести к необходимости привлечения на помощь ЭВМ для организации того, чего человек не может сделать просто в силу огромности требующейся работы, т.е. для простого перебора возможных сочетаний значений рассматриваемых признаков с целью выделения всех тех групп респондентов, которые обладают изучаемым "поведением" (хотя такого рода чисто механическая помощь ЭВМ, конечно, важна, к обсуждению этого обстоятельства мы еще вернемся). Такое применение ЭВМ не подразумевает использование каких бы то ни было нетривиальных логических умозаключений. Здесь же требуется несколько иной поворот дела. Математика нужна нам по существу. Дело в том, что осуществление требующегося перебора в практических ситуациях обычно бывает не под силу даже современным ЭВМ. Вот тут-то и приходят на помощь математические методы поиска требующихся сочетаний, методы, дающие определенные гарантии того, что мы такие сочетания найдем, коли они имеются в нашей совокупности. Подобные алгоритмы существуют. Некоторые из них будут рассмотрены во второй части книги - п.2.5 (например, алгоритмы типа AID) Социолог же о существовании этих методов, как правило, просто не знает. Последствия этого описаны выше.
О том, что в социологических исследованиях может использоваться разная логика рассуждений, см., например [Толстова, 1996б].
В-четвертых, не лежащие на поверхности выводы могут быть получены за счет создания возможности анализа огромных массивов информации (с которыми обычно и имеет дело социолог), учета огромного количества факторов (определяющих практически любое общественное явление). Этот аргумент "в защиту" математики обычно бывает наиболее понятным. Но указанную возможность создает не столько использование собственно математических методов, сколько применение ЭВМ (которое, однако, невозможно без применения математических алгоритмов), что само по себе для нас менее интересно: речь идет о чисто "количественной" помощи социологу, просто о более быстром проведении каких-то операций. А говоря о математическом анализе данных, нам хотелось бы в первую очередь затронуть "качественную" сторону исследовательского процесса: нас интересует, какую модель реальности мы используем, в какой степени она отражает наши представления о ней и т.д.
О роли математики в социологии говорят многие авторы (в работе [Толстова, 1991а, с. 19-20] приводится библиография). Здесь отметим очень удачную по своему жанру и исполнению книгу [Максименко, Паниотто, 1988].
В заключение настоящего раздела отметим, что без применения математического аппарата трудно обойтись при решении практически любой социологической задачи. А поскольку главной целью анализа данных является выявление статистических закономерностей, то из всех ветвей математики для социолога естественным образом на первое место выходит та ветвь, которая направлена именно на поиск таких закономерностей - математическая статистика (и, конечно, лежащая в ее основе теория вероятностей). Для того, чтобы эффективно пользоваться этой ветвью математики, необходимо понимать, что лежащие в основе математической статистики положения отражают нечто важное для социолога, и давать себе отчет в том, как, в каком виде соответствующее отражение осуществляется. Об этом и пойдет речь ниже.
2. Актуальность для социологии задач, решаемых математической статистикой
2.1 Основные задачи математической статистики с позиции потребностей социологии
Итак, главной задачей анализа данных является сжатие собранной эмпирической информации, направленное на "вычленение" скрытых в ней статистических (т.е. имеющих место "в среднем") закономерностей. Примерно так же формулируется и основная задача математической статистики. Ее методы направлены на изучение именно статистических закономерностей. Разработанные в рамках этой науки приемы позволяют выявлять "средние" тенденции, "заложенные " в исходных данных. Именно это, в первую очередь, обусловливает необходимость обращения социолога к математической статистике. Но имеются и другие причины.
Вспомним еще об одной очень остро стоящей практически перед любым исследователем-социологом проблеме - проблеме соотнесения выборки и генеральной совокупности, проблеме построения репрезентативной выборочной совокупности. Будем считать, что она в общих чертах знакома читателю 23.
Вряд ли можно подвергнуть сомнению то, что при изучении статистических закономерностей социолога практически всегда интересует задача перенесения полученных им результатов с той совокупности объектов, которая непосредственно была обследована (с выборки) на более широкую совокупность (генеральную). Это делает использование математической статистики еще более привлекательным для социолога: ведь с помощью соответствующих подходов можно осуществлять анализ выборочных данных именно с намерением обобщения получаемых результатов на соответствующую генеральную совокупность.
Таким образом, основные задачи математической статистики вполне адекватны задачам, которые ставит перед собой социолог. Естественно, что при решении социологических задач мы должны активно использовать все полезные для нас достижения современной науки, в том числе и математической статистики. Однако, как мы отмечали выше, при использовании соответствующих подходов в социологии и других науках, опирающихся на изучение эмпирических данных, возникают серьезные проблемы. И для того, чтобы разобраться в том, что из области математической статистики мы можем, а что не можем использовать, надо более четко понять, с какими объектами она имеет дело, и в соответствующем ракурсе более детально проанализировать, какие задачи она решает. Перейдем к более подробному обсуждению того, какие задачи позволяет решать математическая статистика и какое отношение эти задачи могут иметь к потребностям социолога.
2.2 Случайные величины и распределения вероятностей как основные объекты изучения математической статистики и эмпирической социологии
Основными объектами изучения для математической статистики являются т. н. случайные величины (пока - одномерные). Это функции, определенные на некоторых случайных событиях ("случайное событие" - основное понятие теории вероятностей; как известно, сам термин "вероятность" осмыслен лишь применительно к некоторому случайному событию) и принимающие числовые значения. В качестве типичного для социолога случайного события является выбор того или иного респондента. Случайными величинами могут служить признаки, определенные для этих респондентов.
Скажем, возьмем такой признак, как возраст. "Переходя" от события к событию. т.е. от одного респондента к другому (скажем, перебирая анкеты), мы будем фиксировать разные значения возраста (18, 36, 24,. лет), т.е. разные значения нашей случайной величины.
Случайная величина может быть многомерной - например, когда ей отвечает несколько признаков, а ее значениями являются не отдельные числа, а сочетания чисел - значений рассматриваемых признаков. Скажем, если наряду с возрастом мы будем учитывать пол (0 - мужчина, 1 - женщина) и зарплату (в рублях), то в качестве значений нашей трехмерной случайной величины могут выступать, например, тройки чисел: (18, 0, 524), (36, 1, 1200) и т.д.
Сказанным не ограничивается определение случайной величины. Мы не упомянули самого главного - для каждой совокупности значений случайной величины должна быть определена вероятность того, что, обследуя респондентов, социолог встретит значение из этой совокупности.
Напомним, что вероятностью события называют некоторую числовую характеристику степени возможности его появления в определенных, могущих повторяться неограниченное число раз, условиях. Выше в качестве события указывался выбор респондента. О вероятности этого события говорить не будем (поскольку такая вероятность связана с правилами построения выборки, которые мы не затрагиваем). В интересующем нас случае тот факт, что случайная величина приобретает некоторое значение, сам рассматривается как случайное событие. И именно задание соответствующих вероятностей сопрягается с определением случайной величины. Условия же реализации нашего случайного события - это условия, определяющие отбор респондента.
Совокупность вероятностей встречаемости значений рассматриваемой случайной величины называется отвечающим ей распределением вероятностей, или просто ее распределением. Функция, задающая для определенных наборов значений случайной величины отвечающую им вероятность, называется функцией распределения этой случайной величины. Задать случайную величину, по существу, и означает задать соответствующее вероятностное распределение.
На практике часто используется т. н. функция плотности вероятности, определяющая, грубо говоря, вероятность встречаемости каждого значения случайной величины 24. В качестве примера можно привести многим хорошо знакомое, часто использующееся в математической статистике нормальное распределение (которое тоже, как известно, может быть одномерным и многомерным), имеющее вид "колокола".
Подчеркнем, что самое вероятность исследователь никогда не наблюдает, в принципе не может измерить. Это - продукт нашего мышления, абстракция, идеальный конструкт 25. Вероятность присуща генеральной совокупности, понятие которой само является абстракцией 26. Вместо вероятности исследователь обычно имеет дело с ее выборочной оценкой - относительной частотой встречаемости соответствующего события. Косвенное обоснование целесообразности такой подмены можно усмотреть в том, что одно из известных определений вероятности, носящее название частотного, как раз и состоит в отождествлении ее с тем пределом, к которому стремятся частоты встречаемости интересующего нас события при многократном повторении выборочных расчетов (для все новых и новых выборок).
Чтобы было возможно использование аппарата математической статистики, необходимо частотные выборочные распределения расценивать как выборочные представления генеральных распределений вероятностей. Каждое такое распределение ассоциируется со случайной величиной.
Так, например, для выборки из 10 респондентов, сведения о которой фигурируют в таблице 1, выборочное частотное распределение, отвечающее случайной величине "Удовлетворенность трудом", будет иметь вид, представленный в таблице 2.
С помощью тех же данных можно рассчитать и двумерные распределения, одно из которых приведено в таблице 3. Это - выборочное представление двумерной случайной величины, отвечающей паре признаков ("пол", "удовлетворенность трудом").
Таблица 2.
Пример частотной таблицы, построенной на основе данных таблицы 1 и отражающей выборочное представление распределения случайной величины "удовлетворенность трудом".
Таблица 3.
Пример частотной таблицы, построенной на основе данных таблицы 1 и отражающей выборочное представление распределения двумерной случайной величины ("пол", "удовлетворенность трудом").
В разделе 2 второй части понятие частотных таблиц будет обсуждено более подробно.
Математическая статистика позволяет находить широкий круг статистических закономерностей. Любая из них является некоторым набором параметров вероятностных распределений рассматриваемых случайных величин (одномерных и многомерных). Такого рода характеристиками являются, к примеру, разные меры средней тенденции, разброса значений случайных величин, связи между признаками и т.д. Результат, скажем, регрессионного анализа можно рассматривать как совокупность коэффициентов регрессии, которые в конечном итоге тоже являются некоторыми параметрами исходного многомерного распределения (характеристиками многомерной случайной величины) и т.д. Однако сами параметры, в той же мере, как и те вероятности, на базе которых они рассчитываются, остаются неизвестными исследователю. Вместо истинных значений параметров мы имеем только их выборочные оценки, рассчитанные на основе частотных распределений. Эти оценки называются статистиками 27.
Итак, поскольку исследователь изначально имеет дело лишь с частотами, а не с соответствующими вероятностями, то фактически исходные случайные величины предстают перед ним в весьма приближенном виде. То, что на основе выборочных данных мы рассчитываем не сами параметры распределений, а лишь их выборочные оценки (отвечающие им статистики), усугубляет степень приблизительности искомых закономерностей. Другими словами, вид закономерности, найденной для выборки, вообще говоря, будет отличаться от вида ее для генеральной совокупности. Естественно, важную роль должна играть оценка подобного различия, поскольку нас, вообще говоря, интересуют закономерности, свойственные генеральной совокупности, хотя на практике мы и имеем дело лишь с выборкой. Именно такую оценку мы и сможем сделать, пользуясь положениями математической статистики.
Основные методы, лежащие в русле математической статистики, обычно делят на две большие группы, определяемые характером рассматриваемых закономерностей и технологией их поиска: методы статистической оценки параметров (способы расчета выборочных значений параметров и перехода от выборочных значений к генеральным; математическая статистика говорит о том, каким качествам эти оценки должны обладать, чтобы как можно более походить на их генеральные прообразы, и каким образом надо строить "хорошие" статистики, отражающие известные параметры вероятностных распределений) 28 и методы проверки статистических гипотез (оценка степени правдоподобности гипотезы о наличии некоторых соотношений между случайными величинами в генеральной совокупности на основании расчета определенных характеристик соответствующих выборочных распределений). Подробнее о сути этих задач можно прочесть, например, в [Гласс, Стэнли, 1976; Паниотто, Максименко, 1982; Статистические методы анализа информации в социологических исследованиях, 1979, гл.6] 29. Здесь подчеркнем только, что правила переноса результатов с выборки на генеральную совокупность базируются на рассмотрении некоторых выборочных статистик как случайных величин и изучении определенных параметров их вероятностных распределений (скажем, если статистика - среднее арифметическое значение какого-либо признака, то упомянутое распределение для нее получится, если представить себе бесконечное количество выборок одного и того же размера и расчет для каждой выборки этого среднего; заметим, что, как известно, дисперсия такого распределения средних обычно называется средней ошибкой выборки и очень часто используется в эмпирических исследованиях).
В решении описанных двух задач по существу и заключается поиск статистических закономерностей. Ясно, что эти задачи весьма актуальны и для социолога. Другими словами, для него является естественным такое же понимание сути искомых соотношений между наблюдаемыми величинами, какое "заложено" в математической статистике. Обоснуем это более подробно.
Должны ли случайные величины интересовать социолога? Конечно. И социолог ими фактически пользуется, не употребляя, правда, соответствующего термина. В своей специфичной ситуации исследователь использует термин "признак" или "совокупность признаков". Обращение социолога к математической статистике по существу начинается со статистической трактовки значений используемых признаков. К примеру, чаще всего, социолога интересует не тот факт, что, скажем, ученик 10 класса средней школы № 5 города N Ваня Иванов намеревается поступить в институт, а более общее явление: например, то, что среди десятиклассников рассматриваемого региона, обладающих определенными социально-демографическими характеристиками (мужчин, горожан и т.д.), велика доля людей, намеревающихся получить высшее образование. Обобщая сказанное, можно полагать, что социолога интересует распределение долей тех объектов совокупности (десятиклассников изучаемого региона), которые обладают определенными значениями рассматриваемого признака (в нашем примере речь идет о признаке "намерение респондента"), или определенными сочетаниями значений нескольких рассматриваемых признаков (например, трех: пола, местожительства, намерения).
Первым шагом сжатия информации, содержащейся в матрице объект-признак (см. таблицу 1), как правило, является получение частотных распределений разной размерности (см. таблицы 2 и 3). Именно с изучения таких распределений обычно начинается анализ данных.
Таким образом, в качестве случайной величины перед социологом выступает признак (набор признаков), вместо вероятностей значений случайной величины исследователь имеет дело с относительной частотой встречаемости значений признака, вместо вероятностного распределения - с частотным, вместо параметров распределения - с отвечающими им статистиками. Рассчитав интересующие его статистики, он стремится обобщить результаты на генеральную совокупность.
Итак, основной объект, изучаемый математической статистикой, - случайная величина - является основным объектом изучения и для эмпирической социологии. Основные задачи, решаемые математической статистикой служат таковыми и для социолога, занимающегося изучением собранных эмпирических данных. Но, к сожалению, оказывается, что непосредственное применение математической статистики в социологии, зачастую, бывает весьма проблематично. Условия, предполагаемые строгими теоремами математической статистики, отнюдь не всегда выполняются на практике. И тогда вместо строгой математической статистики на сцену выступает не совсем строгое ее "приближение" - анализ данных.
Поясним, что именно мешает применению методов математической статистики в социологических исследованиях. Проведем линию размежевания между математической статистикой и теми лежащими вне ее методами, которые, давая социологу возможность поиска статистических закономерностей, в то же время позволяют преодолеть соответствующие трудности.
Сразу подчеркнем, что эти трудности можно разделить на две большие группы.
Трудности первой группы типичны не только для социологии, но и для многих других наук, имеющих дело с эмпирическими данными и направленных на выявление статистических закономерностей (в числе таких наук могут быть названы биология, геология, медицина, история, психология). Именно потребности таких наук послужили толчком к развитию методов анализа данных как некой замены математико-статистических подходов для тех ситуаций, когда последние оказываются неприменимыми.
Трудности второй группы специфичны именно для социологии. Говоря о них, мы будем иметь в виду не анализ данных вообще, а анализ социологических данных. В следующем параграфе коснемся трудностей первой группы. Социологическая специфика будет затронута в разделе 5.
Размещено на Allbest.ru
Подобные документы
Понятие методологии и современные концепции структуры социологического знания. Основные проблемы соотношения математики и социологии. Анализ опыта становления количественных методов в социологии, применение математики в социологических программах.
курсовая работа [42,9 K], добавлен 18.02.2012Отношение математики и социологии. Понятие эмпирических и математических систем. Примеры наблюдаемых и латентных переменных. Социологический опрос как инструмент сбора информации об объекте. Применение математических методов при измерении в социологии.
эссе [75,8 K], добавлен 02.10.2014Понятие социологии как прикладной науки, основные проблемы современной социологии, анализ предмета. Характеристика основных задач социологии, рассмотрение методов объяснения социальной действительности. Функции и роль социологии в преобразовании общества.
контрольная работа [137,6 K], добавлен 27.05.2012Анализ различных подходов к структуре социологии. Трехуровневая модель социологии и ее роль в развитии науки. Основы структурирования социологического знания. Основные категории и функции социологии. Место социологии в системе общественных наук.
реферат [36,9 K], добавлен 08.06.2010Рождение социологии и оформление в качестве новой и самостоятельной отрасли научного знания. Огюст Конт. Герберт Спенсер. Эмиль Дюркгейм. Макс Вебер. Средства и инструменты социального исследования. Объектом познания социологии.
реферат [47,0 K], добавлен 24.03.2007Три главных структурных элемента социологии. Интересы и потребности как структурные компоненты экономической социологии. Экономическое поведение, деятельность. Сущность и роль социальных отношений как структурного элемента экономической социологии.
реферат [20,4 K], добавлен 14.11.2010Понятие, основные отрасли и предмет социологии, явления (феномены), подлежащие ее изучению. Общество как объект социологического познания. Исследование явлений, вытекающих из взаимодействия людей и общностей. Структура и уровни социологического знания.
контрольная работа [44,6 K], добавлен 01.02.2016Предмет и методы социологии, ее функции в современном мире, структура социологического знания и основные принципы научного исследования, реализуемые в социологии. Связь социологии с философией, историей, психологией, политической экономией и правом.
контрольная работа [47,0 K], добавлен 16.09.2010Социальная жизнь общества как предмет изучения социологической науки. Теоретическое и эмпирическое уровни познания, их цели и методы. Общие и специфические законы в социологии, способы их проявления. Функции социологии как самостоятельной отрасли знаний.
контрольная работа [23,0 K], добавлен 22.12.2013Объект, предмет, функции и методы социологии, виды и структура социологического знания. История становления и развития социологии: становление социологических идей, классическая и марксистская социология. Школы и направления современной социологии.
курс лекций [112,4 K], добавлен 02.06.2009