Методика анализа содержания текстов

Понятие социологического исследования, формулирование социальной проблемы, к изучению которой приступает исследователь. Практика исследований текстов методом анализа, анализ содержания газет, радио и телевидения как источников социологической информации.

Рубрика Социология и обществознание
Вид курсовая работа
Язык русский
Дата добавления 29.04.2010
Размер файла 67,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Курсовая робота

Методика анализа содержания текстов

Зайцев А.Е.

Программа исследования как жанр

Первоначально социологическое исследование существует как замысел исследователя. И если мы здесь проведем аналогию со словами Рене Клера, который в свое время воскликнул: «Фильм готов! Осталось только снять его!», то это не будет большой натяжкой. Именно на этапе замысла, который формально выливается у социолога в своеобразный документ, называемый программой исследования, автор представляет совершенно отчетливо все остальные этапы.

По В.А. Ядову, программа - это изложение основных задач, методологических предпосылок и гипотез исследования с указанием правил процедуры и логической последовательности операций по проверке гипотез [1].

Хотя на этих страницах исполнитель исследования чаще упоминается в единственном числе, делается это ради простоты изложения. На самом деле технология добычи социологического знания требует довольно разнообразных профессиональных умений большого числа исполнителей. Еще и поэтому исследование на этапе своего замысла должно иметь организационный план своего осуществления, представление о финансовых затратах, о профессиональных ресурсах, о сроках исследования, о форме демонстрации (выдачи) результатов заказчику и т.п.

Прежде всего в программе формулируется социальная проблема, к изучению которой приступает исследователь. Это может быть новое социальное явление, распространенность и характеристики которого неизвестны обществу и поэтому являются самодостаточной задачей для социолога; это может быть и уже известное явление, но оставшеся до поры до времени вне поля зрения социологов - ситуация, при общей неразвитости социологических исследований в нашем обществе, довольно частая; это может быть и уже изученное социологами явление, но нуждающееся в повторном исследовании в связи с явными изменениями обстановки в стране и т.п.

В свое время американские исследователи считали вполне заслуживающим внимание социолога-исследователя текстов такие задачи:

Какие изменения претерпели в СССР первомайские пропагандистские призывы за время существования советской власти?

Как отражается склад характера писателя на том, что он пишет?

Каковы важнейшие тенденции в использовании научной литературы химиками и физиками за последнее время?

Как человеческие ценности, отображенные в американских пьесах, отличаются от ценностей, фигурирующих в немецких пьесах того же периода? Как моральные принципы, содержащиеся в американской бойскаутской литературе, отличаются от тех понятий о морали, которые мы встречаем в литературе «гитлерюгенда» (или в повести Гайдара «Тимур и его команда» - добавим мы: Л.Ф.)?

Как можно проверить коммуникацию, заподозренную в том, что она преследует подрывные цели, как достоверно выяснить, имеет ли она пропагандистское содержание или нет?

Какое сравнение можно провести между газетами и радиостанциями в отношении освещения ими сенсационных убийств?

Что делает ту или иную статью или произведение писателя «читабельными»?

Каковы сходные и отличительные черты политических символов, которые предлагаются вниманию людей в отдельных государствах?

Что происходит с хорошей книгой, когда на ее основании делается кинокартина? [2]

Приведем примеры таких вопросов, «привязанных» к нашим сегодняшним реалиям: каково содержание рекламы продуктов отечественного производителя? Чем эта реклама отличается от импортной? К каким ценностям личности она апеллирует, не является ли она дисфункциональной, не следует ли изменить ее характер? Таким вопросам несть числа.

В любом случае исследователь так составляет программу, чтобы в результате ответить на поставленный вопрос. Прежде всего, он должен отразить степень изученности проблемы до него. Эта стадия является началом любого исследования. Таким образом, анализ предшествующей литературы, содержащей попытки коснуться аналогичной проблематики, становятся не просто данью профессиональной этике, - хотя и это важно, - но и демонстрирует фундаментальность подготовки исследователя. Помимо этого данный этап имеет сугубо прагматическую ценность. Исследователь получает возможность поставить перед собой ранее нерешенные задачи, получить возможность для сопоставления своих результатов с ранее полученными и т.п.. Только так, в результате преемственности научного знания, его углубления общество получает знание о самом себе, что составляет главную ценность социологии.

Но - любой заданный исследователем самому себе вопрос, это лишь поверхностный слой проблемы. Действительно, каково тематическое распределение материалов в газете - это еще не проблема, это лишь материал для решения проблемы, а каким ему быть? Это распределение должно быть для молодежной газеты одним, другим для издания, считающегося в общественном мнении качественным, третьим для городского радио и т.д.

Теоретик может написать книгу о том, каким должно быть это распределение для всех этих каналов, ссылаясь на то, что все они потребляются одной аудиторией, или наоборот, потому что они потребляются разной аудиторией, поскольку все они вместе образуют иерархию каналов и потому каждый должен «обслуживать» свой участок, что они должны при этом учитывать иерархию тематических интересов аудитории...

Но при всем этом нужно знать реальное распределение материалов по темам, чтобы это было информацией к действию: к изменению, к переструктурированию тем, к усекновению одних и появлению других. Сейчас даже не важно, кто будет осуществлять это изменение: сам ли коммуникатор, или ему укажет на необходимость этого издатель, или это останется «гласом вопиющего» исследователя. Только так замкнется, так сказать, технологический цикл социологического исследования.

Каково распределение в газете «Истинный американец» (см. раздел 2) суждений о Гитлере и проч. - это не проблема; это лишь материал для решения проблемы: а каким ему быть в газете, издаваемой в стране, находящейся в состоянии войны с Гитлером? Симптоматично, что это исследование было буквальной информацией к действию - для суда, который обвинил газету в профашистской ориентации. Исследование, скажем тут мы, было, как никакое другое, «действенным».

Каков набор «моделей поведения» для домохозяек в американских «мыльных операх» - это не проблема; вопрос в том, каким ему быть, если исходить из более гуманистических теорий и концепций личности, чем рожденных в лоне общества потребления?

Хотелось бы предостеречь от узкого понимания роли контент-аналитика, как умещающейся только в рамках поставщика этой самой «добротной» информации для принятия решения. Именно степень «добротности» этой информации зависит от понимания аналитиком всего цикла исследования.

Я бы даже высказала одну кажущуюся парадоксальной мысль - неважно, присутствует ли весь этот цикл, прописывается ли он автром в отчете - а чем иным являются, например, книги, по которым мы знакомимся с историей контента, как не отчетом авторов о проделанном исследовании? Важно, чтобы он - этот цикл - осознавался в начале исследования и особенно - если это исследование осуществляется начинающим исследователем. Тут нелишне напомнить, что социологическое исследование - это всегда «точка зрения»: в данном случае на выбор определенных характеристик текста (по степени важности?), на интерпретацию «что такое хорошо» и «что такое плохо», на выбор определенных выводов для практических рекомендаций (по степени настоятельности?). Вспомним здесь и фигуру заказчика исследования. Из истории архитектуры известно, что там многое зависит не только от гениальности мастера, но и от гениальности заказчика.

Золотое правило, действующее во всех исследованиях средств массовой коммуникации, говорящее, что необходимо ясно осознавать, в чем состоит проблема, прежде чем исследовать ее, справедливо и для метода анализа содержания. Этот метод подразумевает большую кропотливую работу для того, чтобы решить проблему, Но не менее большая работа нужна, чтобы нащупать эту проблему.

В практике исследований текстов методом анализа содержания некоторым аналогом проблемы в конкретном исследовании выступает категория анализа. Это емкое, но вместе с тем лаконичное выражение проблемы. Категория анализа не является рабочей, непосредственно данной нам в тексте; эта характеристика скорее принадлежит всей совокупности текстов. Так, в нашем иллюстративном материале мы разбирали понятие «расовой дискриминации». Мы показали на примерах, что реальность дает нам самые разнообразные проявления расовой дискриминации, причем на этих проявлениях не всегда есть этикетка с надписью «расовая дискриминация». Авторы этого конкретного исследования работали с категорией анализа «квалификация героев рассказов разной расовой принадлежности» и пришли к выводу, что в текстах имела место расовая дискриминация. То есть - наблюдая совокупность текстов под углом зрения «квалификация героев разной расовой принадлежности» автор выходит на проблему «расовой дискриминации».

Или возьмем случай, когда в качестве категории анализа выступает «оперативность». Для ряда источников информации, подытожив результаты, мы бы вышли на проблему недостаточной оперативности его материалов. Этот пример как нельзя лучше показывает, что, введя только понятие «категория анализа», мы остаемся на очень высоком уровне абстракции. В самом деле - оперативность бывает разная. Какая? Материалы могут быть с «сегодня» и с «не-сегодня» случившимся поводом. Можно предложить другой вариант дробности: так, в анализе содержания местных газет, радио и телевидения как источников информации, осуществленных в рамках проекта «Общественное мнение» [3], использовались следующие градации оперативности:

Сообщение о событии дается в день совершения последнего

Сообщение о событии дается на следующий день после совершения последнего

Сообщение о событии дается через два дня после свершения

Сообщение о событии дается через три-семь дней

Сообщение касается события, произошедшего более семи дней назад или, как указывается в сообщении «недавно», «за последние дни» и т.д.

Сообщение касается события, дата свершения которого не указывается

Сообщение касается вневременных проблем

Видно, что анализировалась именно местная пресса тридцать лет назад - если бы мы исследовали сегодняшние информационные телевизионные выпуски, мы должны были бы предусмотреть репортажи с места события «минута в минуту» и т.д. А поскольку это были местные издания, где существовал такой способ донесения информации до читателя, как перепечатка из центральных газет, появление здесь градации с оперативностью трех-четырехдневной давности было вполне оправданным.

Когда же мы стали анализировать информационную телевизионную программу «Время» [4] - средство (и канал) заведомо более оперативное - мы пошли по пути дальнейшей дифференциации событийного повода материалов, идущих с грифом «сегодня». Это могли быть информационные сюжеты о событиях, которые можно было предсказать за много десятилетий до этого дня: так называемые календарные, юбилейные или знаменательные даты - «сегодня исполнилось 200 лет со дня рождения А.С. Пушкина». С другой стороны, это могут быть сюжеты типа «сегодня проснулся вулкан X » - событие, обладающее для аудитории максимумом неожиданности, непредвиденности, непредсказуемости. Потребовались и более «оперативные» градации для телевизионной программы общенационального масштаба.

Если проследить за нашей логикой описания оперативности, то она состояла в том, что мы описали ее с помощью разных типов, разных случаев оперативности. По сути дела, взамен однородного понятия оперативности мы создали группировку, классификацию разных типов оперативности. Как в жизни - для каких-то случаев достаточно сказать о спортсмене, что он хороший стрелок, а для каких-то - в спорте - надо уточнить, что он стрелок 3-го, 2-го, 1-го разряда, мастер спорта и т.п.

Обратимся с этой точки зрения к географии события, а значит, и материала о нем. Известно, что в нашей стране больше тысячи городов, десятки тысяч сел. Мы не можем в анализе состояния дел с «географической сбалансированностью», - если бы это было категорией анализа в нашем будущем исследовании, - отражаемой источником информации об объекте, говорить о представительности каждого населенного пункта: точек на карте слишком много. Сбалансированность такого рода может и должна подразумевать пропорциональную представительность достаточно крупных регионов. Каких? Существует множество типологий такого рода, исследователь вправе выбрать любую. Страна разделена на области, края, республики - можно говорить о представленности таких понятий; существует деление на экономико-географические районы: Урал, Западная Сибирь и т.д. - можно на этом построить анализ; существует типология поселений: село, малый город, средний город, крупный город - можно говорить о представленности таких типов поселений.

Мы, по сути дела, сделали следующий шаг в построении, создании программы исследования, который состоит в конструировании категориальной сетки, или, если выразиться на языке терминов, в классификации, группировке семантического пространства категории анализа. Если говорить образно, то речь идет о создании своеобразного сита, через которое будет просеяно реальное содержание исследуемого информационного источника, где роль ячеек будут выполнять типы, разные модификации категории анализа.

Обращаясь к конкретным текстам газет, радио и телевидения, исследователь оперирует рабочей единицей анализа. В нашем пример из исследования о расовой дискриминации таковой будет «персонаж» - фигура белого рабочего или темнокожего с определенной степенью квалификации.

Исследование оперативности материалов имеет в качестве единицы анализа отдельный материал, поскольку мы связываем оперативность с оперативным поводом целого материала.

Когда речь идет о географии информационного материала, единицей анализа может быть отдельный материал. Но вот большие газетные, теле- и радиоматериалы содержат (могут содержать) информацию о разных населенных пунктах, о разных областях и т.п. Значит, надо предусмотреть объем информации для анализа, который будет мельчайшей единицей текста, где может появиться упоминание искомого нами географического типа. Прежде всего это может быть слово, равное названию пункта (края, города, области, региона); это может быть абзац, посвященный нужной нам «географической точке»; это могут быть более пространные текстовые фрагменты, содержащие разговор о нужной нам точке.

Вот здесь пора вспомнить, что анализ содержания выясняет объем внимания к какой-либо проблеме в рамках отдельного материала, газетного номера, радио- или теледня, недели, месяца и любых других временных отрезков в деятельности анализируемого канала [5].

Оперируя словом как единицей анализа, мы подсчитываем, сколько слов приходится на тот или иной тип в избранной нами типологии, подразумевая, что чем больше слов посвящено какому-либо типу, тем больше внимания коммуникатор уделяет именно этому типу.

Оперируя абзацем как единицей анализа, мы подсчитываем, сколько абзацев посвящено тому или иному типу в избранной нами типологии, подразумевая, что чем больше абзацев, тем больше внимания уделяется тому или иному типу... При этом мы игнорируем разницу в размерах абзаца, рассматривая их равноправно, расцениваем, что несмотря на разницу в размерах, каждый из них прочитывается как бы на «едином дыхании», а с точки зрения автора текста - выражает законченную мысль.

Оперируя фрагментом текста как единицей анализа, мы должны измерить, какой фрагмент текста - крупный или небольшой - соответствует определенному типу поселения, Значит, появляется нужда в пространственных - если речь идет о газете, или временных - если речь идет о радио- или телепередачах, мерах. Можем измерять эти куски строками, площадью или минутами, секундами. То есть здесь мы выходим на новые, по сравнению со счетом по нарастающей, соответствующей количеству фиксируемых нами признаков, единицы измерения.

Таким образом, если сгруппировать все возможные методики оперирования с текстом, с учетом разных единиц анализа и разных единиц измерения, то грубо их можно разделить на две группы:

1. Единицей анализа выступает признак материала, который характеризует его в целом: это может быть оперативность - фиксация (или нефиксация) временной вехи события, которое выступает событийным поводом появления материала в потоке информации; это может быть функциональная принадлежность материала: так, радио- и телевизионные материалы традиционно делятся на информационные, развлекательные, учебные, утилитарные (реклама и справки).

Группировка может быть другой [6], но важно, чтобы каждый материал относился к той или иной группе по своей доминирующей функции.

В таких случаях признак должен описываться конечным числом случаев, или, иначе говоря, исследователь должен предусмотреть все возможные модификации признака, чтобы каждый материал был зачислен к той или иной модификации. Есть какие-то материалы, в которых бессмысленно искать оперативный повод, например художественные. Значит, исследователь предусматривает графу «материалы, не классифицируемые по этому признаку» и относит туда эти материалы [7]. Есть материалы, для которых трудно вычленить главную функцию - значит, исследователь предусматривает графу «трудно классифицируемые случаи» и относит туда этот материал. В совокупности все анализируемые материалы распадаются на столько групп, сколько модификаций признака предусмотрел исследователь. Подсчет количества материалов в каждой группе, принадлежащей одной модификации, происходит двумя способами, которые мы тут подытоживаем:

а - подсчитывается само количество этих материалов, выражаемое натуральным рядом чисел (от одного до n...);

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) материалов, приходящихся на каждую группу.

2. Единицей анализа выступает отдельный фрагмент текста: слово, персонаж, суждение, абзац, или нетвердо фиксируемый отрезок текста, совпадающий с определенной темой. Во всех случаях речь идет о довольно ограниченном наборе слов, персонажей, суждений, который интересует исследователя.

Их появление в тексте фиксируется уже значительно большим числом способов:

а - возможность подсчета количества упоминаемых в тексте слов, персонажей, суждений, тем и т.п. сводится к таким вариантам (разберем эти варианты для самого простого случая, когда единицей анализа является слово):

подсчитывается общее число упоминаний каждого слова;

подсчитывается количество предложений, абзацев, которые могут содержать искомые слова;

подсчитывается число материалов, в которых встретилось хотя бы одно искомое слово.

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) отрезков текста, содержащих нужное слово:

тут мельчайшей частицей выступают законченные, «оформленные» единицы площади (абзац, страница микрофонной папки с радио- и телематериалами) с нужным словом, сумма которых и подсчитывается;

суммируются площади материалов в целом, если они содержат хотя бы одно искомое слово.

Здесь следует ввести понятие единицы контекста. Обсудим его на примере подсчета слов, соответствующих категориальной сетке исследователя. Слово живет в рамках предложения; более сложной пространственной единицы, состоящей из нескольких предложений, если все они обеспечивают законченное суждение; абзаца и, наконец, материала в целом. Если объектом исследования служит небольшой текстовой материал, имеет смысл подсчитывать все количество упоминаний слова. Но иногда при больших объемах исследователи устанавливают единицы контекста, и тогда употребление хотя бы одного искомого слова в рамках абзаца считается равноценным его неоднократному употреблению в этом же абзаце. Более того, упоминание слова в рамках материала иногда фиксируется как равнозначное неоднократному его употреблению в рамках этого же материала.

Так, в исследовании языка политики школой Г. Лассвелла, когда кодировщики оперировали совокупностью анализируемых текстов в 20000 редакционных статей и 416 символами, отсутствие или присутствие которых они фиксировали в тексте, тактика кодировки состояла в том, что достаточно было встретить хотя бы одно упоминание - независимо от того, сколько на самом деле их было в тексте: ведь, как объяснялось в инструкции, вариации числа появления могли зависеть от индивидуального стиля автора [8].

Как правило, перед тем, как принять решение, какой стратегии подсчета придерживаться, проводится пробный подсчет вариантов - не искажает ли выводов выбор той или иной стратегии.

Чтобы проиллюстрировать механизм существования обозначенных нами категорий, единиц анализа, измерения и контекста, разберем с этой точки зрения некоторые исследования, которые мы ввели в пласт наших рассуждений о контент-анализе и которые, таким образом, уже знакомы читателю.

1 пример. В исследовании Г. Лассвелла « World Attention Survey », который мы подробно разбирали с точки зрения его фактуры, категорией анализа были символы политики, язык политики (поименованные политические деятели, названия идеологий, политических движений и партий, властных институтов); единицей анализа было слово; единицей счета было упоминание отдельного слова, количество их измерялось натуральным рядом чисел в абсолютном выражении или процентами в относительном выражении; единицей контекста - отдельный абзац в газетном материале.

В исследовании телемостов СССР - США мы использовали в качестве единицы анализа местоимения «мы», чтобы выйти на категорию «степень объединительных тенденций у участников телемостов». Как представляется, таблица 3.1 чрезвычайно показательна для оценки таких тенденций.

Таблица 3.1

Употребление местоимений участниками диалога «Ленинград-Сиетл» (в % к общему числу употребления «мы» каждым субъектом высказывания)

Употребление местоимения «мы»

Советская сторона

Американская сторона

ведущий

аудитория

ведущий

Аудитория

Американский и советский народ в совокупности

8

4

3

7

Участники телемоста в совокупности

8

5

5

9

Или только американский, или только советский народ

29

39

26

33

Или только американские, или только советские участники телемоста

16

5

26

1

Укажем, что единицей счета было тут каждое упоминание местоимения, а единицей контекста весь телемост в целом (понятно, что для такого скрупулезного анализа исследователь должен располагать стенограммой состоявшегося общения).

2 пример. Исследование Г. Лассвелла газеты «Истинный американец»: категорией анализа было отношение газеты к властным структурам трех стран (США, Германии, Японии); единицей анализа было суждение относительно правительства, лидеров или политики этих стран; единицей счета было упоминание этих суждений, количество их измерялось натуральным рядом чисел в абсолютном выражении; единицей контекста - отдельное предложение, в рамках которого могло появиться или одно, или несколько интересующих исследователя суждений.

3 пример. В исследовании телемоста «Ленинград-Сиетл» между американской и советской аудиториями мы получили по одной из задач исследования такие результаты (табл. 3.2):

Таблица 3.2

Характеристика задаваемых в ходе телемоста вопросов (в % к числу вопросов, заданных сторонами)

Характеристика вопросов

Советская сторона

Американская сторона

Вопросу предшествовала негативная информация о стране-адресате

18

32

Вопросу не предшествовала негативная информация

82

68

Здесь категорией анализа была оценочная нагрузка задаваемых в ходе обмена мнениями вопросов; единицей анализа - фрагмент текста, совпадающий с вопросом, заданным в ходе дискуссии, и вводкой к этому вопросу; единицей счета - натуральный ряд чисел как в абсолютном, так и относительном выражении; единицей контекста - каждый вопрос [9].

4 пример. В исследовании "Общественное мнение" в процедуре, связанной с анализом содержания местных газет, радио и телевидения, в одной из задач мы брали в качестве категории анализа сферу социальной действительности; единицей анализа был фрагмент текста, совпадающий с темой при описании каждой из этих сфер; единицей счета - пространственные (метрические) куски газетных колонок, совпадающие с этими темами, измеренные в условных единицах строкомером; единицей контекста - весь материал.

Как правило, перечень категорий и единиц анализа, способы оперирования с анализируемым текстом представлены в особом документе - инструкции кодировщика. Основная ее часть составляет перечень категорий и их типологических (или лексических) модификаций.

Эта часть обычно называется «кодом». Если продолжить пример с такой категорией анализа как «оперативность», то наш гипотетический код выглядел бы следующим образом:

Оперативность

1 - информация со словом «сегодня», в том числе:

календарные даты

непредсказуемые события

остальные случаи

информация о ранее случившихся событиях

информация без указания времени события.

Или возьмем категорию «география» (следующую типологию выбираем из-за краткости).

География

1 - крупный город

2 - средний город

3 - малый город

4 - поселок городского типа.

Осталось только снабдить этот фрагмент собственно инструкцией, например, указать, города с какой численностью населения относить к крупным, средним и малым, указать, какие справочники могут служить для уточнения данных о поселках городского типа.

Надо сказать, что реальные исследования редко ограничиваются одной-двумя категориями анализа.

Так, исследование местных средств массовой информации и пропаганды в проекте «Общественное мнение», которое мы уже представляли, имело следующие категории анализа: функциональная принадлежность материала, тип автора, жанр, оперативность, модальность, локальность, тема, элементы содержания, содержащие суждения о соотношении социалистической и капиталистической систем по признакам экономики, демократии, идеологии, условий развития личности [10].

Исследование информационной телевизионной программы Центрального телевидения «Время» (1984 - 19 87 гг.) оперировало такими категориями: тематика, суждения о роли СССР и США в борьбе за мир, авторство таких суждений, суждения об актуальных народно-хозяйственных проблемах СССР, география, степень критичности материалов, род занятий лиц, выступающих в программе, и лиц, упоминаемых участниками программы, жанр.

Теперь понятно, почему кодировщик должен располагать документами, где бы были перечислены все модификации характеристик, а также оговорены все правила анализа. Все это трудно запомнить, но, кроме того, такой текст нужен для решения спорных вопросов. По крайней мере нулевая отметка будет записана в этом исходном материале. И еще одно соображение, вес которого трудно переоценить - по правилам строгости анализа автор не может выступать в роли кодировщика. Слишком большой объем информации он содержит в уме и иногда принимает решения, исходя из этого обстоятельства. Трудно будет доказать критикам работы, выдерживался ли одинаковый под ход к разным текстам, не было ли ситуаций, когда «три пишем - два в уме». Автор должен снабдить кодировщика, а иногда и двух, «маршрутом и компасом» анализа, чтобы они, работая по одной инструкции, пришли к одинаковому выводу.

Кроме того, это действительно те документы, объясняющие, как получены те результаты, которые явились итогом анализа текста. Демонстрация инструментария считается одним из первых требований к корректному социологическому исследованию. Дело читателя исследования соглашаться или не соглашаться с авторской интерпретацией результатов, но он как минимум должен знать, как эти результаты получены.

Если представить себе конкретную ситуацию, когда кодировщик приступает к анализу выбранного массива газет или садится к экрану телевизора, чтобы отслеживать в тексте определенные характеристики, оговоренные кодом и инструкцией, то нужно предусмотреть еще один документ, где кодировщик будет фиксировать свои наблюдения (о возможностях применения на этой стадии компьютера мы еще будем говорить - соображения необходимости контроля за итогами кодировки иногда перевешивают и заставляют работать с реальными документами, зафиксировавшими итоги кодировки).

Эта фиксация может происходить одним из трех способов:

1-й из них может быть уподоблен работе с библиографическими карточками: на чистый бланк заносятся названия характеристик или числовая нумерация их по коду, эти бланки накапливаются и затем по мере необходимости суммируется частота появления той или иной характеристики.

2-й способ состоит в том, что предварительно заготовляется массив бланков с отпечатанными на них названиями характеристик (по типу «листка по учету кадров»). Кодировщику остается в нужном месте вписать обнаруженную им характеристику.

3-й способ - самый экономный, но возможный только для решения задач, когда исследователя интересуют лишь упоминания характеристик, но не объемы текста, где эти характеристики встречаются, - когда карточка представляет собой сплошной ряд чисел (совпадающий с общим числом кодов), а кодировщик обводит кружком лишь те коды, которые соответствуют встреченным в тексте характеристикам. Подсчет частоты появления каждой характеристики в целом по массиву будет итогом первичного анализа выбранной совокупности текстов.

Кодировщик выступает в исследовании непосредственным исполнителем, который работает по инструкции, составленной автором-исследователем.

По социологическим нормам принято, чтобы один и тот же массив газет и журналов (или текстов радио- и телепередач) обрабатывался двумя кодировщиками. Это повышает надежность полученной информации. Когда анализ не очень сложен, речь может идти об установлении чисто механических ошибок. Иногда же при сложности отнесения того или иного куска текста к той или иной единице анализа, могут возникать различные интерпретации текста и тогда ошибки возникают из-за недостаточной ясности инструкции кодировщику. Одно же из требований к любой методике анализа содержания состоит в том, чтобы она была составлена так ясно, чтобы разные исследователи, работающие по одной методике, пришли к одному и тому же выводу.

Когда в исследовании кодировщики имеют дело с идентификацией оценки коммуникатора того или иного факта, то случаи несовпадений бывают не такими уж редкими. Так, в исследовании 1995 г. российской прессы на предмет освещения ею лидеров и фракций Государственной Думы [11] процент совпадения решений кодировщиков по количеству материалов и абзацев с интересующими исследователя субъектами достигал 96 - 94%, в то время как для единиц, требующих идентификации текстового отношения к предмету внимания, совпадение достигалось лишь в 88% случаев.

В предыдущих разделах мы оперировали примерами из исследований прессы, радио и телевидения практически как равноправными. Это нуждается в некоторых пояснениях. Если представить информацию, идущую по каналам СМК, как передачу познавательной и эмоциональной структуры, то надо сказать, что контент-анализ имеет дело в основном с познавательной структурой именно потому, что она более «предметна», «объектна», следовательно, можно утверждать, что она и для анализа более доступна.

При том что теоретики радио и телевидения охотно отмечают как несомненно влияющие на эффективность восприятия такие специфические выразительные средства, как звук (шумовые эффекты) на радио, крупный план, ракурс и раскадровка на телевидении практики анализа содержания не включают (или редко включают) измерение этих вещей в свои программы.

Зависимость восприятия этих переменных может быть выяснена из экспериментов с приемником информации на психологическом уровне. Именно поэтому анализ содержания как метод, отмечая в каждом сообщении диалектическую связь чувственного и рационального, идет за рациональным, за мыслью.

Обратимся в этой связи к проблеме видеоряда, который помимо того что он состоит из планов, кадров и ракурсов воспроизводит на экране объективную реальность. Как общая методическая платформа для возможностей анализа этой реальности нашим методом может быть представлена такая практическая установка. Можно анализировать то, что поддается однозначной словесной интерпретации. Так, наличие на экране изображения какой-либо социальной реальности практически без трудностей поддается классификации в плане традиционного тематического членения.

Иногда такой анализ может существенно обогатить выводы исследователя. Например, в анализе телевизионной рекламы на трех ведущих коммерческих телесетях США, осуществленной в Анненбергской школе коммуникаций (Филадельфия, США), получено много информации - специалисту по рекламе покажутся значимыми и такие сведения о ней: в 63% случаев предлагаемый товар не показывается в телеролике, о нем только говорят, в остальных 33% он демонстрируется; статус пользователя, который мы можем увидеть на экране, в 95% случаев - это обычные люди, остальные - знаменитости; мужчины - 46%, женщины - 26%, вместе - 29%; возраст пользователя - ребенок (43%), молодой (13%), средний возраст (23%), старший (1%), смешанные ситуации (20%) [12].

Видеоряд в телевизионной рекламе вообще живет особой жизнью. Иногда даже «вещный» мир кино может восприниматься как реклама. И в этом ничего парадоксального нет. Героя в кино окружает современная ему жизнь. И почему бы в этой жизни не доминировать тем предметам, которые важны для рекламодателя? Действительно, коль скоро киноискусство воспроизводит «вещный» мир, было бы странно, если бы рекламодатели упустили такую блестящую возможность показать в этом мире именно ту «вещь», которую производят они.

Есть множество примеров, которые позволяют говорить об этом как о распространенной практике. Сидней Поллак, американский режиссер, автор фильма «Фирма» откровенно говорил Сергею Шолохову в его программе «Тихий дом», что появление в его фильме модели автомобиля «Линкольн» (если я не путаю марку) как свершения всех мечтаний героя не случайно. Между режиссером и автофирмой был заключен контракт, что по выходе фильм будет рекламироваться на всех автосалонах, где будет присутствовать эта модель.

Недавно газеты сообщили такую новость: оказывается, корпорация «Браун энд Уильямсон тобакко», выпускающая сигареты « Cool », платила актерам за то, что они курили на экране продукцию их фирмы. Клинт Иствуд и Пол Ньюмен получили машины, Шон О'Коннери - ювелирные украшения, Сильвестр Сталлоне - гонорар. Как сообщает журнал « Priier », в период с 1979 по 1983 гг. компания потратила около миллиона долларов на «подарки» кинозвездам-курильщикам. Сигареты этой марки фигурируют в таких фильмах, как «Рэмбо», «Рокки-4», «Внезапная коллизия» и «Лихорадка тела». Сталлоне курил эту марку в пяти фильмах, про Иствуда подробностей не сообщается, ведь он в образе ковбоя предпочитает сигары, но где он изменил им в пользу сигарет, неясно. По ходу дела выяснилось, что любимая марка Джеймса Бонда - это все та же любимица домохозяек. Вот этого англичане никак не могли простить своему национальному агенту 007 - Шону О'Коннери.

В 1990 г. американская киноиндустрия приняла даже решение не рекламировать больше табачную продукцию на киноэкранах. Не стали бы теперь из старых фильмов вырезать эти кадры, как сделали у нас в 1985 году, когда мы боролись по постановлению Партии и Правительства с алкоголизмом!

Еще один пример из моего собственного досье. Как-то по телевидению шел фильм-ужастик «Серебряная пуля». Там по ходу дела детишки борются с вампиром, которого, как утверждает местная легенда, можно убить только серебряной пулей. Сказано - сделано. Не пожалев фамильного серебра, брат с сестрой у местного же оружейника отливают такую пулю. И вот брат в роковую минуту мчится на мотороллере, то ли от вампира, то ли на встречу с ним. И что можно было прочитать на этом мотороллере - ну конечно « Silver Bullet »! Я с одной стороны чувствовала себя обманутой, а с другой восхитилась - надо же, целый фильм сочинили, и все во славу своей мотомодели!

Ясно, что такая форма телепродукции, как сериалы, не могла остаться в стороне от таких процессов по определению: во-первых, сериалы воспроизводят действительность максимально приближенным к ней способом (кино, например, в огромной степени отличается от других видов искусства именно по этому признаку), во-вторых, они собирают огромную аудиторию, по своему составу являющуюся заманчивой мишенью для рекламодателя (женская часть населения, на которой лежат преимущественно покупки для дома), в-третьих, к рекламе в телесериалах (до, после, и внутри) отношение более доброжелательное («сериальность» этого жанра, специальная драматургия, которая предусматривает места врезки телерекламы), чем появление в кинофильме.

Несколько лет назад по российским телеканалам прошел сериал «Моя вторая мама». По крайней мере в двух сериях главным действующим лицом был... океанский туристический лайнер с туром по Карибскому бассейну. Он доминировал над всеми сюжетными хитросплетениями и любовными интригами. Его было много. Герои были включены в самые разнообразные способы проведения времени на корабле: кино, танцы, бар, поездки на острова на лодках, загорание и демонстрация вечерних туалетов. Нужно ли говорить, что сам лайнер с огромной надписью его названия по борту всегда был, так сказать, в кадре, причем крупным планом. Я не удивлюсь, если окажется, что у себя на родине выход этого сериала способствовал резкому увеличению спроса на услуги, предлагаемые этим круизом.

Это обычная практика для телесериалов. В телесериале «Жестокий ангел» супруги-молодожены едут в свадебное путешествие, и супруг, в прошлом житель Португалии, по сюжету совсем не обремененный излишними знаниями, проводит настоящую экскурсию по столице, с наименованиями стилей архитектуры, датировкой строительства и т.д. Туристическая фирма, организующая поездки из Латинской Америки в Европу, несомненно, была в числе спонсоров фильма.

Конечно, такого рода примеры могли быть отслежены скорее традиционным путем - с помощью неспешного многолетнего наблюдения, с помощью собирания досье... Но все же и контент-анализ мог бы быть тут активным помощником. Было бы желание финансировать такой проект.

Здесь возникает проблема интерпретации видеоряда, когда заходит речь об оценках. Идея определить качество изображаемого объекта на оценочных весах «хорошо», «плохо» влечет за собой проблемы, которые не всегда просто решаются. Действительно, оценка - это свойство предмета, где на правах соавтора активно выступает сам оценивающий. Недаром существуют специальные психологические тесты, когда изображения одинаковых человеческих лиц предъявляются на оценку испытуемым (в данном случае - тестируемым) и они дают этим «героям», вернее, их портретам такие взаимоисключающие друг друга характеристики, что для психолога эти характеристики становятся предметом для выводов относительно самих испытуемых. Мы говорили уже о случаях, когда для выработки решения об оценке изучаемой характеристики приходится прибегать к «методу судей» и в контент-анализе.

Конечно, у изобразительного ряда есть свои возможности выржать чувства, вызывать оценки, достаточно однозначные у всей аудитории. Вспомним хрестоматийный киноведческий пример, когда изображение актера Мозжухина в кинокадре с тарелкой супа и то же изображение актера с гробом интерпретируется аудиторией по-разному: в одном случае актер воспринимается как комик, в другом - как трагик. Но для анализа содержания это слишком тонкие материи.

Чаще всего изобразительный ряд в СМК - на телевидении - живет по другим законам. Там он чаще всего (и тут могут быть проведены параллели между фото в газете) активно интерпретируется. Телекоммуникатор (в любой ипостаси - диктора, ведущего, репортера и т.п.) как раз старается снабдить визуальный ряд оценками, своими качествами. И вот уже в этом может быть обнаружено поле деятельности и для аналитика содержания. Не оказывается ли изображение и словесный комментарий к нему в конфликтном положении?

Хочется привести пример одного исследования влияния подписей под фотографиями на восприятие этих фотографий (аналогия с видеорядом и словесным комментарием к нему полная). В результате исследования автор получил такой набор возможностей сочетания характера подписи и самой фотографии:

1. Подпись значительно влияет на интерпретацию снимка, она может сформировать интерпретацию аудитории, коренным образом отличную от явного содержания снимка.

2. Именно содержание подписи может повлиять на то, чтобы интерпретация снимка произошла в нужном автору подписи направлении.

3. Иногда подпись вызывает реакцию реципиента, прямо противоположную той, которую вызывала своим содержанием фотография; если подпись предполагает в содержании фото смысл, несовместимый с его истинным содержанием, то она, как правило, игнорируется и интерпретация зрителя ориентируется только на снимок [13].

Проблема эта чрезвычайно интересная и разработка ее применительно к телевидению кажется весьма плодотворной.

Вообще контент-анализ телевизионных материалов помимо обозначенных проблем имеет и организационные проблемы, связанные с мимолетностью существования этой продукции в эфире. Как правило, если исследование оперирует большим числом переменных, не обойтись без предварительной консервации материала и неоднократного его прокручивания. Иногда исследование осуществляется непосредственно с эфира. Тогда непременным условием становится просмотр материала несколькими кодировщиками, обязательное протоколирование (хотя бы схематичное) эфира, и все равно количество характеристик, которые могут быть уловлены, уменьшается на порядки...

Таким образом, схематически процесс использования контент-анализа в конкретном эмпирическом социологическом исследовании можно представить так: формулировка задач исследования, определяющих выбор единиц наблюдения и разработку категорий анализа; операционализация последних, осуществляемая в инструкции кодировщику; перевод анализируемого текста в совокупность единиц анализа, подвергаемую счету; представление частотного распределения переменных; статистическая обработка и интерпретация результатов. Часть этого пути мы уже прошли.

Машинный способ анализа текста

Далее мы коснемся возможностей машинной обработки материалов способом контент-анализа. Из всех возможностей контент-анализа, которые суммированы в группах 1 и 2, ЭВМ можно поручить задачи анализа текстов, когда в качестве единицы анализа выступает слово. Когда мы говорим, что речь идет о достаточно ограниченном наборе слов, мы имеем в виду ограниченность с точки зрения человеческого мышления. Память же компьютера оперирует списком, состоящим из тысяч слов. Когда мы проверяем орфографию напечатанного текста, происходит операция сличения вашего текста с набором слов, уже введенных в память компьютера. И человеку, выступающему тут в качестве «машиниста», кажется, что число таких слов, введенных в память, беспредельно. Тем не менее оно «конечно», и машинный анализ текста возможен, когда в память ЭВМ заложены эти тысячи слов.

И тогда машина при обработке текстов ничем иным не занимается, как подсчитывает число материалов, где встречаются те слова, которые интересуют исследователя.

Такие операции находят все большее применение и предложениями - провести такой анализ - уже пестрят рекламные странички профессиональных журналов. Дело тут за малым: предусмотреть, например, возможности синонимического ряда понятий...

Более сложные случаи, когда речь идет о генерализации вывода, не обеспеченного симметричным рядом известных слов, пока неподвластны компьютеру, и на этот счет иллюзий пока питать не следует. Другое дело, что компьютер может выступать как машинописный лист фиксации результатов, к которым приходит кодировщик текста. Но и тут существует соображение контроля за этим выводом. Думается, что возможности предъявления такого анализа для контроля пока сдерживают применение компьютера в этом качестве.

Но вспомним, как все это начиналось. Группа ученых Гарвардского университета в США (рук. Ф. Стоун) в 1961 г. начала разработку принципов подобной машинной обработки, проведя серию анализов самых различных текстов: газет, сочинений членов малых групп, программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партий США, личных документов (писем, дневников, автобиографий) [14].

В рамках этого исследования было разработано несколько программ со следующими общими требованиями: компьютер отыскивает в тексте лингвистические аналоги тем категориям, которые интересуют и оговорены исследователем; подсчитывает частоту употребления этих категорий и их сочетания; выводит результаты в таблицы распределений; группирует текст в зависимости от употребляющихся там категорий и т.д.

Эти операции компьютер осуществлял только после того, как в его память были заложены языковые знаки (слова, идиомы, фразы), которые в своих группировках могут быть выражены на понятийном языке социальной теории исследователя и каждая из которых представляет из себя определенную переменную величину в его гипотезах. Для этого исследователь составляет словарь своего исследования: понятийному слову в качестве его расшифровки даны «носители» его смысла в бытующем в реальности языке.

Построение такого словаря аналогично построению «тезауруса» -- языка определенной области человеческого знания, когда ключевым словам из этой области знаний соответствует синонимический ряд общеупотребительных слов. Таким образом, словарная статья в «тезаурусе» - это более крупный семантический блок, чем словарная статья обычного толкового словаря.

Обозреваемое нами комплексное исследование включает следующие самостоятельные анализы.

Исследование Д. Данфи связано с изучением малых групп, оно основано на анализе вербального поведения членов малых групп. Целью этого изучения было выяснение ролевых различий в группах, связей, отношения к фигуре формального наставника - все это во временном развитии. Материалом для анализа были сочинения испытуемых групп. Основными категориями были самоотождествление, величина группы, служащей для испытуемых референтной, действия и эмоции, институциональный контекст и т.д.

Группа исследований была связана с политическими текстами, в частности, анализ М. Смитом, Ф. Стоуном и Е. Гленн программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партии США в течение 36 лет (от Смита и Гувера до Джонсона и Голдуотера).

Исследователи Дж. Нейменвирс и Т. Брейер провели анализ статей, опубликованных в газетах The Times (Англия), Le Monde (Франция), Frankfurtur Allgieine Zeitung (тогда еще Западная Германия), The New York Times (США), на предмет того, как, по их мнению, обстоит дело с политической интеграцией западных стран в связи с существованием экономических и военных союзов между ними.

Процесс межгосударственной интеграции понимался как изменение следующих четырех элементов: характер принятия решений, касающихся судеб различных стран; обмен между странами почтой, студентами; торговля, иммиграция; мнения масс и элиты по поводу перспектив на этот счет. Показателями изменений в ориентации анализируемых престижных газет были выбраны внимание к национальным и региональным символам и степень тождественности в ориентации газет всех четырех стран.

Даниэл М. Огилви построил специальный словарь для проверки гипотезы о существовании так называемого «комплекса Икара», психологического явления, которое отмечалось по наблюдениям психологов за рядом своих пациентов. Огилви решил подвергнуть испытанию эту гипотезу, проанализировав текстовые материалы, созданные в рамках разных культур. В качестве такого материала были выбраны сказки - 626 сказок из 44 примитивных сообществ. Контент-анализ этих сказок был предварен созданием так называемого «Икарианского словаря», охватывающего 74 категории и 2500 слов, их наполняющих. Для разработки системы категорий использовались разные источники: работы исследователей, описывающих комплекс Икара, истории жизни людей, явно обладавших этим комплексом, тексту наблюдений за ними психотерапевтов и т.д.

Поскольку изначально комплекс Икара определялся как направленность на «полет, падение, огонь, воду, бессмертие и нарциссизм»,, гипотезу о существовании комплекса на уровне анализируемых сказок можно было, по мнению автора, считать доказанной, если эти темы окажутся «связанными» в конкретных единицах фольклора, или на определенном этапе окажется возможным по одним темам предсказать появление в анализируемом тексте смежных тем. Итог анализа состоял в расчете корреляций между 74 категориями и факторном анализе конечной матрицы.

С самых первых попыток использования электронно-счетных устройств для работы с текстом становились ясными преимущества и недостатки обработки текстового материала с помощью машин - они обеспечивали адекватность анализа огромных текстовых материалов, но требовали огромных усилий по составлению программы - собственно «словника», с учетом всех синонимических вариантов понятий, которые надо будет отыскивать в этом море пропускаемых через машину слов. Не случайно, что многие из тех анализов, которые были проделаны в Гарвардском университете, использовали категориальный аппарат ранее проделанных исследований и «обкатывали» его на компьютерах.

Для начала же авторы системы «Дженерал Инкуайерер» создали отперфорированные тексты с общим количеством слов, равным 6 миллионам. Из этих слов была произведена выборка в 511 тыс. слов. Тексты, попавшие в выборку, были просеяны через процедуру поиска ключевого слова. В результате осуществления этой процедуры исследователи получили распечатку всех случаев употребления интересующих их слов в выбранной совокупности текстов. На реализацию процедуры ушло шесть часов машинного времени, а полученная распечатка была толщиной в несколько десятков сантиметров. Одним из самых неожиданных результатов процедуры было то, что для определения смысла ключевого слова оказалось вполне достаточно нескольких слов, расположенных по обе стороны ключевого слова. То есть для ряда задач не нужно было иметь значения всего предложения целиком, включая анализ его синтаксической структуры. Но оставались еще местоимения, идиомы и т.д.

Хотя первые словники создавались исследователями под конкретные задачи и главным тут была идентификация ключевых слов, сами авторы отлично понимали перспективы развития компьютерного дела - их размышления о том, что наборная клавиатура, связанная с компьютером, будет обычной принадлежностью школьного класса и делового офиса учителя, бухгалтера, психотерапевта, библиотекаря (ясно видно, что эти размышления относились к дореволюционной эпохе - до революции, когда был изобретен персональный компьютер), звучат сегодня как предвидение. Но для того чтобы выполнять все эти ожидаемые операции, нужно было, чтобы компьютер мог различать не только слова, но и смысл более пространных языковых единиц. Для этого нужно было решение проблемы синтаксического анализа. К сегодняшнему дню частично такие проблемы решены, коль скоро мы доверяем своему компьютеру - при наличии в нем специфических программ - проверку ошибок набранного текста.


Подобные документы

  • Задачи сбора социологической информации о журналистах. Способы социологического исследования работы журналистов и редакций. Анализ содержания материалов средств массовой информации (контент-анализ). Смысловые единицы анализа журналистских текстов.

    презентация [1,4 M], добавлен 10.03.2015

  • Программа социологического исследования. Основные методы сбора социологической информации: анализа документов, наблюдения, опроса, экспертной оценки и эксперимента. Обработка результатов исследования. Разделы статистики политической и общественной жизни.

    курсовая работа [82,7 K], добавлен 21.02.2014

  • Проектирование социологического исследования, обработка и анализ информации: понятие, этапы, механизмы и средства математической обработки данных. Подведение итогов, апробация, экспертиза и внедрение результатов исследования в социальной работе.

    контрольная работа [23,1 K], добавлен 06.12.2010

  • Сущность интервью с точки зрения одного из основных видов социологического исследования, социально-психологического взаимодействия между исследователем и респондентом. Основные правила проведения интервью. Методы анализа документов и виды исследований.

    контрольная работа [27,7 K], добавлен 19.08.2011

  • Количественные приемы сбора социологических данных. Проведение социометрических исследований в малой общественной группе. Практика использования методов изучения в работе современного руководителя. Качественные способы сбора социологической информации.

    реферат [56,2 K], добавлен 06.11.2011

  • Понятие исследования в социальной работе. Программа, объект и предмет, выборка, цель и задачи социологического исследования. Гипотезы исследования, интерпретация основных понятий. Положения социологической теории и конкретных социологические явления.

    реферат [16,7 K], добавлен 16.03.2010

  • Единое социологическое знание науки об обществе. Поиск, сбор, обобщение, анализ эмпирических данных. Анализ информации и подготовка итоговых документов социологического исследования. Комплексный характер методов сбора социологической информации.

    презентация [2,7 M], добавлен 19.10.2015

  • Значение исследований для специалиста по связям с общественностью. Методологическая, методическая и организационная функции программы социологического исследования, их сущность и применение. Факторы, от которых зависит качество социальной информации.

    реферат [7,9 K], добавлен 08.04.2009

  • Методы социологического изучения содержания публикаций. Реклама – как предмет социологического анализа. Гендерные стереотипы. Социологический анализ образа женщины в современной рекламе. Классификация методов анализа документов, и характеристика их видов.

    реферат [19,7 K], добавлен 02.12.2008

  • Основные виды, структура и функции социологического исследования. Роль программы в исследовании. Наиболее распространенные методы сбора информации. Этапы социологического исследования. Собственно-случайная, механическая, серийная и гнездовая выборки.

    презентация [682,7 K], добавлен 11.04.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.