Распространение новостной информации

Социальные сети, структура коммуникации online-оffline. Типология сетей виртуального пространства. Концепция "лидеров мнений" П. Лазарсфельда, ее соотнесение с онлайн медиа. Оценка системы мониторинга социальных сетей в качестве метода сбора данных.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 21.06.2016
Размер файла 79,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

На сегодняшний день внимание многих ученых, работающих в различных научных сферах, сосредоточено вокруг Интернет исследований. Особенно актуальными становятся работы, посвященные изучению феномена Больших данных. Высокие возможности современных компьютеров, широкое распространение Интернета, возрастающая доступность средств связи для различных групп населения сопровождается ежедневным приростом информации.

В виртуальном пространстве пользователи оставляют огромное количество информационных следов - публичные сообщения, фотографии, заметки, видео, личные данные. Социальные сети при этом, становятся удобной платформой для пользователя (для интеграции всех этих действий на одном сайте), так и для исследователей (для наблюдения за виртуальными процессами). Особое значение в области изучения социальных сетей придается исследованиям структуры виртуальных взаимодействий, информационному потреблению, а также проблемам доверия к информации в виртуальном пространстве.

Пространство социальных сетей предоставляет широкие возможности не только отдельным пользователям, но и различным организациям. Во-первых, это позволяет установить быстрый контакт с потребителем/читателем, а во-вторых, повысить охват распространяемой информации. В виртуальный диалог вовлечены не только производители каких-либо товаров, но и представители СМИ как ведущих национальных каналов и газет, так и отдельных частных изданий. Между такими акторами СМИ происходит борьба за читателей, которые в свою очередь должны буквально прорываться через непрекращающиеся потоки информации.

Однако сама структура таких информационных потоков мало известна. Она имеет сходные характеристики с оффлайновыми сетевыми моделями взаимодействия, но не может быть сведена к ним. Виртуальное пространство отличается высокой степенью анонимности таких сетей и иному распределению связей между акторами.

Огромное количество источников информации, разнообразное изложение одного и того же материала затрудняет ориентацию в анонимном пространстве виртуальной сети. В данном контексте особенно важным становится рассмотрение новостной коммуникационной сети. В виртуальном пространстве существует огромное множество различных новостных агентств, сайтов и отдельных акторов, распространяющих информацию, используя определенные механизмы действий. При повышении числа источников, транслирующих различную, часто противоположную информацию об одном и том же событии, снижается уровень определенности по отношению достоверности этой информации.

Следовательно, необходимо изучение информационных поводов и их структуры. Именно в таких случаях, когда информационный повод получает широкое распространение и обсуждение со стороны пользователей, важно понять, кто является лидером мнений в данной сети, из каких источников предоставляется информация, какова структура взаимодействий участников сети. Такое комплексное представление о распространении информации особенно важно в отношении ложных (содержащих недостоверную информацию) новостей, целью которых является создание информационной напряженности относительно какого-либо объекта/персоны/события.

В этом контексте становится особенно важным создание и развитие новых методов онлайн исследований. Отдельное место при этом занимают автоматизированные методы сбора и анализа информации, которые до сих пор остаются малоизученными и трудно применимыми в социологических исследованиях. Данная проблема тесно связана с недоступностью существующих программ для исследователей и сложностью самостоятельного создания специализированных программ для каждого необходимого вида анализа. Более того, существующие автоматизированные системы сбора информации не предназначены для социологического исследования, что обусловлено минимальным набором функций для анализа полученной информации. социальный сеть виртуальный медиа

Теоретической основой данной работы является концепция американского социолога Пола Лазарсфельда о «двухступенчатой коммуникации и лидерах мнений» . Согласно данной теории распространение информации от СМИ к обществу происходит через лидера мнений - персоне, обладающей большим уровнем доверия у групп населения. Далее посредством социальных сетей и связей охват распространения новости увеличивается. Более того, Лазарсфельд установил, что при коммуникации с лидерами мнений происходит не только увеличения распространения новости, но и влияние этой информации на аудиторию.

Следовательно, в процессе коммуникации важно не средство передачи информации (и, возможно даже не ее содержание), а позиция лидера мнений. Чем больше доверия эта персона имеет в глазах публики, тем больше будет охват.

В данной работе предполагается, что двухступенчатую модель коммуникации Лазарсфельда можно проследить и в виртуальном пространстве социальных сетей. То есть, информация СМИ размещенная на странице человека, обладающего статусом «лидера мнений» (человек, активно ведущий деятельность на страницах социальных сетей, обладающий большим числом виртуальных друзей, подписчиков), во-первых, сразу же получает большой охват аудитории, а во-вторых, повышает вероятность широкого распространения новости (за счет большого числа подписанных пользователей на страницу «лидера мнений»).

Следует отметить, что в данном контексте понятие «лидер мнений» имеет некоторые дополнительные характеристики (в сравнении с концептом Лазарсфельда):

1. Количество «друзей» как социальный капитал - число виртуальных подписчиков является одной из наиболее важных характеристик. Так, если у человека, допустим, 1000 друзей в социальной сети, следовательно, любая размещенная информация на данной странице потенциально может быть просмотрена тысячей людей. Если каждый из них сделает «репост» этой информации (разместит специальную ссылку на своей странице с указанием автора новости), то количество людей, которые увидят эту новость, будет увеличиваться в геометрической прогрессии. Далее по принципу «сарафанного» радио новость будет распространяться по аудитории.

2. Персона «лидера мнений»

Следует разделить лидеров мнений на две группы: реальные люди и сообщества.

В первом случае «лидер мнений» - это страница реально существующего человека (возможно, публично известного, например, политик, певец и так далее), у которого есть своя аудитория людей, доверяющих ему, которые подписаны на его аккаунт в социальных сетях. Социальная сеть необходима как площадка для общения этого актора с его аудиторией, мгновенного информирования .

Во втором случае - это популярные сообщества (группы) в социальных сетях, которые объединяют большое количество людей. В зависимости от выкладываемого контента эти группы можно разделить на: развлекательные, познавательные и так далее.

Более того, лидерами мнений могут быть аккаунты людей (или сообществ), которые на самом деле являются «фейковыми» пользователями . Это специально созданные учетные записи, которые используются для имитации сетевой активности вокруг каких-либо процессов, происходящих в виртуальном пространстве.

Исследовательская проблема

В анонимном виртуальном пространстве ведущую роль в распространении информации играют «лидеры мнений» - это те акторы, которые имеют огромное количество «друзей» (социальный капитал), активно ведущие свою страницу, размещающие контент и так далее. Это могут быть как профили известных людей, так и просто активные люди (в частности блоггеры), а также информационные агентства. Размещенная таким актором новость потенциально может быть прочитана всеми, кто подписан на данный профиль. Лидер мнений, участвуя в распространении новостной информации, может способствовать повышению интереса к ней со стороны подписчиков, которые, в свою очередь, также могут разместить ее на своей странице, что автоматически повышает охват новости.

Проблема заключается в то, что на индивидуальном уровне невозможно составить полное представление о составе сети, ее характеристиках и взаимосвязях. Необходимо детальное рассмотрение структуры распространения новостной информации в социальных сетях.

Исследовательский вопрос: отличаются ли структура распространения «реальной» и «ложной» новости?

Цель исследования

Анализ структуры распространения новостной информации в социальных сетях с применением автоматизированных средств-сбора данных (система мониторинга социальных сетей) и методов сетевого анализа.

Задачи дипломного исследования заключаются в следующем:

1. Определить и операционализировать понятие «ложной новости»

2. Описать основные принципы работы с инструментом мониторинга социальных сетей, определить существующие ограничения метода сбора данных, соотнести с построением выборки

3. Выявить различия в структуре реальных и ложных новостей

4. Определить характеристики «лидеров мнений» - акторов с большим числом связей с остальными участниками сети

Эмпирический объект исследования: совокупность информационных (новостных) сообщений, размещенных в социальной сети Twitter в период с апреля по май 2014 года. Единица анализа - единичное сообщение.

Теоретический объект: новостная информация («реальная» и «ложная»), распространяемая в социальных сетях

Предмет исследования: структура распространения реальных и ложных новостей

В выборку эмпирического исследования вошли 3 «реальных» и 3 «ложных» новости, опубликованных в апреле-мае 2014 года. Новости анализировались за недельный период (7 дней), начиная с момента публикации.

В качестве основной интернет-площадки для исследования распространения новостей была выбрана социальная сеть Twitter. Данный выбор обусловлен особенностями архитектуры данной социальной сети: Twitter - это микроблог, что означает публичный обмен короткими сообщениями (до 140 символов). Такая организация коммуникационной сети используется, с одной стороны, для оперативного информирования подписчиков о чем-либо, с другой стороны, для быстрого реагирования на публикуемые записи . Присутствие различных СМИ, а также высокая интеграция с внешними (по отношению к социальной сети Twitter) ресурсами, публичность коммуникаций позволяет выделить данную социальную сеть как особую информационную среду.

Предполагается, что структуры «ложных новостей» будут похожи по строению и характеристикам «лидеров мнений» между собой, и при этом, будут основательно отличаться от структур «реальных новостей». То есть, по анализируемым данным будет возможно выделить явные сходства и различия в структуре распространения «реальных» и «ложных» новостей.

Ограничения исследования

1. Доступ к информации в социальных сетях

Политика социальных сетей предоставляет человеку возможность защитить свои данные и размещенную информацию от публичного просмотра. Следовательно, даже если человек активно распространяет и публикует информацию и новости, но при этом закрывает общий доступ к странице, данная единица уже не будет включена в выборку.

Исследователь может работать только с той информацией, которая доступна для публичного доступа.

Более того, общая картина распространения информации может быть искажена за счет того, что люди могут и увидеть новость, отреагировать на нее, но не примут решения распространять ее дальше, либо писать комментарии к ней. Такие «пассивные пользователи» не учитываются в общих подсчетах, так как невозможно с достаточной уверенностью утверждать видели они новость или нет, передали ее другим людям (сообщением или же устно) или нет. Возможно говорить только о потенциальном охвате такой аудитории.

2. Принцип работы системы мониторинга социальных сетей.

Мониторинг социальных сетей -- это выборка текстов пользователей социальных сетей, основанная на тех или иных критериях отбора данных текстов.

Это определенный способ сбора данных, осуществляемый специальным программным обеспечением, в котором исследователь может задать ключевые слова для поиска, дату мониторинга, список исследуемых ресурсов. Все это автоматически выгружается в базу данных и уже может быть предметом анализа. Сама база представляет собой, помимо заданных критериев, конкретные сообщения пользователей, их «координаты» в Сети (никнейм, индивидуальная ссылка на сообщение, география и возраст, если это было указано респондентом). Более того, в этой же базе мы получаем сведения о потенциальном количестве пользователей, увидевших это сообщение, либо отреагировавших на него. Таким образом, мы получаем агрегированную базу текстов, с уже заданными кодами (тегами, словами поиска), которую можем анализировать как количественно, так и качественно.

В силу того, что данное программное обеспечение может осуществлять поиск только по собственной базе ресурсов (ссылок на различные типы социальных медиа), следовательно, нельзя говорить о генеральной совокупности источников.

В данном случае, этим ограничением можно пренебречь. Значительная доля коммуникаций происходит на широко известных платформах (таких как Twitter, Facebook, Livejournal, Вконтакте, Одноклассники), которые неизменно входят в выборку при любом виде мониторинга социальных сетей.

Основные результаты

В результате проведения сетевого анализа было выявлено, что оба типа информационных поводов имеют схожие характеристики по статистикам моделей. Акторы слабо связаны между собой, невозможно выделить кластеры.

Различия заключаются в индивидуальных характеристиках акторов каждой сети. В частности, ключевую роль играют такие пользователи, которые являются «лидерами мнений». Такие вершины имеют не только большую мощность узлов, но и большое количество подписчиков в сети Twitter.

Отдельно необходимо отметить специфику социальной сети Twitter в контексте изучения распространения новостей в данном виртуальном пространстве. В обоих случаях (реальных и ложных новостей) большое количество упоминаний связано с искусственным наращиванием объема публикуемых сообщений.

Речь идет об астротурфинге (astroturfing) - это искусственное формирование обсуждений, путем распространения информации, публикации комментариев по какой-либо теме на различных ресурсах с помощью специально созданных аккаунтов, имитирующих деятельность реального человека . Это может быть набор аккаунтов, которые периодически обновляют информацию, ведут свою страницу и внешне ничем не отличаются от других профилей реальных людей. Также посредством специальных программ возможно создание многочисленных профилей и автоматическое распространение информации через данные аккаунты. Такие искусственные «боты» позволяют за короткое время разместить одну и ту же информацию якобы от разных людей.

Высокая доля «фейковых» аккаунтов, ведущих искусственное наполнение информационного пространства сети, является ключевой особенностью распространения и реальных, и ложных новостей в Twitter.

ГЛАВА 1. ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ ОСНОВАНИЯ ИЗУЧЕНИЯ НОВОСТНОЙ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ СЕТЯХ

1.1 Современная Россия в Интернете: стремительное увеличение пользователей Сети

Охват Интернета в России сравнительно маленький: лишь 49% всей территории страны (в западноевропейских странах он равен 79%). Это означает, что практически половина нашей страны просто не имеет возможности выйти в сеть. Основная проблема заключается в труднодоступности некоторых регионов страны, недостаточном финансировании этого вопроса, непонимании его важности и значения.

При этом по данным Фонда Общественного мнения месячная доля пользователей Интернета в России равна 57,8 млн. человек, что составляет 50% населения России старше 18 лет (2012 год), по сравнению с прошлым годом этот показатель вырос на 15%. В день данный показатель составляет 44,3 млн. человек (38% совершеннолетнего населения страны), по сравнению с 2011 годом, показатель вырос на 22% .

Все это указывает, что российская аудитория Интернета активна, и с каждым годом она возрастает, охватывая новые населенные пункты страны. При этом важно отметить, что аудитория пользователей мобильного Интернета растет в два раза быстрее стационарного (по данным TNS).

Пользование Интернетом включает в себя множество всевозможных действий, которые при этом могут совершаться одновременно. Так, человек может общаться с кем-либо в социальных сетях, искать необходимую ему информацию, совершать покупки, оплатить счет и так далее. При этом, именно социальные сети играют наиболее интересную и значительную роль в практиках пользования Интернетом. 74,5% россиян посещают хотя бы 1 социальную сеть в месяц. Ежемесячная аудитория наиболее популярных социальных сетей (Вконтакте, Однокласники) составляет приблизительно 30 млн. человек в месяц, при этом, подавляющее большинство пользователей посещают эти сайты не реже 1 раза в неделю (Вконтаке - 77% посетителей, Одноклассники - 81%).

Социальные сети становятся не просто средством общения, но особыми Интернет-площадками, которые можно по-разному использовать для определенных целей и задач различных проектов. Так, например, в сети создаются сообщества по интересам, где выкладывается определенный контент. При этом, человек может состоять в неограниченном количестве сообществ, может также создавать их самостоятельно.

Аудиторию Интернет-площадок можно разделить на 3 группы:

1. Создатели контента

Именно эти люди задают информационный фон посредством публикации различных фотографий, информации, текстов, видео и так далее. Чем больше влияние у этого человека (например, создатель популярного сообщества, политический деятель, звезда шоу-бизнеса и так далее), тем больше будет значимость данного контента в кругу поддерживающих его людей.

2. Активные участники

Постоянно комментируют, реагируют на выкладываемый контент, ведут диалоги, выстраивают темы обсуждений. Это наиболее ценная группа пользователей.

3. Пассивные пользователи

Просматривают страницы сообществ, могут также в них состоять, просматривают обсуждения и комментарии, но сами ничего не пишут и не выкладывают. Такая аудитория сама многочисленная, и даже не смотря на то, что они пассивны, они также могут иметь значимость в контексте различных исследований. Ведь, тот факт, что они состоят в группе, уже может косвенно свидетельствовать о том, что данная тема им интересна, они видят информацию, размещаемую в сообществе, а, значит, также являются объектом влияния.

Благодаря современным средствам связи, информация в Интернет попадет практически сразу после события (или в некоторых ситуация и во время него). Важным становится, как эта информация преподносится. С одной стороны, это могут быть официальные сообщения новостных агентств, а с другой - собственная интерпретация происходящего. Кому в данном случае верить решает сам пользователь, при этом у него появляется возможность сравнения различных источников, но, что более важно, практически всегда может реагировать на это. Он может прокомментировать саму запись, либо написать что-либо самостоятельно, тем самым он вовлекается в общественную дискуссию, не выходя из дома, реагируя непосредственно во время события, то есть часто выдает свое первое мнение, реакцию.

1.2 Социальные сети: структура коммуникации online vs. offline

Одна из простейших форм передачи информации - это коммуникация. В то же время это многогранное понятие, включающее в себя различные особенности и характеристики. Научное исследование коммуникаций доказывает наличие сложных механизмов и различных форм, так, например, коммуникации исследуются в психологии, журналистике, политологии, социологии и так далее. Существуют различные теории об общественных коммуникациях, которые описывают структуру и особенности различных форм взаимодействия людей, групп и организаций. При этом, с развитием и усложнением общества появляются новые виды коммуникаций, что приводит к необходимости постоянного развития существующих теорий.

Взаимодействие людей невозможно без установления каких-либо связей, отношений между ними. Так, в течение своей жизни человек неизменно становится участником какой--либо социальной сети. Однако процесс коммуникации не ограничивается только межличностном взаимодействии.

Социальная сеть имеет множество определений, которые похожи по своему смыслу, но различны по своей форме и области применения. Изначально термин «социальная» сеть относится к изучению взаимосвязей между людьми. Впервые этим начал заниматься ученый Я.Л. Морено, которого считают основателем дисциплины сетевого анализа. Однако, самые ранние работы в этом направлении можно увидеть у Г. Зиммеля и Э. Дюркгейма, а также у известного антрополога Рэдклифф-Браунна. Сетевой анализ связан с построением социограмм и графов, визуально представляющих связи между людьми (точки - отдельные индивиды, линии - связи между ними). Такой анализ эффективен при изучении групп для понимания структурных особенностей взаимодействий между индивидами. Существуют различные виды социальных сетей: профессиональные, личные, досуговые, финансовые, и так далее. При этом, один человек может принадлежать одновременно нескольким сетям, входить в новые и уходить (либо исключатся) из них. Социальные сети можно также разделить на формальные и неформальные, горизонтальные и вертикальные.

При исследовании социальных сетей необходимо также рассматривать и позиции отдельных точек, то есть индивидов в ней. Так, можно выделить ядро социальной сети (точка с наибольшим количеством взаимосвязей), определить плотность сети, произвести кластеризацию индивидов. В основе анализа лежит математическая теория графов.

Другое определение социальной сети непосредственно связано с Интернет-платформами и программами. Так, социальную сеть можно определить как специализированно сконструированный сайт, предоставляющий возможность создания личного профиля (страницы), добавления и публикации какого-либо контента (фотографии, видео, заметки, комментарии), а также общения с другими пользователями, зарегистрировавшихся в данной сети.

В качестве примера социальных сетей можно привести наиболее популярные сегодня платформы: Facebook, Вконтакте, Одноклассники, Twitter, Instagram, Livejournal и так далее. У пользователей есть возможность создать собственный аккаунт, заполнить анкету о себе, «наполнить» свою страницу фотографиями, музыкой, видео, добавить «друзей». В данном контексте слово «друзья» было взято в кавычки, так как в виртуальном пространстве не существует вербального различия между друзьями, знакомыми, коллегами и так далее. Так, например, человек в реальной жизни может назвать друзьями троих людей, все же остальные - более слабые связи (знакомые, коллеги), либо более сильные, родственные (жена, муж, родители). В пространстве социальных сетей все эти люди (число которых может исчисляться сотнями) будет именоваться «друзьями».

Основная особенность виртуальных социальных сетей - это их глобальность. Человек может отправлять мгновенные сообщения на другие континенты, участвовать в групповых дискуссиях, искать информацию, публиковать ее на всеобщее обозрение и так далее. Многие реальные практики успешно интегрируются в виртуальное пространство социальных сетей.

Виртуальные сети могут объединить в себе все виды социальных сетей. Здесь люди могут вступать в группы по интересам, профессиональным или учебным нуждам (например, сообщество одногруппников для обмена актуальной информацией), финансовым и так далее и все это на одной платформе (например, Вконтакте). При этом, благодаря высокому развитию технологий и доступности средств связи все большему числу людей с различным материальным положением, число пользователей неизменно растет. Люди получают возможность практически беспрерывного общения, получения информации, мгновенного реагирования на события.

1.3 Типология социальных сетей виртуального пространства

Интернет-платформы можно разделить по особенностям строения и целей сайта и предоставляемых (сайтом) возможностей:

1. Социальные сети (Facebook, Вконтакте, одноклассники).

Сервис предоставляет также возможность публикации фотографий, видео, аудио, собственных записей, цитирования чужого контента

Цель - рассказать о своих новостях. «Что у Вас нового?» - такой вопрос демонстрируется человеку при просмотре его личной страницы. Социальная сеть как бы побуждает его написать и опубликовать последние новости, мысли, события, произошедшие с человеком. Также предполагается, что этот пользователь просмотрит и новости своих «друзей», возможно, оставит комментарий или выразит одобрение («лайк», «репост»). Все это нацелено на сравнительно длительное пребывание на данных сайтах.

Такие платформы предоставляют наиболее широкие возможности общения и виртуальной активности. Сервисы включают в себя и личные сообщения, возможности комментирования чужих записей, размещения контента практически любых форматов (тест, видео, изображения и так далее).

2. Микроблоги (Twitter) - публикация коротких заметок (до 140 символов), сервис для публичного обмена сообщениями

Цель - рассказать, что происходит

Ограничение на количество символов, а также особенности самой платформы сайта формируют особый тип общения: быстрый (в сравнении с социальными сетями) и четкий (человек должен сформулировать свою мысль буквально в 1-2 коротких предложениях). Это констатация факта, события, эмоции в момент их проявления. Это мгновенная (насколько это позволяет наличие доступа к Интернету) реакция на что-либо, происходящее в жизни человека.

Данная платформа не подразумевает возможности личных диалогов, пользователи общаются в комментариях к записи, что подразумевает публичность беседы. В зависимости от личных настроек, такие записи и комментарии к ним могут быть видны всем, либо только друзьям данного пользователя. Однако даже последнее ограничение публичности предполагает видимость такой беседы всем друзьям пользователя, что уже невозможно назвать личным диалогом.

3. Сервисы для обмена фотографиями и видео (Instagram) - возможность публикаций своих фотографий или коротких видео, применения различных фото-фильтров

Цель - показать, что происходит

Данный сервис предоставляет возможность только для визуальной передачи информации. При этом, существует ограничение на продолжительности видео (30 секунд). Также как и в микроблогах здесь отсутствует возможность передавать личные сообщения. Человек может выразить свое мнение в поле для комментариев, «лайкнуть» запись или же разместить у себя на странице (с отсылкой к автору).

Сам процесс передачи информации еще более быстрый и ограниченный. Пользователь может сопроводить свое фото какими-либо подписями (комментариями), однако их длина, как правило, тоже ограничена.

Как правило, большинство современных подобных платформ поддерживает функцию интеграции со всеми другими видами сервисов. То есть, размещенная на одном из сайтов информация автоматически дублируется и на другие (при условии согласия пользователя и его регистрации на всех сервисах).

На сегодняшний день, социальные сети становятся объектом внимания многих исследователей. В маркетинге изучаются и совершенствуются принципы общения с клиентами (SMM - Social Media Marketing). В психологии исследуются личные страницы пользователей, их контента, активности и так далее. Появляется новое направление в социальной антропологии - нетнография (netnography), изучающая виртуальные сообщества их внутренние правила и особенности взаимодействия. Для социологических исследований объектом изучения зачастую становятся блоги, где люди в открытой форме излагают свои мысли, мнения.

Главная особенность изучения социальных связей в виртуальном пространстве - получение большого массива данных автоматизированными способами, регулярное отслеживание изменений в режиме реального времени.

ГЛАВА 2. ИССЛЕДОВАНИЯ ИНТЕРНЕТ-ПРОСТРАНСТВ. ОСНОВНЫЕ ПОДХОДЫ В РОССИИ И ЗА РУБЕЖОМ

На сегодняшний день не существует единой классификации методов Интернет-исследований. Во многом это связано с тем, что данная сфера только начинает развиваться, многие методы еще не опробованы. Более того, до сих пор перед исследователями стоит проблема анализа таких данных, обеспечения качества и репрезентативности выборки и так далее.

Однако многие исследователи задумываются о том, как можно разделить существующие методы. Например, в работе И.Ф. Девятко «Инструментарий онлайн-исследований: попытка каталогизации" предлагается предварительная классификация методов онлайн-исследований по типам и источникам данных :

В данной классификации основой для различения методов является степень вмешательства исследователя в анализируемое им пространство. Таким образом, реактивные методы предполагают непосредственное участие и взаимодействие исследователя и респондентов (например, при помощи анкеты). То есть, данные, полученные в ходе такого применения метода, отражают реакцию респондентов на интересующие исследователя вопросы. Такой тип метода в целом похож на традиционный анкетный опрос, за исключением того, что все взаимодействие и весь процесс происходит в Интернет-пространстве.

Второй тип - нереактивные методы (малозаметные) - не предполагает влияние исследователя на респондента. То есть, собираются готовые данные, либо производится наблюдение за интересующей группой респондентов в Интернете. Данные методы можно сопоставить с «традиционными» методами включенного/невключенного наблюдения, контент-анализом готовых текстов (например, газетных статей). Основной принцип в данном случае - получить «чистые» данные, не спровоцированные вопросами исследователя, в естественной среде респондентов.

В то же время, в работе «Социальные сети и социометрические исследования: теоретические основания и практика использования автоматизированного инструментария изучения виртуальных сообществ» исследователями была так же предложена классификация онлайн-методов по принципу сбора данных: автоматизированные и неавтоматизированные методы.

2.1 Концепция «лидеров мнений» Пола Лазарсфельда. Соотнесение с онлайн медиа

В основе данной работы лежит концепция американского социолога Пола Лазарсфельда о «двухступенчатой коммуникации и лидерах мнений» . Согласно данной теории распространение информации от СМИ к обществу происходит через лидера мнений - персоне, обладающей большим уровнем доверия у групп населения. Далее посредством социальных сетей и связей охват распространения новости увеличивается. Более того, Лазарсфельд установил, что при коммуникации с лидерами мнений происходит не только увеличения распространения новости, но и влияние этой информации на аудиторию.

Следовательно, в процессе коммуникации важно не средство передачи информации (и, возможно, даже не ее содержание), а взаимодействие с лидером мнений. Чем больше доверия эта персона имеет в глазах публики, тем больше будет охват.

В данной работе предполагается, что двухступенчатую модель коммуникации Лазарсфельда можно проследить и в виртуальном пространстве социальных сетей. То есть, информация СМИ размещенная на странице человека, обладающего статусом «лидера мнений», во-первых, сразу же получает большой потенциальный охват, а во-вторых, повышает вероятность широкого распространения новости (за счет доверия людей к данной персоне).

Следует отметить, что в данном контексте понятие «лидер мнений» имеет некоторые дополнительные характеристики (в сравнении с концептом Лазарсфельда):

1. Количество «друзей» - число виртуальных подписчиков - одна из наиболее важных характеристик. Так, если у человека, допустим, 1000 друзей в социальной сети, следовательно, любая размещенная информация на данной странице потенциально может быть просмотрено тысячей людей. Если каждый из них сделает «репост» этой информации (разместит специальную ссылку на своей странице с указанием автора новости), то количество людей, которые увидят эту новость, будет увеличиваться в геометрической прогрессии. Далее по принципу «сарафанного» радио новость будет буквально расходиться по аудитории.

2. Персона «лидера мнений»

Следует разделить лидеров мнений на две группы: реальные люди и сообщества.

В первом случае «лидер мнений» - это страница реально существующего человека (возможно, публично известного, например, политик, певец и так далее), у которого есть своя аудитория людей, доверяющих ему, которые подписаны на его аккаунт в социальных сетях. Социальная сеть необходима как площадка для общения этого актора с его аудиторией, мгновенного информирования .

Во втором случае - это популярные сообщества (группы) в социальных сетях, которые объединяют большое количество людей. В зависимости от выкладываемого контента эти группы можно разделить на: развлекательные, познавательные и так далее.

Более того, лидерами мнений могут быть аккаунты людей (или сообществ), которые на самом деле являются «фейковыми» пользователями . Это специально созданные учетные записи, которые используются для имитации сетевой активности вокруг каких-либо процессов, происходящих в виртуальном пространстве

Выводы

Российская интернет-аудитория стремительно расширяется с каждым годом, вместе с этим растет число возможностей, предоставляемых пользователям онлайн средой. Различные виды деятельности человека успешно трансформируются в электронный формат, меняя привычные практики людей и общество в целом.

Особое значение приобретает изучение различных видов коммуникаций, которые можно отслеживать с помощью изучения социальных сетей. Практически любая интернет-платформа предоставляет стандартный набор опций для пользователя, желающего отобразить свою социальную жизнь в виртуальном пространстве. Такие наиболее популярные сайты как Facebook, Вконтакте, Одноклассники, Twitter, Instagram вошли в ежедневную практику огромного количества людей по всему миру.

Через такие интернет-платформы проходят различные потоки неструктурированной информации, которые, также как и в офлайне, могут быть изучены и тереотеризированы. Ведь по мере того, как происходит повсеместная компьютеризация общества, все больший прирост информации, накопление огромных массивов данных возрастает необходимость изучения таких явлений.

2.2 Неавтоматизированные методы

Нетнография

Интернет - это глобальная сеть данных, которые используются, создаются, обмениваются миллионами людьми ежедневно. Люди общаются в социальных сетях, форумах, создают свои группы, страницы. То есть, в Интернете постоянно происходят какие-либо социальные действия. Например, создается группа помощи больным детям, где люди могут помочь переводом денег на счет. При этом в Сети очевидно уже существуют определенные нормы и правила, которые регулируют такие действия. Например, создатель группы должен постоянно поддерживать ее активность, но, что наиболее важно, быть честным и убедить в этом других, ведь Интернет все еще является анонимным пространством.

Все это интересно для изучения, и уже сегодня появилось такое направление как нетнография. Хотя ее определение сформировал еще 1990 году Роберт Козинец, антрополог и этнограф, до сих пор это направление не было развито и не пользовалось популярностью. Ученый говорил о нетнографии как о процессе изучения виртуальных культур и сообществ, основанных на Интернет-коммуникациях .

Это этнография Сети, где изучаются нормы, правила, сложившиеся обычаи и традиции в Интернет-пространстве. В контексте данного направления можно было бы поставить такие вопросы как: почему люди доверяют друг другу в Интернете? Есть ли какие-то параметры, по которым можно отличить обман? Как формируются и «живут» группы? Как происходит принятие решения о приеме или отказе вступления в сообщество (если оно закрыто). Ведь условно Интернет сообщества можно поделить на «реально существующие» и «существующие только в Сети». Первые состоят из тех, кто действительно существует как группа в офф-лайне, например, студенческая группа, группа выпускников и так далее. То есть, эти люди взаимодействовали друг с другом помимо виртуального пространства. Вторые же, группируются скорее всего изначально в Сети, то есть до этого они никогда не виделись и в будущем также вряд ли будут взаимодействовать вне этой виртуальной группы. Конечно, существуют и такие сообщества, которые, формируясь изначально в Сети, позже устраивают какие-либо встречи, либо, например, создается сообщество, посвященное какой-либо популярной группе перед их концертом в данном городе. Люди могут вступать в это сообщество, общаться, многие даже ищут компанию для концерта, и все они потенциально встречаются в реальности.

В данном случае, такое различие нужно для того, чтобы понять отношения и правила взаимодействия в виртуальных сообществах. Так, если говорить о «реально существующих» группах, то, скорее всего, отношения между их членами сложились в реальном мире и регулируются там же, и в эту виртуальную группу переносятся уже существующие нормы и правила этой группы, а такое сообщество просто служит инструментом для каких-либо организационных вопросов. Более того, такие группы чаще всего закрытые, то есть, чтобы вступить в сообщество, необходимо подать заявку администраторам группы, которые будут решать, принимать этого человека или нет. В данном случае решение будет приниматься, исходя из того, знают ли этого человека в реальности хотя бы кто-то из группы и как он может быть с ней связан.

«Существующие только в Сети» наиболее интересны для нетнографии. Такие группы в большинстве своем анонимны, то есть, участники сообщества изначально не знакомы друг с другом, никак не взаимодействуют в реальности и вряд ли будут. Вступить в такие группы проще, чаще всего они открыты, они больше по численности. Однако их социальные взаимодействия вполне реальны. При этом, понятно, что существуют определенные механизмы взаимодействия, общения, маркеры, по которым люди могут определить обманщиков и так далее. Более того, анонимность Интернет-пространства, знание того, что человек никогда не встретится лицом к лицу с участниками этого сообщества, раскрепощает его, что позволяет исследователю увидеть настоящее мнение человека.

Выборочный метод

Производится контент-анализ с помощью количественных методов на случайной выборке. Например, в исследовании С. Хиндуйа и Дж. Патчин рассматривались личные профилей подростков в сети My Space , исследователи формировали выборку при помощи генератора случайных чисел. Это теоретически возможно, так как каждая страница имеет уникальный номер. Однако авторы статьи столкнулись с множеством ограничений данного метода: закрытые или удаленные страницы, пользователи неподходящего возраста, политика My Space, которая автоматически закрывает публичный доступ к страницам подростков 14-15 лет (то есть, информацию о пользователе могут видеть только его друзья).

Анализ поисковых запросов

Такие данные можно получить в свободном доступе от различных поисковых машин (Yandex, Google и так далее). Это частота поисковых запросов по определенным тематикам. Так, можно увидеть, что на данный момент волнует аудиторию Интернет сети, сравнить эти цифры по годам или странам.

Так же это может помочь исследователю найти актуальные темы для исследования, составить список ключевых слов, что может быть полезно для концептуализации и операционализации исследования.

Ручной мониторинг

Сбор информации посредством самостоятельного поиска. То есть, исследователь, при помощи поисковых машин (таких как Google, Yandex, Mail и другие) составляет запрос на интересующую его информацию. Далее он может просмотреть список выданных страниц и выбрать ту информацию, которая ему необходима, скорректировать свой запрос и так далее. Такой метод подходит скорее для предварительного ознакомления с исследовательским объектом, так как объем найденных страниц с упоминанием ключевых слов может превышать миллионные значения, что делает невозможным более детальный анализ объекта.

2.3 Автоматизированные методы

Мониторинг социальных сетей

На данный момент используется преимущественно в сфере маркетинга и PR, однако, по прогнозам специалистов, этот метод в скором времени выйдет за эти рамки и начнет широко использоваться в социологических исследованиях.

Люди открыто выражают свое мнение по различным вопросам. При этом это мнение не искажено эффектом интервьюера, ситуацией опроса, либо самим вопросом. Более того, это мнение может распространяться по определенным группам и пользователям, что уже может представлять основу для анализа.

Что такое мониторинг социальных сетей?

Мониторинг социальных сетей -- это выборка текстов пользователей социальных сетей, основанная на тех или иных критериях отбора данных текстов. А так же процесс сбора данной выборки и её интерпретации.

Это определенный метод сбора данных, осуществляемый специальным программным обеспечением, в котором исследователь может задать ключевые слова для поиска, дату мониторинга, список исследуемых ресурсов. Все это автоматически выгружается в базу данных и уже может быть предметом анализа. Сама база представляет собой, помимо заданных критериев, конкретные сообщения пользователей, их «координаты» в Сети (никнейм, индивидуальная ссылка на сообщение, география и возраст, если это было указано респондентом). Более того, в этой же базе мы получаем сведения о потенциальном количестве человек, увидевших это сообщение, либо отреагировавших на него. Таким образом, мы получаем агрегированную базу текстов, с уже заданными кодами (тегами, словами поиска), которую можем анализировать как количественно, так и качественно.

Полученная база позволяет применять различные методы работы с информацией. Так, можно увидеть динамику сообщений, всплески и спады количества сообщений, при более подробном контент-анализе можно выявить информационные поводы того или иного всплеска активности. Мы можем проследить за самыми активными участниками и лидерами мнений.

Средства Data Mining

Буквально это можно перевести как «раскопка данных», также это называют «интеллектуальным анализом данных». Это связано с тем, что с того времени, как началась повсеместная регистрация пользователей и их действий в Интернете, появилось огромное количество данных (при этом как количественных, так и качественных), которые необходимо было анализировать. Например, человек, регистрирующийся на сайте интересующей его компании, предоставляет им как минимум свои социально-демографические характеристики. Более того, на сайтах идет учет посещаемости различных разделов, активности пользователей, возможность реагирования на их вопросы и так далее. Все эти данные требуют нетривиальных решений.

Математическая статистика оказалась в данном случае неэффективной, так как она в основном предназначена для проверки уже имеющихся гипотез, но, что более важно, использует методы осреднения, что дает фиктивные данные на таких выборках (то есть, получается «средняя температура по больнице»). В это время, задача Data Mining найти нетипичные случаи, образцы. Это анализ фрагментов выборки (подвыборки), чтобы найти там свои существующие закономерности.

2.4 Смешанные методы: совмещение автоматизированных и неавтоматизированных методов

Они во многом объединяют или дополняют два вышеперечисленных метода :автоматический и неавтоматический. Это контент-анализ, Интернет-опросы и социометрия.

Так, например, при автоматизированном мониторинге социальных сетей исследователь получает выгрузку текстовых сообщений пользователей. Для расширения своего исследования он может не просто обозначить процентное распределение упоминаний, но также и провести качественный анализ сообщений, определить информационный повод, найти взаимосвязи. Более того, методами социометрии можно буквально увидеть, как распространялось сообщение, сколько людей потенциально могло его увидеть и так далее.

Интересно отметить, что неавтоматизированные методы используются в основном для гуманитарных исследований, в то время как автоматизированные - для решения частных задач компаний, фирм, организаций. Возможно, наилучшим решением было бы совмещение двух этих методов, однако, на данный момент существуют серьезные ограничения такого подхода.

1. Автоматизированные методы сбора недоступны для широкой аудитории. Не все программное обеспечение данного типа, во-первых, просто в использовании, а, во-вторых, доступно по цене. Так, например, сервисы мониторинга социальных сетей предоставляют различные тарифы, исходя из которых, формируются опции доступные для пользователя.

2. Ограниченность предоставляемой информации пользователями. В базу данных попадает лишь то, что человек сам захотел написать. В основном, существует проблема таких неуказанных данных как: возраст и место жительства, в некоторых случаях отсутствует и информация о поле (в некоторых случая о поле респондента практически невозможно узнать, особенно если в качестве имени он использует псевдоним, ник).

Более того, человек может умышленно искажать информацию о себе, более того создавать несуществующих людей (например, «фейковые» страницы, где заполнена информация о человеке, его увлечениях, даже ведется какая-то активность, но на самом деле это может оказаться человек другого пола, возраста и так далее).

Сюда же можно отнести «закрытость» многих страниц пользователей, а также групп и сообществ. В данной ситуации, человек сознательно ограничивает круг лиц, а также свою информацию, размещенную на странице от нежелательных ему людей (это могут быть, как все те, кто не является другом этого пользователя, незарегистрированные люди, а также конкретные пользователи в данной социальной сети).

Так как взмывание страниц является незаконным, получить реальную информацию во многих случаях затруднительно. Однако на сегодняшний день, многие люди зарегистрированы не в одной социальной сети, более того, все эти сайты интегрированы друг с другом (то есть, при размещении информации в одной социальной сети, она автоматически копируется на другую страницу, если, конечно, человек выбрал данную опцию). Люди производят огромное количество фотографий, которые тут же «заливают» в сеть. Все это делает создание «фейковых» страниц неэффективным. Однако это лишь предположение.

2.5 Эпоха Больших данных: начало перехода к новому понимаю данных

Современные технологии позволили перейти к качественно новому пониманию данных, информации и возможностей ее анализа. В виртуальном мире ежесекундно происходит огромный прирост новой информации: делаются записи в социальных сетях, регистрируются новые сайты, более того, привычная бумажная бюрократия также принимает электронный формат, превращаясь в огромные базы данных. Это ценнейшая информация, которая может быть использована практически в любой сфере общественной жизни.

Многие ученые из различных областей науки, таких как, биология, математика, информатика, психология, социология, политология, маркетинг видят огромный потенциал использования Больших данных. Более того, огромная мощность современных компьютеров (по сравнению с вычислительными машинами прошлых десятилетий) делает возможным быструю обработку, хранение и накопления таких больших баз данных. На сегодняшний день важной задачей становится понимание того как анализировать эти данные, как защитить персональную информацию пользователей и какие специалисты необходимы для данной работы.

Особенно актуальна эта дискуссия для гуманитарных наук, где исследователи «разделились» на две стороны . Одни считают, что в эпоху Больших данных традиционный подход не эффективен и следует «позволить данным говорить за себя», а не пытаться объяснить данное социальное явление с помощью различных теорий. Другие же исследователи наоборот призывают к еще более ответственному подходу к социологическим теориям и необходимости применять их в контексте Больших данных.

Рассмотрим оба подхода более подробно.

Согласно первому из них анализ Большие данные перевернут традиционный подход к социологическим исследованиям и самому объекту познания. В книге Виктора Майера-Шенберга «Большие данные: революция, которая изменит то, как мы живем, работаем и мыслим» предлагается новый подход к имеющимся данным: не искать причинно-следственную связь, а находить корреляции . Это обусловлено характером данных, которые исследователь получает для дальнейшего анализа, а именно, их неструктурированность и неорганизованность. Нужно «позволить данным говорить» - это означает, что не нужно заранее продумывать гипотезы и составлять вопросы, это было необходимо в традиционных исследованиях. В ситуации с Большими данными, где очень сложно упорядочить входящие потоки информации, а зачастую и просто невозможно (из-а огромных денежных, трудовых и временных потерь), необходимо «погрузиться» в эти данные, пытаться найти там какие-либо закономерности, «выбросы», что-то новое, что дает новую информацию и решения.

В традиционных исследованиях, при невозможности охватить все случаи, используются выборки, которые позволяют масштабировать небольшое количество данных (относительно общего объема) на всю совокупность. При этом, полученные данные строго структурированы и формализованы, вопросы анкеты четко продуманы и отражают исходные цели и задачи исследования. Сами же результаты, в большинстве случаев, представляются как средние значения и вероятности.

В эпоху Больших данных мы можем исследовать все интересующее нас пространство: «N = все» . Современное технологическое оборудование позволяет обрабатывать огромные базы данных, и более того, собирать их в режиме реального времени. Исследователь в кратчайшие сроки получает массив данных, который он может рассматривать с различных сторон, искать какие-либо связи между объектами. Он получает всю совокупность за интересующий его период, при этом, заранее не зная, что может там обнаружить. С одной стороны, это может показаться проблемой, ведь как анализировать данные, не понимая, какие выводы необходимо получить. Но с другой стороны, это дает исследователю огромную свободу для поиска новых решений и связей, сами данные «расскажут» ему о своей специфике и характере.

Наиболее радикальный аргумент о «конце теории» рассмотрен в статье Криса Андерсона «The End of Theory: The Data Deluge Makes the Scientific Method Obsolete» , 2008 год. Автор утверждает, что в эпоху Больших данных, когда исследователи получили возможность с высокой точностью отслеживать потоки информации, нет необходимости строить абстрактные теоретические модели. «This is a world where massive amounts of data and applied mathematics replace every other tool that might be brought to bear. With enough data, the numbers speak for themselves» .


Подобные документы

  • Анализ методов и средств выявления мнений пользователей социальных сетей. Обзор средств мониторинга и анализа, подбор необходимого программного обеспечения и технических средств. Разработка архитектуры базы данных, реализация программных модулей.

    дипломная работа [3,7 M], добавлен 19.01.2017

  • Разработка системы мониторинга пользовательских запросов в крупной социальной сети - ООО "В Контакте". Анализ маркетингового положения компании в сфере социальных сетей. Характеристика потребительского сегмента. Техническая поддержка социальных сетей.

    дипломная работа [3,0 M], добавлен 25.10.2015

  • История развития и классификация социальных сетей. Характеристика наиболее популярных социальных сетей. Сети Рунета: ВКонтакте, Одноклассники, Мой круг, Мой мир (на www.mail.ru), RuSpace. Социальная сеть Facebook как лидер среди социальных сетей.

    реферат [4,0 M], добавлен 23.06.2012

  • Изучение понятия социальных сетей. Классификация социальных сетей по тематике и по форме общения их аудитории: общетематические, специализированные, глобальные, мультимедийные, блоги, микроблоги. Facebook - одна из самых популярных социальных сетей.

    презентация [405,6 K], добавлен 05.06.2013

  • Типы социальных сетей, их влияние на современного человека. Тенденции и перспективы развития социальных сетей. Внедрение в повседневную жизнь мобильных интернет-технологий. Анализ социальной сети на примере VK.com - крупнейшей в Рунете социальной сети.

    курсовая работа [48,0 K], добавлен 07.08.2013

  • Сущность и значение мониторинга и анализа локальных сетей как контроля работоспособности. Классификация средств мониторинга и анализа, сбор первичных данных о работе сети: анализаторы протоколов и сетей. Протокол SNMP: отличия, безопасность, недостатки.

    контрольная работа [474,8 K], добавлен 07.12.2010

  • Понятие и общая характеристика социальных сетей, принципы их функционирования, достоинства и недостатки использования. Формирование функциональных требований к информационному пространству научных исследований. Направления исследований социальных сетей.

    дипломная работа [222,7 K], добавлен 18.07.2014

  • Классификация компьютерных сетей. Назначение компьютерной сети. Основные виды вычислительных сетей. Локальная и глобальная вычислительные сети. Способы построения сетей. Одноранговые сети. Проводные и беспроводные каналы. Протоколы передачи данных.

    курсовая работа [36,0 K], добавлен 18.10.2008

  • Анализ виртуального пространства и реальности. Особенности информационной культуры субъектов виртуального пространства. Телевидение, кабинные симуляторы, системы "расширенной" реальности и телеприсутствия. Настольные ВР-системы, социальные сети.

    презентация [6,0 M], добавлен 15.11.2017

  • Обзор существующих решений на основе открытых данных. Технологии обработки данных и методы их визуализации. Социальные сети для извлечения данных. Ограничение географической локации. Выбор набора и формат хранения открытых данных, архитектура системы.

    курсовая работа [129,5 K], добавлен 09.06.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.