Анализ ближайшего окружения социальной сети
Число сообществ, модулярность и коэффициент кластеризации как основные структурные характеристики, которые используются в сетевом анализе. Специфические особенности структура сообществ в ближайшем окружении пользователей социальной сети "Вконтакте".
Рубрика | Математика |
Вид | статья |
Язык | русский |
Дата добавления | 02.02.2019 |
Размер файла | 68,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
В работе [1] авторами описан подход для извлечения данных о пользователях сети «Вконтакте» с использованием протокола OAuth 2.0 и метода программного интерфейса социальной сети «friends.get». В данной статье, продолжаются исследования из [1], анализируются сети, представленные в табл. 1.
Корневыми аккаунтами, используемыми для извлечения данных являются аккаунты деятелей политики и кино (Медведев, Жириновский, Харламов, Охлобыстин), а также сотрудников кафедры АСОИУ ОмГТУ, двое из них являются преподавателями (Богатов, Юдин), а один студентом (Ниткин).
Таблица 1 - Основные характеристики исследуемых сетей соседства
Идентификатор корневого аккаунта |
Фамилия лица, указанного для корневого аккаунта |
Количество вершин |
Количество ребер |
|
80491907 |
Харламов |
1 149 649 |
1 339 609 |
|
53083705 |
Медведев |
494 067 |
751 092 |
|
85686810 |
Ниткин |
789 936 |
1 501 584 |
|
3252819 |
Юдин |
422 690 |
595 397 |
|
38940203 |
Жириновский |
476 815 |
676 646 |
|
238615607 |
Охлобыстин |
438 670 |
557 896 |
|
17202491 |
Богатов |
735 718 |
1 171 335 |
Исследование структурных характеристик
Используя разбиение узлов на подмножества, представляющие собой круги соседства [1], получим подмножества узлов, представленные на рисунках 1-3. Рисунки отражают количество пользователей в каждом «круге друзей», и количество связей между кругами и внутри круга друзей. В первом круге друзей находятся все непосредственные друзья узла, определяющегося корневым аккаунтом. Во втором круге все друзья узлов первого круга, если они не входили в первый круг или не являются самим корневым аккаунтом. Так для структуры сообществ аккаунта Медведева на рис. 1 среди ближайших друзей (круг 1) мы обнаруживаем 13 аккаунтов, между которыми имеется 15 связей.
Рис. 1. Структура сообществ в ближайшем окружении пользователей «Вконтакте» с аккаунтами а) Медведева, б) Охлобыстина, в) Жириновского
Рис. 2. Структура сообществ в ближайшем окружении пользователей а) Харламова, б) Ниткина
Рис. 3. Структура сообществ в ближайшем окружении пользователей а) Богатова, б) Юдина
сетевой кластеризация модулярность сообщество
В табл. 2 представлены структурные характеристики, используемые в сетевом анализе. Это число сообществ, модулярность и коэффициент кластеризации. Эти характеристики можно посчитать во многих пакетах программ, таких как пакет igraph для среды R, а также разрабатываемой на кафедре программе Simbigraph [2]. Однако, исходя из результатов табл. 2, характеристики подсетей при анализе аккаунтов знаменитостей (Жириновский, Охлабыстин, Медведев, Харламов) и сотрудников кафедры АСОИУ (Богатов, Юдин, Ниткин) не имеют между собой существенных отличий.
Таблица 2 - Классические структурные характеристики сетей
Фамилия лица, указанного для корневого аккаунта |
Модулярность |
Число сообществ |
Коэфф.кластеризации |
|
Жириновский |
0,799683 |
91 |
0,0007509112 |
|
Охлобыстин |
0,8423793 |
126 |
0,0004320565 |
|
Медведев |
0,7562697 |
82 |
0,002142905 |
|
Харламов |
0,7141925 |
102 |
0,001675214 |
|
Богатов |
0,798224 |
102 |
0,001135454 |
|
Ниткин |
0,6548189 |
100 |
0,001946737 |
|
Юдин |
0,8273358 |
103 |
0,0009504109 |
В данной работе мы предлагаем использовать при анализе ближайшего окружения исследовать не сеть в целом, а подмножества сети, представляющие собой круги соседства, по отдельности. Так коэффициент кластеризации будет характеризовать не вероятность, что у случайно выбранного во всей сети аккаунта соседние аккаунты являются также связанными отношением дружбы, а вероятность, что у случайно выбранного в конкретном круге аккаунта соседние узлы являются также связанными отношением дружбы.
В таблице 3 и 4 представлены коэффициенты кластеризации по 1-му и 2-кругу, отсортированные по возрастанию.
Таблица 3 - Коэффициенты кластеризации по 1-му кругу
Фамилия лица, указанного для корневого аккаунта |
Коэффициент кластеризации для 1-го круга пользователей корневого аккаунта |
|
Ниткин |
0,013608827 |
|
Юдин |
0,003490939 |
|
Богатов |
0,002622816 |
|
Харламов |
0,002008977 |
|
Медведев |
0,001758565 |
|
Жириновский |
0,001469259 |
|
Охлобыстин |
6,17E-04 |
Исходя из анализа таблиц, можно сделать вывод, что показатели для знаменитостей в ближайшем круге (табл. 3) сильно отличаются от показателей сотрудников кафедры АСОИУ, в дальнейших кругах эта разница постепенно «размывается» (табл. 4, табл. 2).
Таблица 4 - Коэффициенты кластеризации по 2-му кругу
Фамилия лица, указанного для корневого аккаунта |
Коэффициент кластеризации для 2-го круга пользователей корневого аккаунта |
|
Медведев |
0,00179 |
|
Харламов |
0,001435 |
|
Ниткин |
0,001435 |
|
Богатов |
0,001434 |
|
Юдин |
0,000714 |
|
Жириновский |
0,000572 |
|
Охлобыстин |
0,000332 |
Также рассмотрим такой показатель как вероятность, что друзья случайно выбранных аккаунтов, связанных отношением дружбы и находящиеся в заданном круге, образуют между собой и с этими аккаунтами полный граф из трех и четырех вершин и другие виды подграфов (см. табл. 5 и табл. 6). Подсчет этих значений выполним методом, предложенным в [3], c некоторыми модификациями.
Таблица 5 - Вероятности подграфов на четырех вершинах для двух связанных аккаунтов у первого слоя. Данные отсортированные по возрастанию сумм последних двух столбцов
Богатов |
0,7692 |
0,209 |
0,0016 |
0,0156 |
0,0046 |
|
Юдин |
0,8229 |
0,1611 |
0,0011 |
0,0115 |
0,0034 |
|
Ниткин |
0,8231 |
0,161 |
0,0028 |
0,0111 |
0,002 |
|
Медведев |
0,8207 |
0,17 |
5,00E-04 |
0,0086 |
2,00E-04 |
|
Харламов |
0,8722 |
0,1209 |
6,00E-04 |
0,0052 |
0,0011 |
|
Жириновский |
0,8446 |
0,1512 |
4,00E-04 |
0,0035 |
3,00E-04 |
|
Охлобыстин |
0,9167 |
0,0796 |
7,00E-04 |
0,0028 |
2,00E-04 |
Таблица 6 - Вероятности подграфов на четырех вершинах для двух связанных аккаунтов у второго слоя. Данные отсортированные по возрастанию сумм последних двух столбцов
Богатов |
0,7357 |
0,2373 |
0,0036 |
0,0231 |
0,0003 |
|
Юдин |
0,7822 |
0,1924 |
0,0639 |
0,0211 |
0,0004 |
|
Ниткин |
0,7839 |
0,1939 |
0,0036 |
0,0183 |
0,0003 |
|
Медведев |
0,8108 |
0,1741 |
0,0009 |
0,0125 |
0,0017 |
|
Жириновский |
0,8063 |
0,1798 |
0,0023 |
0,0114 |
0,0002 |
|
Охлобыстин |
0,8475 |
0,1422 |
0,0014 |
0,0085 |
0,0004 |
|
Харламов |
0,8566 |
0,13335 |
0,0017 |
0,0077 |
0,0005 |
Полученные данные свидетельствуют о целесообразности гипотезы о расчете структурных характеристик сети не по всей неполной сети, а по подсетям, полученным на основании анализа соседства исследуемого аккаунта. При использовании предложенного подхода полученные показатели четко разделяют аккаунты известных российских политиков и общественных деятелей от аккаунтов «обычных» пользователей сети, в качестве которых в приведенном исследовании являлись аккаунты сотрудников кафедры АСОИУ ОМГТУ.
Литература
1. Ниткин Д.А., Юдин Е.Б. Исследование социальной сети «ВКонтакте» // Информационные технологии и автоматизация управления. Материалы VI Всероссийской научно-практической конференции студентов, аспирантов, работников образования и промышленности (Омск, 27-30 апреля 2015 г.). - Омск, - 2015. -С. 144-150.
2. Курчанов А.А., Юдин Е.Б Программа расчета метрических характеристик больших графов // Омский научный вестник. - 2014. - № 3 (133). -С. 217-221.
3. Юдин Е.Б., Задорожный В.Н. Расчет числа сетевых мотивов методом случайной выборки каркасов// Омский научный вестник. - 2015. -№ 140. -С. 208-211.
Размещено на Allbest.ru
Подобные документы
Классификация методов кластеризации и их характеристика. Метод горной кластеризации в Matlab. Возможная область применения кластеризации в различных предметных областях. Математическое описание метода. Пример использования метода на реальных данных.
реферат [187,0 K], добавлен 28.10.2010Основные понятия теории массового обслуживания: марковский процесс, простой поток, сеть Джексона. Исследование стационарного распределения сети с ромбовидным контуром: для марковских и немарковских процессов, а также для сети с отрицательными заявками.
дипломная работа [957,4 K], добавлен 17.12.2012Число Пи как математическая константа. Основные особенности вычисления числа Пи. Методы определения численного значения числа Пи. Влияние трудов И. Ньютона и Г. Лейбница на ускорение вычисления приближенных значений Пи. Анализ формул древних ученных.
курсовая работа [1,8 M], добавлен 26.09.2012Характеристика открытой сети массового обслуживания с многорежимными стратегиями обслуживания, в которую поступают обычные положительные заявки и пуассоновские потоки информационных сигналов, оказывающие разовое воздействие на соответствующий узел сети.
курсовая работа [221,8 K], добавлен 02.03.2010Сущность и методологические проблемы математической физики. Особенности математического моделирования жёсткости прокатного калиброванного валка. Основные положения и свойства идеальной математики. Порядок устройства и структурные элементы идеальных чисел.
доклад [350,5 K], добавлен 10.10.2010Число "пи" как математическая константа, выражающая отношение длины окружности к длине ее диаметра, его обозначение и история исследований. Основные свойства данного значения, формулы его нахождения, геометрический период. 14 марта как День числа "пи".
презентация [300,2 K], добавлен 24.01.2012Ознакомление с процедурой ранжирования с (различными и совпавшими рангами) и свойствами коэффициента конкордации (степень согласованности) на примере практической реализации метода экспертных оценок в анализе качества обучающего процесса в ИП "Стратегия".
курсовая работа [50,6 K], добавлен 29.04.2010Функция одной независимой переменной. Основные определения и понятия: число (рациональное, иррациональное), числовая ось, абсолютная величина, функция (основные ее элементы). Графики функций. Пределы, натуральный логарифм. Непрерывность функции.
учебное пособие [1,0 M], добавлен 05.04.2009Первое доказательство существования иррациональных чисел. Развитие теории пропорций Евдоксом Книдским. Теоремы, корень из 2 - иррациональное число. Трансцендентное число: сущность понятия, свойства, примеры, история. История уточнения числа пи.
контрольная работа [53,9 K], добавлен 27.11.2011Теория случайных графов, модели сетей (графы Барабаши-Альберт, Эрдеша-Реньи, Уотса-Строгатса и др.) Разработка ускоренного алгоритма калибровки больших сетей по коэффициенту кластеризации на языке Java в среде Eclipse. Анализ экспериментальных данных.
дипломная работа [2,0 M], добавлен 19.11.2013