Диссертация (1148128), страница 35
Текст из файла (страница 35)
J. Assortative mixing in networks // Physical review letters. 2002. Vol. 89. № 20. P. 208701162На рисунке 14 можно увидеть, как последовательно с шагом 5 удалялись всезначения веса ребер графа от 0 до 100, а одновременно с этим проводилсяпостоянный замер модулярности и количества сообществ, на которые распадаетсяграф. Таким образом, был создан график зависимости операций.Рисунок 14 – График зависимости модулярности и количества сообществ от весаребер, подвергнутых удалению из графа. Синий график – модулярность,оранжевый – количество сообществ.
Размер – величина переменных на шаг длямодулярности, дельта для количества сообществ.Там же заметно, что график количества сообществ увеличиваетсяпрактически постоянно, за исключением первых шагов. Кроме того, дельтаминимальна. График модулярности также не уменьшается, но отличительнымявляется то, что на первых шагах модулярность растет стремительно. Такимобразом,идеальнымявляетсяпорог20междумедианойисреднимарифметическим. После удаления слабых связей в модели осталось 428сообществ.163Применив кластеризацию методом глухого телефона с настройкой«Вершина», мы получили классификацию узлов на два крупных кластера (См.Приложение П). Один кластер объединяет в себе общественные, либеральные,социалистические и ЛГБТ-сообщества.
Назовем его условно общественнополитический. Другой кластер содержит националистические и спортивныесообщества. Его будем именовать условно националистическим. Сравнениекластеров представлено в Таблице 7.Вобщественно-политическийЧисленностьнеуникальнойнационалистическийкластераудиториикластервходитвходитсоставляет36,92 %63,08 %1 141 801сообществ,сообществ.профиль.Вчисленностьюнеуникальной аудитории — 1 167 629 профилей. Большинство ребер графасодержатсявобщественно-политическомкластере—а53,01 %,внационалистическом — 24,48 %.Таблица 7 – Метрики кластеризации «Вершина»Кластер:№1№2% узлов63,0836,92% ребер53,0124,48Средняя степень71,0656,076692,519415,7244Средняя длина пути1,811,69Плотность0,360,35Модулярность0,240,2553Средний коэффициент кластеризации0,810,82Средний взвешенный коэффициент кластеризации0,850,88Средняя взвешенная степеньДиаметрКоличеств сообществХоть средняя степень узла у общественно-политического кластера выше,чем у националистического, тем не менее, по средней взвешенной степени онуступает националистическому.
Кроме того, 22,52 % реберсосреднейвзвешенной степенью 1302,27 связывают кластеры. Эти степени говорят нам о164том, что участники националистических сообществ подписаны на большееколичество пабликов в своем кластере по сравнению с участниками другогокластера.
Другими словами — степень вовлеченности намного выше. Поостальным метрикам кластеры практически не отличаются.Получившиеся кластеры по метрикам центральности во многом схожи, ноимеютиотличия.Пометрикевзвешеннойстепениузлакластернационалистических сообществ имеет медиану выше, чем кластер общественнополитических: 5060 против 3759, первый и третий квантиль также выше унационалистического. Первый квантиль у общественного-либерального – 1145, унационалистического –1885.Отличиенатретьемквантилебольше:унационалистов – 14243, а у общественно общественно-политического – 9673. Также отличаются кластеры межквантильным размахом в 1,44 раза.
У кластеранационалистических сообществ он составляет 12358, когда у противоположного –8527. Распределение наблюдений схоже: ассиметрично влево. Кластеры имеютвысокие показатели среднего коэффициента кластеризации: у общественнополитического – 0,818, у националистического – 0,826, а также среднеговзвешенного коэффициента кластеризации: у первого – 0,855, у второго – 0,876.Самый многочисленным выступает кластер националистических сообществ.В нем в среднем на одно сообщество приходится 7390,06 участника. Вобщественно-политическом кластере в среднем на одно сообщество приходится4228,89 участника.
В публикационной активности мы наблюдаем схожуюкартину: в среднем в кластере националистических сообществ на односообщество приходится 4506,95 публикаций, когда в кластере общественнополитических сообществ на одно сообщество приходится 1858 публикаций. Вкластереобщественно-политическихсообществмеждупубликационнойактивностью и количеством участников был обнаружен средний коэффициенткорреляции Пирсона — 0,45 при p-уровне значимости менее 2,817*10-15, чтоделает её значимой. Во кластере националистических сообществ — 0,5 при pуровне значимости меньше 1,488*10-11. Отсюда следует, что сообществанационалистов многочисленнее и проявляют большую медиа-активность.165С целью выявления связи между публикационной активностью иколичеством участников в сообществах, мы провели корреляционной анализ –посчитали коэффициент корреляция Пирсона.
В общественно-либеральномкластере была обнаружена средняя корреляция 0,45 при p-уровне значимостименьше 2,817*10-15, что делает её значимой. Во националистическом кластере мытакже обнаружили умеренную корреляцию 0,5 при p-уровне значимости меньше1,488*10-11, что делает её значимой.Получившиеся кластеры имеют разные характеристики мер центральности(см. Приложение Р).
По метрике взвешенной степени узла националистыобладают более плотной топологией сети. Первый квантиль у кластераобщественно-либеральных сообществ – 1145, у второго – 1885. Медианынаблюдений значительно различаются. У националистов – 5060, у общественнополитического кластера – 3759. Также отличаются третий квантиль: у кластераобщественно-либеральных сообществ – 9673,5, у противоположного – 14243,25.Верхнийуснационалистическогокластератакжепревосходитпервый.Интересным представляется асимметрия. Наблюдения кластера общественнолиберальных сообществ в большей степени смещены влево – 2,94, когда упротивоположного асимметрия составляет – 2,02.Метрикадемонстрируетпромежуточнойидентичностьцентральностикластеров.поПервыйнашимквантильнаблюдениямукластеранационалистических сообществ выше – 0,63, у противоположного – 0,15.Медиана располагается практически на одном уровне: у кластера общественнолиберальных сообществ – 21,08, у противоположного – 17,41.
Практическиидентичные значения присутствуют в третьем квантиле: у кластера общественнолиберальных сообществ – 129,84, у противоположного – 153,23, а также и вверхнем усе диаграммы размаха: соответственно 324,38 и 382,13. Данныекластеры отличаются неравномерным распределением. У кластера общественнолиберальных сообществ стандартное отклонение выше – 575,08, у кластеранационалистических сообществ – 362,53. Асимметрия у кластера общественнолиберальных сообществ высока – 4,97, у противоположного чуть меньше – 3,43.166Центральность по близости показывает, что кластеры абсолютно идентичныпо распределению. Центральность по престижу не вносит много ясности враспределения наблюдений: медианы практически идентичны, а квантилисовпадают кроме третьего.
Медиана у националистов – 0,27, а у общественнополитического кластера – 0,29. Третий квантиль у кластера общественнолиберальных сообществ выше – 0,55, а у противоположного ниже – 0,47.Резюмируя все вышесказанное, можно отметить, что кластеризацияметодом «глухого телефона» с настройкой «Вершина» с 10 итерациями намодернизированноймоделисусечениемслабыхсвязей,которуюмыиспользовали ранее для симуляции эхо-камер, дала интересный результат.
Вграфах с множеством ребер с критерием разделения на кластеры выступаеттопология сети, которую мы можем увидеть лишь в распределениях метрикцентральности. В нашей модели разделение на кластеры может показатьсянеравномерным. В общественно-политическом кластере узлов и ребер ивнутренних ребер больше. В националистическом кластере больше аудитории ивыше публикационная активность. Метрики центральности демонстрируют, чтокластерывцеломявляютсяидентичнымизаисключениемнекоторыхтопологических особенностей. Промежуточная центральность, центральность поблизости и центральность по престижу дают в целом идентичное распределениеза исключением смещения наблюдений. Асимметрия в большей степенихарактера для общественно-политического кластера, но она не влияет наэксцентриситет. Главные отличия между кластерами в интенсивности связеймежду узлами.
Так, средняя взвешенная степень националистов выше, как исредний взвешенный коэффициент кластеризации при одинаковой плотностикластеров. Вес наблюдений у данного кластера выше медианы заметно больше.Это мы видим по высокому стандартизованному отклонению и меньшейасимметричности. Таким образом, мы подтверждаем тезис о том, что вкомплексных сетях топология сети является критерием для разделения наподгруппы графа.167Кластеризация графа алгоритмом глухого телефона с 10 итерациями, сиспользованием распространения связей «Логарифм дистанции» дала результат ввиде разбивки на три кластера (см. Приложение С). Из общественнополитического кластера выделился отдельный кластер ЛГБТ-сообществ.