Диссертация (1137013), страница 23
Текст из файла (страница 23)
ситуации, когда все соседние вершины связаны друг сдругом.Средний коэффициент кластеризации показываетнасколько узлы сети склонны группироваться вместе инасколько структура сети соответствует модели «тесногомира» (small-world network, Watts, Strogatz 1998; Latapy2008).Gini DegreeИндекс Джини для распределения степенейцентральности в сети «дружбы» без изолятов (т.е. длясвязанных пользователей).Индекс Джини показывает, насколько фактическоераспределение отклоняется от абсолютно равномерногораспределения, в котором значение признака всехнаблюдений равно среднему по выборке.
В данномслучае, индекс Джини используется как мера для оценкинеравномерности распределения центральности в графе., где G коэффициент Джини, Xk - кумулятивная долянаблюдений, Yk - кумулятивная доля значения (в данномслучае степени центральности), которой в совокупностиобладает Xk.
Изменяется от 0 до 1, где 0 соответствуетабсолютно равномерному распределению (все значенияравны среднему).Индекс Джини может быть использован для измерения иоценки уровня неравенства на сетевых данных (см., напр.Gonzalez-Bailon, 2009).Gini BetweennessИндекс Джини для распределения центральностипосредничества в сети «дружбы» без изолятов (т.е. длясвязанных пользователей).Центральность посредничества (betweenness centrality),CB(k) - характеристика вершины, оценивающаяколичество кратчайших путей (геодезических дистанций)графа, которые проходят через данную вершину (Freeman1978: 222 - 224).124Centralization DegreeЦентрализация графа по степени центральности безизолятов (т.е. для связанных пользователей).Централизация графа (общее определение) - этоотношение фактической суммы абсолютных отклоненийзначений центральности вершин от максимальнойцентральности в графе к максимально возможной суммеабсолютных отклонений для графа с таким же числомвершин; т.е.
это мера неравномерности распределенияцентральности в графе, показывающая в какой степенисеть выстраивается вокруг одной или нескольких вершин.Другими словами, это одна из мер сетевого неравенства иконцентрации связей.nCx (Cx( p*) Cx( p ))ii 1nmax (Cx( p*) Cx( pi )), где Cx(pi) - центральностьi 1вершины, Cx(p*) - максимальная центральность вершиныграфа. Изменяется от 0 до 1, где 0 соответствует полномуотсутствию централизации, а 1 - абсолютнойцентрализации графа. (Freeman 1978: 228 - 230).Максимальная централизация соответствуетзвездообразной сети, где есть одна вершина, соединеннаясо всеми другими, а другие соединены только сцентральной вершиной и не соединены между собой.Круговая сеть, напротив, имеет минимальнуюцентрализацию, т.к.
все узлы имеют одинаковуюцентральность.Centralization BetweennessЦентрализация посредничества без изолятов (т.е. длясвязанных пользователей) (Freeman 1978: 230). Даннаяразновидность централизации графа основана нацентральности посредничества и показывает, в какоймере все кратчайшие пути проходят через самуюцентральную вершину.Alpha (Power Law Fitdegree)Значение показателя степени аппроксимированнойфункции степенного распределения (Power Law) кфактическому распределению степеней в сети «дружбы».p(x) = Pr(X = x) = C x-alphaгде alpha - показатель степени (Clauset и др.2009).Female ShareДоля пользователей женского пола среди чистой полнойчисленности группы.Male-Female Edges ShareДоля ребер между разнополыми пользователями (т.е. долясвязей «дружбы» типа «мужчина – женщина»).InCity EdgesДоля ребер между пользователями, принадлежащими кодинаковым населенным пунктам (доля ребер «внутри»населенных пунктов), ко всем ребрам графа.125InterCity EdgesДоля ребер между пользователями, принадлежащими кразным населенным пунктам (доля ребер «между»населенными пунктами), ко всем ребрам графа.Writer ShareДоля участников, создающих контент в группе в видепостов, комментариев или сообщений в обсуждениях.Liker ShareДоля участников, не создающих контент в группе, ноставящих «лайки» к контенту группы.Passive ShareДоля пассивных участников, не «лайкающих» и несоздающих контент.
Являются подмножествомформальных членов группы.Gini Total MessagesИндекс Джини для распределения вкладов в созданиеконтента группы, исходящей коммуникации (сумманаписанных участником постов, комментариев исообщений в обсуждениях), среди всех «активных»пользователей.Индекс Джини может быть использован при изученииИнтернета и социальных медиа (см., напр., Indaco,Manovich 2016).Gini LikesИндекс Джини для распределения оставляемыхучастниками «лайков» к материалам группы среди всех«активных» пользователей.Gini Received LikesИндекс Джини для распределения полученныхучастниками «лайков» в ответ к своимпостам/комментариям/сообщениям среди всех«активных» пользователей.Таблица 3.1.4Описательные статистики групповых переменныхПеременнаяMinMaxСреднееСтанд.отклон.Среднее/Станд.отклон.Population472234024 15038,05455 8048,5112851,868Clear population38773306313211,4 7356,5262051,796Members302020265 8858,145455 4641,2618991,909Active Users103622995 7186,472727 5779,0030691,2440,04220,352 0,197649091 0,0692152442,856296275872,5281,3400,9513 0,574121818 0,2123132662,70418529 5343,9272733856,863661,3860,8307 0,426027273 0,2121880182,008Share Active MembersConnected UsersConnected Users ShareIsolatesIsolates Share6940,16935300,04787867,473126EdgesConnected Components835344143 38023,05455 66008,730260,57692522 433,3818182 474,30731130,914Vertex Giant Component0,03380,94920,49374 0,2543500741,941Edge Giant Component0,25140,99980,90304 0,1494091946,044DensityDensity without isolatesModularityClustersInCluster EdgesDiameterMean GeodesicsMean Degree0,000018650,00065410,7770,00018210,00453948 0,001293816 0,0010102631,2810,3440,988 0,664745455 0,1782953463,728192538 471,2181818 482,87049450,9760,36220,9938 0,769652727 0,1418613765,425933 17,10909091 5,1663896963,3122,96211,288 5,305327273 1,5661053143,38851,1857,805556420,6930,40,00380672 0,0005085295,4054Mean degree withoutisolates1,58855,895 7,638254545 8,2576658330,925Clustering Coefficient0,1560,422 0,258236364 0,0713727733,618Gini Degree0,290787621 0,745816096 0,562415374 0,1006552865,588Gini Betweenness0,761795377 0,974304104 0,867770726 0,04221355320,557Centralization Degree0,004176660,15783489 0,054909268 0,0367432821,494CentralizationBetweenness0,009548340,57654792 0,105279219 0,0852438271,2351,3844232,45305 1,940881764 0,18920875410,258Alpha (Power Law Fitdegree)Female Share0,04770,8819 0,4884127270,215339642,268Male-Female EdgesShare0,02020,4882 0,3466490910,094643883,663InCity Edges0,05560,7338 0,360818182 0,1716928852,102InterCity Edges0,09470,7254 0,3776781820,130250662,900Writer Share0,03620,4039 0,179027273 0,0817713532,189Liker Share0,00730,7696 0,3201709090,215232011,488Passive Share0,10940,8552 0,502287273 0,1845243972,722Gini Total Messsages0,443331603 0,981460920 0,855521057 0,1326064186,452Gini Likes0,450335524 0,940278070 0,743272952 0,1167970106,364Gini Received Likes0,891338144 0,993595303 0,967246751 0,02391146340,451T-test является разведочным статистическим методом и применялсядля предварительного выявления переменных, значения которых могут127значимо варьироваться в зависимости от типа группы.
T-test позволяетсравнивать только две подвыборки наблюдений между собой, поэтомупроводилось не попарное сравнение онлайн-групп между собой, сравнениехарактеристик каждого конкретного типа онлайн-групп с подмножествомостальных (см. Таблица 3.1.5).Таблица 3.1.5Результаты t-testЗначимость (2-сторонняя)ФанатскиесообществаПрофессиональныесообществаPopulation0,1640,229Группыобщественныхдвижений0,847Clear population0,1640,1960,922Members0,0830,470,397Active Users0,3470,830,427Share Active Members0,060,004*0,33Connected Users0,7890,1850,185Conected Users Share0,0220,5380,002Isolates0,0010,6560,001IsolatesShare0,0220,5320,002Edges0,0210,0320,019ConnectedComponents0,0050,2040,001VertexGiantComp0,0050,7250,001EdgeGiantComp0,0130,1290,009Density0,0010,1780,008Density without isolates0,0210,9150,013Modularity0,0530,0620,00003*Clusters0,0050,2430,001InCluster Edges0,5240,0060,001Diameter0,0310,5910,005MeanGeodesics0,0320,2340,0003MeanDegree0,0050,0640,011Mean degree without isolates0,0030,0990,010Clustering Coefficient0,4610,035*0,085Gini Degree0,0300,7930,011Gini Betweenness0,006*0,2510,116Centralization Degree0,0400,9330,027Centralization Betweenness0,1190,032*0,218Переменная128Alpha (Power Law Fitdegree)0,0680,9170,078Female Share0,0720,0630,0002*Male-Female Edges Share0,1820,004*0,135InCity Edges0,0280,1830,012InterCity Edges0,6350,0010,007Writer Share0,00040,00006*0,602Liker Share0,1470,0002*0,034Passive ShareGini Total Messages0,8130,0130,0110,000080,0190,00004Gini Likes0,0080,0070,969Gini Received Likes0,00030,00030,03Полужирным - значимые различия (p < 0,05).* - различия значимы только для соответствующего типа групп.Применение t-test выявило несколько переменных, по которымнаблюдаемые различия незначимы для всех типов групп: Population, Clearpopulation, Members, Connected Users, Alpha (Power Law Fit degree), ActiveUsers.
Результат дополнительного теста дисперсионного анализа непоказал значимых различий и позволил нам убедиться, что распределениегрупп по размерам действительно не связано с их типами (см. таблица3.1.6; p-value = 0,307 > 0,05). Поэтому переменные, характеризующиечисленность групп, могут быть исключены из дальнейшего анализа. Такжемы исключили переменную показателя степени аппроксимированнойфункции степенного распределения, т.к. тесты Колмогорова-Смирновапоказали, что распределения в целом плохо аппроксимируются к даннойфункции. Результаты t-test также показывают, что для каждого типа группесть несколько уникальных переменных, различия по которым значимыдля выделения только данного типа группы и не значимы для другихтипов. На эти переменные стоит обратить особое внимание.129Таблица 3.1.6Дисперсионный анализ переменной Clear populationСуммаст.св.СреднийквадратовМежду группамиВнутри группЗнч.Fквадрат129539636264769818279285816552537088111,2060,3083.1.3.