Диссертация (1147891), страница 31
Текст из файла (страница 31)
Если это так, можно говорить об ориентации пользователя наопределенные социальные ниши (сферы), существующие в онлайн - пространстве.148Припроведенииобеспечениеанализапостроенияиспользовалосьграфов,программаавторскоеGephi,программноепрограммаPajekистатистический пакет SPSS.Для проведения конент-анализа тематики структурных сообществ былавыбрана индивидуальная онлайн-сеть с числом онлайн-друзей 8354: граф 8354121154 является самым крупным в выборке из 168 индивидуальных онлайн-сетей.Кроме того, коэффициент модулярности 0,411 говорит о том, что граф достаточнокластеризован (Приложение Рисунок 42). При этом пользователь обладаетвысокой степенью публичности («4» по нашей шкале ранжирования).В результате анализа были получены следующие метрики (Рисунок 43,Таблица 27).
Средняя степень графа с учетом Эго-вершины = 29, без учета Эго =28 (макс 699). Средняя степень говорит о вкладе каждой вершины вструктурирование связей: чем она больше, тем больше каждый контактер Эгосвязан с другими контактерами в пределах индивидуальной сети.Среднее число друзей у контактеров Эго составляет 852 человека (макс 9969,медиана 393). Таким образом, подтверждается, что по числу контактеров способорганизации связей основан на принципе гомофилии (связи по сходству), аименно: анкеты с большим числом друзей также ориентированы на связи санкетами с большим числом друзей. Однако анкеты с числом друзей менее 300составляют 38,7% связей, а менее 200 – 23,7% связей.
При этом среднее числодрузей пользователя для каждой индивидуальной сети его контактеров составляет28,9 человек, что сопоставимо со средней степенью данного графа.80,5% сети контактов пользователя составляют женщины, 19,5 – мужчины.По локализации пользователей, 66% связей приходится на Санкт-Петербург, 9% не локализовано, 8,1% приходится на Москву, 2% -Киев, 1,5% - Екатеринбург.Остальные локализации занимают менее 1%. Таким образом прослеживаетсяориентация по территориальным и гендерным характеристикам.ПрограммаGephiопределила7структурныхсообществ,которыераспределились (по убыванию): «0» - 31,6%, «3» - 17,3%, «4» - 17,2%, «1» - 10,4%,«2» - 9,5%, «5» -9%, «6» - 5% (Таблиа 28). Внутри каждого сообщества был149отобранряд анкет для контент-анализа. Выборка анкет по сообществампроводилась с учетом средней степени (от максимальной к минимальной).Поскольку средняя степень является показателем вклада вершины в структуруграфа, предпочтение отдавалось анкетам с высокой средней степенью.
Такимобразом, если структура кластеров достаточно плотная, 10-15 анкет былодостаточно, чтобы говорить о тематической направленности пользователей изданного кластера связей. Для ясных случаев мы ограничивались 15 анкетами, дляболее детального анализа выбиралось 20 анкет.Следующим шагом анализировался контент каждой анкеты пользователей,вошедших в выборку. А именно, сопоставлялись: фото-материал, тематическиезаписи, идентифицирующие признаки каждой анкеты.
Каждой анкете былприсвоен «лейбл», отражающий тематическую направленность, социокультурныеустановкиилиидентифицирующиепризнаки.Пересекающиесяичастовстречающиеся интересы и составляли «лейблы» сообщества как качественнуюхарактеристику объединяющего его фактора участников. Отметим, что термин"сообщество" в данном случае обозначает лишь структуру, когда количествоперекрестных внутренних связей превышает количество внешних связей.Поскольку в данном случае анализировалась индивидуальная сеть, оказалосьвозможным присваивать каждой анкете по одному лейблу, оценивая, каксоотносятся идентифицирующие признаки анкеты контактера и Эго.В результате (см.
Приложение Таблица 29) сообщество «6» оказалосьтематически связано с музыкой, вокалом и балетом. Анкеты, вошедшие в данныйкластер, имели в среднем по 611,7 человек друзей (от 15 до 9457). Сообщество«5» тематически связано с театральной жизнью и артистами.
При этом почти всеанализируемые нами страницы представляли собой «хабы» по несколько тысячдрузей каждая. Многие страницы трудно назвать «пользовательскими», посколькуони являлись скорее порталами учреждений и коллективов. Среднее число«друзей» для данного кластера – 856,4 (от 0 до 8213, где ноль отражаеттехническую ошибку, когда анкета была удалена). Сообщество «4» связано сфотографией, красотой и внешностью. Данный кластер представляют фотографы,150фотостудии, визажисты и пользователи, связанные с модой. Среднее число друзейдля кластера «4» =1668 (от 0 до 9857).
Сообщество «3» связано с киноискусствоми творческой жизнью. Кластер представлен вестниками кино, литераторами,людьми творческих профессий и координаторами выставок. Среднее значение почислу контактеров немного ниже, чем у предыдущих сообществ: 534,7 (от 0 до8082). Сообщество «2» связано с театром, театральной жизнью и актерами иявляется первым по среднему числу друзей в анкетах - 1930 (от 0 до 9969).Сообщество «1» связано с психологией, психологами и тренерами личностногороста, что отражает профессиональную тематику пользователя.
Среднее числодрузей 580 (от 0 до 9691).Мы также провели расчет уровней плотности ядра (K-core) с помощьюпрограммы Pajek (Рисунок 44): среднее 15,03, макс 64. Сравнение средних дляплотности ядра по сообществам дало следующий результат. Сообщество «2»(театр) дало наибольшую среднюю плотность ядра 31,95.
Это значит, что среднеечисло связей друг с другом каждой из вершин внутри сообщества не менее 31,95.Далее по убыванию плотности: сообщество «5» (театральная жизнь и артисты) –22,66; сообщество «4» (фотография) – 22,05; сообщество «6» - (музыка) - 19,62;сообщество «3» (киноискусство) – 15,05; сообщество «1» (психология) – 14,29. И,наконец, сообщество «0» является наименее плотным, k-core= 3,48.Примечательно, что наибольшая плотность ядра соответствует тем сферам,где социальные связи должны быть теснее (каждый знает каждого). Кроме того,сраницы-хабы, рекламирующие различные события, как правило, подписаны другна друга.Существует значимая корреляция между плотностью ядра и среднейстепенью каждой вершины (Спирман R= 0,852 p=0,000).
График показывает, чтоначиная с k-core>40, средняя степень непропорционально растет для отдельныхпозиций (Рисунок 44). Поскольку плотность ядра говорит о том, что каждаявершина внутри «ядра» имеет как минимум n связей c другими вершинами 382,382Batagelj V., Mrvar A. Pajek: Program for Analysis and Visualization of Large Networks. Ljubljana, September 24, 2011,p.20151тогда непропорционально высокая средняя степень должна означать рост связейза пределами плотного ядра.Сообщество «0» является самым многочисленным и характеризуетсяразбросом в значениях лейблов.
Определить тематическую направленность дляданного кластера оказалось труднее всего. Тем не менее, часть кластера,безусловно, связана с психоанализом и профессиональными психоаналитиками,чтоотражает,опять-таки,профессиональныеинтересыпользователя(психология). Чтобы определить тематическую направленность связей болееточно, мы дополнительно проанализировали структуру связей только данногосообщества посредством нахождения модулярности (Рисунок 45). В результатепрограмма разбила сообщество на слишком большое число кластеров (более 100),из которых самыми крупными оказались: «79» - 55,9%, «67» - 4,2%, «78» - 34%,«12» - 2,3%, «63» - 2,3%.
Не для всех из них удалось определить тематическуюнаправленность. Носообщество«78» однозначносвязанос Украиной,сообщество «67» представляет группу психоаналитиков, а сообщества «12» и 63»связаны с крупным городом внутри РФ (в целях конфиденциальности мы неуточняем локацию).Отметим, что в целом сообщество «0» является самым крупным поодиночным связям (1169 связей, degree =1) – 44,2% внутри сообщества, 7,8% поотношению к целому графу. Тематическую направленность этих связей трудноопределить, однако именно они, вместе с диадами, могут быть представленыклиентами пользователя или случайными онлайн - контактами.Поскольку результаты разбиения на сообщества программами Pajek (LouvainCommunities) и Gephi несколько различались (Pajek обнаружил 9 структурныхсообществ), мы провели дополнительную проверку, сравнивая страницыпользователей и добавляя дополнительные метки сообществ.
Это связано с тем,что используемые алгоритмыотносили каждую вершину только к одномусообществу. Данный метод предпочтителен для упрощения модели и экономиивремени, однако в реальности пользователи могут быть отнесены сразу кнесколькимсоциальнымстратам.Сравнениерезультатовпозволило152минимизировать случайные ошибки. Так, кластер «7»,обнаруженный Pajekоднозначно представлен пользователями, связанными с Израилем, еврейскойобщиной, ивритом или еврейской культурой. Кластер «6» связан с телеканалами иобзорами новостей. Для сообщества «4», которое идентично сообществу «0» поGephi, удалось выявить области пересечений, связанные с танцами: танго, танцы,постановка танцев.Таким образом, сетевой и тематический анализ онлайн-сети с числомконтактов >5000 позволил получить представление о характере формированиясвязей и структуре размерных сетей.