Диссертация (1136614), страница 3
Текст из файла (страница 3)
Вовсех случаях полученные значения модулярности Q статистически значимы, p < 10-4 (тестперестановок).Рисунок 1. Структура социальных связей школы. Узлы сети соответствуют учащимсяшколы, а связи между ними — дружбе на ВКонтакте. Разные цвета соответствуют параллелям спятого по одиннадцатый класс (а) и корпусам школы (б).14Рисунок 2. Структура социальных связей студентов университетов. Разные цветасоответствуют разным курсам, видимые кластеры внутри каждого курса соответствуютотдельным образовательным программам.Нами была также изучена структура дружеских связей в масштабах города (Рисунок 3) ибыло показано, что вероятность наличия дружеской связи между школами убывает с ростомгеографического расстояния между ними согласно степенному закону (Рисунок 4).15Рисунок3.Структурасоциальныхсвязеймежду школамиСанкт-Петербурга.Разные цвета соответствуют разным административным районам.Рисунок 4.
Зависимость вероятности дружбы на ВКонтакте между учащимися отгеографического расстояния между их школами.16Дифференциация социальных связей в цифровом пространствеНами было показано, что социальные связи учащихся одного образовательногоучреждения дифференцированы по академической успеваемости, а именно, что учащиеся сосхожей успеваемостью чаще взаимодействуют онлайн. При этом мы обнаружили, что степеньэтой дифференциации возрастает с течением времени (Рисунок 5). Мы также показали, что ростдифференциации связан не с изменением оценок учащихся, а с перераспределением связей:наименее похожие учащиеся разрывают связи с большей вероятностью, а наиболее похожие —чаще устанавливают новые связи между собой.
Результаты этого исследования былипредставлены в [44].Рисунок 5. Рост корреляции (Homophily Index) между средним баллом учащихся исредним баллом их друзей для школы (a) и университета (b).Мытакжеизучилисоциальныесвязиучащихсявмасштабегорода.Мыпродемонстрировали, что вероятность дружеской связи на ВКонтакте между учащимися разныхшкол тем выше, чем ближе их школы по академической успеваемости. Причем это наблюдениеостается верным независимо от географического расстояния между школами (Рисунок 6).Таким образом, школы оказываются сегрегированы в цифровом пространстве, несмотря наотсутствие географической сегрегации.17Рисунок 6. Корреляция между средним баллом ЕГЭ выпускников школы и среднимбаллом ЕГЭ соседних с ней школ в цифровом (a) и физическом (b) пространстве.Дифференциация интересов в цифровом пространствеМы обнаружили, что интересы учащихся в социальной сети связаны с их полом(например, мальчики отдают предпочтение группам, связанным с футболом и компьютернымииграми), возрастом (например, старшеклассники чаще интересуются выпускными экзаменами),а также с успеваемостью [45].
Наименее успевающие учащиеся состоят в таких сообществах,как «Любовный гороскоп» и «Необычный гороскоп», а наиболее успевающие в сообществах«Интересные факты» и «Лучшие стихи великих поэтов» (Рисунок 7).При этом мы показали, что интересы в социальной сети могут объяснять до 25%вариации в образовательных достижениях учащихся (Рисунок 8). Эта величина сопоставима совкладом социально-экономического статуса, измеренного традиционными методами.
Разрыв вобразовательных результатах между подписчиками разных групп (например, «МХК» и«Любовный гороскоп») может достигать величины эквивалентной двум годам формальногообучения (Таблица 5).18Рисунок 7. Карта интересов учащихся.Рисунок 8. Коэффициент корреляции Пирсона между предсказанными по интересам иреальными баллами PISA в зависимости от количества компонент, используемых врегрессионной модели.19Таблица 5. Названия публичных страниц, вносящих наибольший вклад в академическийкомпонент интересов пользователей.
Средние значения баллов PISA и стандартные ошибки (вскобках) приведены для каждого из трех предметов PISA.МатематикаЧтениеЕстествознаниеПоложительный вкладМХК538 (4.6)530 (4.5)532 (4.3)Science|Наука521 (4.2)502 (4.1)516 (3.8)Лучшие стихи509 (4.0)507 (4.0)508 (3.9)Наука и техника507 (4.1)479 (4.3)504 (4.0)5 лучших фильмов505 (3.9)492 (3.9)503 (3.7)великих поэтовОтрицательный вкладПЗДЦ473 (3.3)449 (3.4)472 (3.2)Убойный юмор471 (5.1)447 (5.1)471 (4.7)Четкие приколы467 (4.9)444 (5.1)465 (4.9)Необычный462 (5.1)450 (5.3)460 (5.0)450 (5.3)442 (5.8)453 (5.2)гороскопЛюбовныйгороскопПоложения, выносимые на защитуПолученные результаты могут быть резюмированы в виде следующих положений,выносимых на защиту:— предложенный нами метод позволяет извлекать из ВКонтакте информацию,обладающую высокой степенью достоверности, и объединять ее с образовательными данными;20полученные данные могут быть использованы для изучения социальных связей учащихся и ихинтересов;— связи в социальной сети воспроизводят реальную структуру образовательныхорганизаций, а социальная близость в сети тесно связана с географической близостью;вероятность дружбы между учащимися из разных школ убывает с ростом географическогорасстояния между этими школами по степенному закону;— социальные связи учащихся в цифровом пространстве дифференцированы поакадемической успеваемости; внутри образовательной организации учащиеся со схожейуспеваемостью чаще образуют связи между собой, а с несхожей — чаще разрывают; учащиесяшкол со схожими образовательными достижениями выпускников чаще образуют связи междусобой независимо от географического расстояния между их школами;— интересы учащихся в цифровом пространстве дифференцированы по академическойуспеваемости; разрыв в образовательных достижениях подписчиков разных групп можетдостигать эквивалента двух лет формального обучения.21ЗАКЛЮЧЕНИЕЭтические соображенияДля целей исследования использовалась публично доступная информация из социальнойсети.
Команда ВКонтакте подтвердила, что собранные нами данные могут быть использованы висследовательских целях. Процедура сопоставления профилей ВКонтакте и учащихсяпроводилась автоматически, после завершения процедуры данные анонимизировались и тольков таком виде использовались для анализа. Процедура сопоставления и анонимизации данныхбыла одобрена этической комиссией НИУ ВШЭ.При этом важно отметить, что новые источники данных открывают не только большиевозможности перед исследователями, но и ставят перед ними новые этические вопросы. Так,например, особого внимания требует представление об информированном согласии.
Принимаяпользовательское соглашение, пользователи социальной сети формально дают согласие на то,что информация о них может быть доступна третьим лицам и использоваться для самых разныхцелей. Однако возникает вопрос, действительно ли такое согласие можно считатьинформированным. Особенно с учетом того, что пользовательские соглашения редко читаются,а если читаются, то пользователи все равно могут не до конца осознавать последствия своегосогласия. Например, многочисленные исследования показывают, что по цифровым следамможет быть эффективно восстановлена информация, которую пользователи не указывали и,возможно, предпочли бы скрыть.
Несмотря на появление первых рекомендаций, многиеэтические вопросы, связанные с использованием цифровых следов в исследованиях, до сих поростаются недостаточно проясненными и требуют повышенного внимания со стороны научногосообщества.Научная новизна и значимость полученных результатовНами впервые было проведено масштабное исследование, объединяющее детальнуюинформацию о поведении учащихся в социальной сети ВКонтакте с образовательнымиданными, предложены методы повышения качества полученных данных и даны оценкисмещения выборки. Был предложен новый подход к изучению эволюции социальных связейучащихся, не требующий проведения затратных по времени лонгитюдных исследований.
Былопоказано, как из публично доступной информации в социальной сети может извлекатьсяинформация об интересах учащихся, обладающая высокой предсказательной силой поотношению к различным характеристикам, включая возраст, пол и академическую22успеваемость. Полученные результаты имеют большое значение для развития методологииисследований образования, так как предложенные нами методы сбора и анализа данных могутбыть заимствованы другими исследователями и уже были использованы в ряде работ [46–48].Нами впервые была изучена структура дружеских связей учащихся в масштабе города ивыявлена зависимость вероятности дружбы между учащимися двух школ от географическогорасстояния между ними. Нами также была изучена эволюция социальных связей учащихсяобразовательной организации, показано, что уровень дифференциации этих связей поакадемической успеваемости возрастает с течением времени, объяснены механизмы этогоявления.