Диссертация (1145099), страница 67
Текст из файла (страница 67)
Например, данные обсуждения отдельно взятой темы в Twitter, которыеформально попадают под категорию больших данных, существенно меньше количественно,чем, например, данные переписи населения (boyd, Crawford 2012: 663). В данной работе мыпредпочитаем использовать термин «цифровые данные», поскольку «большие данные»представляют собой лишь частный случай цифровых данных, разделяющий с ними такие250характеристики, как высокая скорость изменений, неструктурированность, гибкость имасштабируемость.Цифровые данные многообразны – от транзакционных данных и информации в «журналахсобытий» (event log), регистрирующих простейшие факты поведения, до привычныхсоциологам-качественникам описаний личного опыта, визуальных образов, развернутыхнарративов и детальных комментариев по определенным темам, которые содержатся всоциальных медиа в сети Интернет.
Развитие технологий Web 2.0 привело к тому, чтопрактически любой аспект повседневной жизни находит свое цифровое отражение. Внастоящее время в сети Интернет можно найти значительные объемы данных для изученияпрактически любого аспекта человеческого поведения. К этому добавляется то преимущество,что подобные данные уже «транскрибированы», представлены в виде записей. В настоящеевремя люди оставляют множество «цифровых следов», что предоставляет новые возможностидля социологических исследований.
Трактовка сети Интернет, как пространства цифровыхследов, которые могут быть расшифрованы с помощью специальных методов, предполагает,что цифровые данные могут рассказать не только о самом Интернете и его особыхсубкультурах, но и о социальной реальности, частью которой они являются. «Основной вопросбольше не в том, сколько общества и культуры находится в сети Интернет, а в том, как,используя Интернет, можно изучать культурные изменения и социальные условия. Отправнойточкой является признание Интернета не только объектом изучения, но и источником данных»(Rogers 2009а: 8).При использовании цифровых данных сокращается полевой этап работы – задачапроизводства записей под конкретную исследовательскую задачу заменяется поиском следов,уже произведенных пользователями, тем самым оставляя больше времени на аналитическуюработу с данными. Фигура интервьюера становится излишней, «респонденты» самирассуждают на интересующие их темы и записывают свои «ответы», то есть производятготовые «транскрипты», например, в виде записей в блогах и социальных сетях.
Получениецифровых данных является менее затратным не только для исследователей, но и дляисследуемых, которым нет необходимости проходить процедуру опроса.Итак, особенностью цифровых данных является их естественность и спонтанность,отсутствие искусственной ситуации опроса, устранение влияния интервьюера и его возможныхошибок.
В то же время, цифровые данные имеют ряд характеристик, которые отличают их оттрадиционных данных, с которыми долгое время работали социологи, что порождаетмножество сомнений относительно возможностей их полноценного использования всоциологическихисследованиях:сомнениеврепрезентативностицифровыхданных,251непонимание того, в какой мере они могут представлять реальные социальные группы;отсутствие стандартизации, которая в большей или меньшей степени всегда сопровождает сборсоциологическихданныхтрадиционнымиметодами;отсутствиегарантииполученияинформации по конкретным аспектам, интересующим социолога.
К. Льюис выделяет 3 ошибки(fallacy) цифровых данных: ошибка репрезентативности, ошибка медиации и ошибка контекста(Lewis 2015). Цифровые данные не репрезентативны, поскольку их оставляют только те, ктоесть на соответствующем ресурсе, кроме того эти данные представляют события, а неотдельных индивидов. Цифровые данные зависят от особенностей того ресурса, на котором онибылипроизведены.Цифровыеданные,спонтаннопроизведенныепользователямиопределенного ресурса, непрозрачны по сравнению с данными, собранными традиционнымисоциологическими методами под четкую исследовательскую задачу. Сама цифровая средаспецифическим образом конструирует данные, соответственно эти данные отражают свойствацифрового посредника, а не реального мира, а цифровой контекст, как и любой социальныйконтекст, диктует свои специфические нормы и правила.
Можно выделить ряд противоречий,характеризующих цифровые данные, которые необходимо учитывать при работе с ними.Нереактивность vs социотехническое конструирование. Нереактивность является,пожалуй, самым заманчивым для социологов свойством цифровых данных, создающимиллюзиюихестественногохарактера,когдаотсутствуетнеобходимостьсоздаватьэкспериментальные условия (например, ситуацию опроса), чтобы произвести «цифровой след».Но с дургой стороны, на место опросного конструирования приходит социотехническоеконструирование.
Не только производство цифровых данных обусловлено практиками созданияразнообразных программных продуктов, но и использование этих данных также, как правило,невозможно без применения специальных программных средств. Хотя цифровые данные и непроизводятся в специально созданных экспериментальных ситуациях, но формат отдельногоцифрового носителя или цифровой среды задает специфические рамки и ограничения.Доступность vs избирательность.
Цифровые следы дают возможность получатьинформацию о труднодоступных группах, скрытых аспектах социальной жизни, сензитивныхтемах. В то же время, информация, представленная, например, в социальных сетях имеетсущественные ограничения репрезентативности, обусловленное неравным доступом к сети,разнообразными смещениям репрезентативности на разных интернет-ресурсах.
Доступностьинформации для исследователей также имеет ограничения – только определенные IT-компанииимеют доступ ко всему объему цифровых данных.Таким образом, в преимущественномположении оказываются социологи, работающие в подобных кампаниях.252Естественное поведение vs цифровая самопрезентация. Любое общение содержитизвестнуюдолюсамопрезентации,влюбомобщениилюдистремятсяуправлятьпроизводимыми впечатлениями. В опросных методах стремление респондента произвестиблагоприятное впечатление на интервьюера рассматривается в качестве потенциальносмещающего фактора. В цифровом пространстве пользователи стремятся производитьвпечатление друг на друга, и здесь во внимание надо принимать то, как люди презентуют себя иуправляют впечатлениями в цифровой среде.Цифровое тело vs биологическое тело. При работе с цифровыми данными уисследователей, как правило, отсутствует достаточно надежная демографическая информация опользователях.Крометого,благодарярасширениюполитикизащитыперсональнойинформации и шифрованию данных, возможность увязывать цифровые следы с личностнымихарактеристиками мождет исчезнуть совсем.
Цифровое тело – это все траектории, которыеостаются, как следы активности в социальных сетях, переговоров по мобильным телефонам,пользования GPS-навигаторами и т.п. Например, посты, «лайки» и комментарии в сетиИнтернет не всегда индивидуальны, один человек может выступать под несколькимиаккаунтами. Кроме того, цифровые следы оставляют не только люди, определенная частьконтента социальных медиа, в частности, на политически или коммерчески значимые темы,производится автоматически, посредством компьютерных программ, известных как «боты».Другую проблему представляют так называемые «фейковые аккаунты» – страницы всоциальных сетях, которые созданы под определенную задачу и не соответствуют реальнымлюдям.
Эти особенности ставят под вопрос возможность и необходимость соотнесения данныхс отдельными индивидами и необходимость пересмотра модели социального актора.Можно констатировать, что цифровые данные социо-технически сконструированы,неструктурированны, часто недоступны без специальных прав доступа или программныхпродуктов, подвержены разного рода смещениям.
С другой стороны, эти данные производятсябез вмешательства социолога, динамичны, многочисленны, масштабируемы, отражают самидействия, а не описания деятельности. Цифровые данные отличны от тех данных, с которымитрадиционно работали социологи, и чтобы получить значимые результаты при работе с ними,нужны не только новые методы, требуется «фундаментальное переопределение того, чтоименно должно объясняться и пониматься социальными науками» (Burrows, Savage, 2014: 3). Снашей точки зрения, подобное «переопределение» должно начинаться с концептуализацииисследовательской перспективы, моделей социальной реальности и социального актора,которые лежат в основе социологического теоретизирования и особенностей самих методов253сбора и анализа данных. Но в первую очередь, необходимо понять, как цифровые данныетрансформируют модель социологического наблюдения и исследовательскую перспективу.§.6.2.