Диссертация (1138927), страница 12
Текст из файла (страница 12)
Инструментыбольших данных могут создавать ситуацию, когда малообеспеченному населениюпредлагаются товары и услуги по большей цене. Так, исследование показало, чтоонлайн компании предоставляют различные цены покупателем на одинаковыеофисные продукты в зависимости от почтового индекса91.Исследования в Соединенных Штатах Америки доказали, что интернет-поискимен, традиционно принадлежащих темнокожим, чаще генерировал информацию,связанную с историей арестов, чем поиск имен, принадлежащих светлокожим. Занесение в такого рода категории также может оказывать более прямое воздействие,например, если решение о кредитоспособности человека основаны на информацииоб их месте проживания, покупательских привычках или социальных контактах.
Этосложная сфера, поскольку дискриминация – это не отнесение человека в определенную социальную группу, а отношение к нему, основанное на общих для представителей этой группы факторах.Аналитика с использованием облачных технологий для обработки большихмассивов данных открывает возможность принятия решений, основанных на классификации пользователей по условным характеристикам. Исследователи отмечают,что некоторыми кредитными организациями были занижены размеры кредитныхлимитов на основании аналитических данных, резюмирующих низкую платежеспособность определенной категории покупателей, исходя из данных других историй 90Calabrese C. The USA Federal Trade Commission.
Transcript of Big Data: A Tool for Inclusion or Exclusion? 2014.//https://www.ftc.gov/ system/files/documents/public_events/313371/bigdata-transcript-9_15_14.pdf P. 228–30, (дата обращения: 20 января 2018 года).91Soltani A. The USA Federal Trade Commission. Transcript of Spring Privacy Series: Alternative Scoring Products. 2014. //https://www.ftc.gov/system/files/documents/public_events/182261/alternative-scoring-products_ final-transcript.pdf. P.
64–67,(дата обращения: 20 января 2018 года); Devries V. Websites Vary Prices, Deals Based on Users’ Information, Wall St. J.2012. // http://www.wsj.com/articles/SB1000142412788732377720457818 9391813881534, (дата обращения: 15 октября2017 года). 53 заказов в магазинах, для покупки товара в котором запрашивается кредит, а не наосновании личной кредитной истории заявителя.
Использование статистическоймодели такого типа может как существенно урезать выгоду при получении кредитаотдельными категориями заявителей, так и напротив, привести к одобрению такогоразмера кредита, который не может быть выплачен конкретным пользователем, попавшим по косвенным характеристикам в «добропорядочную» категорию92.Также возможно раскрытие информации ограниченного доступа косвеннымспособом: к примеру, одно исследование было построено на сборе и сопоставленииданных о «лайках» в сети Facebook в целях совершения прогнозного исследования отом, каков процент среди пользователей, поставивших «лайк» (like, англ. «нравится») мужчин или женщин, христиан или мусульман, демократов или республиканцев, употребляющих алкоголь, сигареты или наркотики.Всякий раз, когда публикуется запись в социальных сетях, осуществляется запрос в поисковой строке, комментируется материал на сайте, оставляются следы.Аккумуляция еле заметных следов в массив данных может подчас объяснить поведение людей (даже в масштабе целых стран), вскрыть новые тенденции, помочьпредугадать реакцию на политическое и общественное событие.
Маркетинговыекомпании и рекламные агентства давно признали власть информации93. Собраннаяистория «лайков» в социальных сетях, покупок и поисковых запросов клиента в интернете может быть использована для предоставления ему таргетированной рекламы, когда он что-то ищет в интернете или просматривает страницы. Данный фактможно рассматривать как преимущество современных информационных технологий, поскольку служит адаптации онлайн информации под интересы человека. Однако это также может означать, что человек «заносится» в определенный список,способствующий дискриминации, например, на основании расовой принадлежно- 92Mierzwinski E, The USA Federal Trade Commission. Transcript of Spring Privacy Series: Alternative Scoring Products.2014.
// https://www.ftc.gov/system/files/documents/public_events/182261/alternative-scoring-products_ final-transcript.pdf.P. 96, (дата обращения: 20 января 2018 года).93Морозов Е. Интернет как иллюзия. Обратная сторона сети. Москва: АСТ : CORPUS, 2014. С. 211. 54 сти. И здесь встает вопрос о том, что по факту в сети Интернета имеет место егоразличные версии, адаптированные для разных пользователей94.Критики современных технологий высказывают опасения, что такая персонификация замкнет каждого пользователя в кругу интересов. Социальные сети снескончаемым потоком новостей и комментариев сделали некоторые из этих опасений весьма обоснованными.
Одна и та же ссылка может приводить людей к разнымтекстам. Ученому с научной степенью, изучающего публикации профессиональныхгазет поисковыми системами будет предложен более глубокий многосторонне информативный материал, чем, например, его соседу, читающему некачественнуюпрессу. Настоящая опасность кроется в нежелании общественности разбираться всоциальных и политических последствиях исчезающего права на анонимное чтение,когда критическое, творческое, неординарное мышлением всё сложнее культивировать и беречь95.Мошенники могут использовать инструменты облачной обработки большихмассивов данных для более упрощенной рассылки адресных незаконных предложений финансового характера заведомо уязвимым группам населения (например,больным болезнью Альцгеймера).
Действительно, никогда прежде условия для интернет-мошенничества не были настолько комфортными, как сейчас: колоссальныеобъемы информации, мнений, взаимодействий и транзакций, осуществляемых онлайн, дают материал для обработки и последующего использования полученной информации. В этих условиях субъекты, осуществляющие хранение и обработку данных должны заботиться о постоянной информационной безопасности: единичныеслучаи утечки данных, хакерские атаки, утечки, затрагивающие большие данные,могут иметь крайне тяжелые последствия.Также отмечается снижение эффективности пользовательского выбора: некоторые исследователи отмечают, что отдельные компании, несмотря на решениепользователя касательно обработки данных, по факту могут использовать большие 9495 Шмидт Э., Коэн Д.
Новый цифровой мир. – М.: Манн, Иванов и Фербер, 2013. С. 99.Морозов Е. Техноненависть: как Интернет отучил нас думать. М.: Common Place, 2014. С. 33.55 данные в целях сбора обработки информации ограниченного доступа96. Многиепользователи неоправданно ограничиваются в ранее доступных им возможностях попричине действия или бездействия других лиц97.Обработка информации может не соответствовать оправданным ожиданиямконкретных лиц или напрямую вторгаться в их частную жизнь98.Приверженность современных аналитиков к методам обработки больших массивов данных, поиску скрытых связей между данными и явлениями, построение выводов и стратегий на основании полученной информации, воспринимается некоторыми учеными тревожно и поднимает вопрос о качестве достигаемых результатов.Действительно, увеличивающийся объем данных в какой-то степени компенсирует их недостаточное качество: «наблюдение за более широким спектром данных освобождает нас от необходимости сохранять особую тщательность.
(…) Теперь во многих новых ситуациях отсутствие точности, небольшой беспорядок могутоказаться положительным качеством, а не изъяном»99. Последователи данного мнения ссылаются на закон больших чисел. Они утверждают, что большое количествонаблюдений всегда ведет к выявлению определенной тенденции. Но в таком ходеразмышления не учитывается, что закон больших чисел относится к математике иимеет конкретные принципы.
Если их игнорировать, опираться на него нельзя.Иными словами, если, например, обеспечить идентичные условия для исследуемых 96Barocas S., Nissenbaum H. Big Data’s End Run Around Anonymity and Consent, in Privacy, Big Data, and the PublicGood: Frameworks for Engagement. 2014. P. 44.97Gangadharan S. The USA Federal Trade Commission.
The Networked Nature of Algorithmic Discrimination. 2014. //https://www.ftc.gov/system/files/documents/public_comments/2014/10/00078-92938.pdf, (дата обращения: 20 января 2018года).98Прим.: Так, каждый аспект анализа данных карты постоянного покупателя не всегда автоматически считается честным или отвечающим ожиданиям клиентов. Вопросы, связанные с этим, хорошо иллюстрирует ставший достаточноизвестным пример аналитики больших данных, проведенной компанией Соединенных Штатов Америки под названием «Таргет», определяющей моменты в жизни клиентов, где они становятся более открыты к переменам в покупательском выборе. В связи с этим, в рамках аналитики больших данных компания планировала предсказать, когда у клиента родится ребенок, чтобы заранее могли предлагать ему соответствующие товары.
Это помогло определить группутоваров, которые указывали на то, что клиент ожидает рождения ребенка, поскольку была найдена корреляция междудатами этих покупок и датой родов. Затем данная информация была сопоставлена с покупками каждой женщины вклиентской базе данных, чтобы найти тех, кто скорее всего находится в положении с указанием предполагаемой датыродов. Тогда «Таргет» мог посылать им предложения по товарам, связанным с беременностью и родами и пользоваться преимуществом любой перемены в их покупательских привычках, чтобы поощрить клиентов покупать и другиетовары.
Данная аналитика получила известность, когда отец пожаловался компании «Таргет» в окрестностях Миннеаполиса, что его дочь, которая еще училась в старших классах школы, получила рекламные купоны, хотя не находиласьв положении. Оказалось, что предсказательная модель «Таргета» была точна: его дочь ожидала ребенка, но отец обэтом не знал.99Майер-Шенбергер В., Кукьер К. Big Data: революция, которая изменит наше мышление, работу и жизнь. М.: Издательство Манн, Иванов и Фербер, 2014. 240 с. 56 событий или отождествить случайные наблюдения с наблюдениями, сделанными наоснове выборки, использовать закон больших чисел будет ошибкой100.Учитывая постоянное развитие технологий и появление новых мобильных устройств, используемых для сбора, хранения, доступа и передачи информации,высок рост незащищенности этих объектов.