диссертация (1335932), страница 68
Текст из файла (страница 68)
Такая процедурастановится двухступенчатой – от «сырых» к национальным данным, отнациональных – к сравнительным межстрановым. Если на уровне одной страныобработка обычно происходит в одном исследовательском центре, использующемодинаковые приемы, стандарты, форматы для всех единиц отбора внутри своейстраны, то на межстрановом уровне приходится иметь дело с данными,полученными в рамках разных традиций, стандартов и форматов представленияданных опросов. Процесс корректировки ошибок в сравнительном межстрановомисследования также становится более сложным, чем в однострановом. Такиеошибки необходимо не только выявить, но и создать последовательную системуих корректировки во всех странах-участницах исследования. Так как такойпроцесс может занимать довольно длительное время, обратиться к «сырым»данным или вернуться непосредственно к источнику данных – респонденту ужечасто не представляется возможным, и приходится искать другие методы иподходы к корректировке.Виды «ошибок обработки информации» зависят от метода проведенияопроса, составляющих этапов и участников процесса обработки данных.
Полныйцикл обработки данных можно описать следующим образом:Уровень 1. От респондента до первоначальной базы данных – двухэтапныйпроцесс в случае использования бумажного носителя и одноэтапный прииспользовании компьютеризированного интервью. В первом случае базовыйбланк для фиксации ответов (анкета) заполняется либо интервьюером в случаеличных интервью, либо самим респондентом, если исследование проводится на298Oleksiyenko O., Wysmulek I., Vangeli A. Identification of processing errors in cross-national surveys / O.Oleksiyenko, I. Wysmulek, A.
Vangeli. // Advances in Comparative Survey Methodology. / First Edition, ed. byT. Johnson, B-E. Pennell, I. Stoop, B. Dorer. – NY: John Wiley & Sons, Inc., 2019. – P. 985-1010.333бумажных носителях, затем информация переносится с бумажных носителей вкомпьютернуюформу(чащевсегоосуществляетсяпрофессиональнымиоператорами). В этом случае процесс ввода данных – двухстадийный, в немучаствуют респонденты или интервьюеры, а также операторы (иногда возникаюти промежуточные звенья). В случае компьютеризированного интервью (CAPI,CATI, CAWI) ввод данных одноэтапный – либо интервьюер, либо респондентсразу вносит информацию в компьютеризированную форму (базу данных).С одной стороны, чем больше этапов в процессе перевода данных из одногоформата в другой, тем выше вероятность возникновения ошибок и проблем(ошибка первоначальной фиксации и ошибка ввода).
С другой стороны,возникают и два документа для контроля, возможность сравнить первоначальнозафиксированную информацию и обработанную. В случае одностадийного ввода,который чаще всего осуществляется либо профессионально неподготовленнымидля этого людьми (сами респонденты), либо интервьюерами, для которых задачаввода данных не является основной и сам процесс происходит часто в стрессовыхинеудобныхусловияхвходеинтервью,возможностейвернутьсякпервоисточнику не существует. В этом случае улучшить качество переводаинформации в компьютерную форму можно, лишь совершенствуя самукомпьютерную программу, вводя внутренние для программы системы проверки,дублирования, уточнений.Уровень 2. От «сырых» данных (raw data) к стандартизированным данным вкаждой стране.
Первоначальная база данных, которая образуется послеобъединения всей собранной информации, проходит первоначальную проверку насоответствие правилам и формату обработки (лишь установленные значения длякаждого вопроса, неиспользование несуществующих значений, правила логикиответов на вопросы, пропущенные данные на вопросы из-за сознательногорешения респондента или по случайным причинам).- Создание «служебных» переменных на основе документов исследования,внутренней информации анкеты (например, пересчет метрических значений винтервалы и т.п.).
Если при обработке данных используются более глубокие334процедуры проверки данных – на внутреннюю непротиворечивость, вероятнуюдостоверность и другие характеристики содержания данных, то мы будемговорить об этапе «редактирования» данных. В этом случае в сравнительномисследовании необходимо разрабатывать общие процедуры и правиларедактирования – что именно должно проходить проверку и какие правилаизменения данных могут быть применены, чтобы данные всех стран-участницпроекта были «отредактированы» единым образом.- В процессе обработки может быть предусмотрена процедурадополнительного кодирования данных (открытых вопросов, комментариев,любой другой информации), которая также должна быть формализована.Особые трудности в стандартизации обычно возникают в сравнительныхмежстрановых проектах в отношении структурных или контекстуальныхпеременных,которыеотражаютпрофессиональную,образовательную,религиозную, экономическую и т.п.
системы, уникальные для каждой страны. Ктаким переменным относятся образование, профессия, родной язык, отраслиэкономики, категории дохода, а иногда и само определение «дохода»,религиозныеконфессии,формысобственностипредприятий(видыпредприятий), виды трудовых соглашений и контрактов, региональное деление.- На одном из заключительных этапов обработки данных можетпроводитьсяпроверканаанонимностьисоответствиетребованиямзаконодательства о распространении данных, защите частной информации.Если информация, содержащаяся в базе данных, позволяет нарушитьанонимность респондента (идентифицировать респондента в большой долейвероятности, используя все имеющиеся данные – географическая единица,социально-демографические параметры, структуру семьи и др.), то можетпотребоваться редактирование информации в целях анонимизации.
Правилаанонимизации в сравнительном исследовании необходимо согласовыватьзаранее, хотя пока такая процедура проводится и документируется лишь внекоторых сравнительных межстрановых исследованиях. Исследовательские335организации в разных странах обязаны следовать требованиям национальногозаконодательства о правилах обращения с такого рода данными. Во многихстранах регулируются сроки хранения такой информации, условия ее хранения,доступа сотрудников и многое другое.
Согласование правил и требований,которым нужно следовать в сравнительном межстрановом проекте, можетсущественным образом облегчить подготовку данных для публикации иизбежать проблем с эквивалентностью обработки данных на более позднихстадиях.Уровень 3. От базы страновых данных к базе сравнительных межстрановыхданных. Заключительным этапом подготовки сравнительной базы эмпирическихданных по многим странам является их объединение, проверка и дальнейшаястандартизация. Эта процедура может быть организована по-разному:- полностью централизованная стандартизация национальных данных,подготовленных в разных формах;- стандартизация основных форм представления данных на ранних стадияхорганизации опроса, обработка информации в каждой стране отдельно согласноэтой форме, отдельные задачи (кодирование открытых вопросов илидополнительная перекодировка данных) выделяются в отдельный этап;- максимальная стандартизация всех требований, процедур и формобработки на ранних этапах, подготовка данных в стандартной форменациональными группами, проверка выполнения процедур и необходимаядоработка централизованным способом.Достоинствомполностьюцентрализованнойсистемыобработкиинформации мы видим в максимально высоком уровне стандартизации данных,полном соблюдении требований единого формата, единых процедур по проверкеданных во всех странах, общем подходе к выявлению и коррекции ошибок,наибольших возможностях для подробного документирования этого этапа.Однако серьезным препятствием для использования этого пути является то, что«сырые» данные собираются в разных странах в разных формах (бумажные336версии, разные компьютерные программы), в каждой стране используется свойнаборслужебныхорганизационнойпеременных,структуройкоторыесбораисвязаныпередачисадминистративно-данных,особенностямипостроения выборки, используемой системой мониторинга полевых работ.Дополнительнуюсложностьсоставляюттребованияобанонимностииконфиденциальности информации, полученной от респондентов, ограничения напередачу такой информации третьим лицам.
При такой системе слабее становятсяи возможности корректировки данных в случае необходимости вернуться креспонденту или провести другой способ проверки и валидации полученнойинформации, которую можно сделать только в местных условиях.В современных сравнительных межстрановых исследованиях используетсядвухэтапная процедура обработки данных, сочетающая централизованный истрановой подход. При этом функции центра и национальных групп в разныхпроектах разные в зависимости от организационной структуры самогосравнительногоцентральнойисследования,группыпополномочийобработке,ифинансовыхконтрактныхвозможностейотношениймеждуисследовательскими группами.
Например, в ESS отвечающий за подготовкуданных Норвежский архив социальных наук определяет основные требованияпредоставления данных – готовит список документации, формат предоставленияданных в двух статистических программах - SPSS и STATA – на выбор, готовитобщее описание формата (лейблы, ранги, инструкции по переходу от вопроса квопросу, использование служебных кодов, пропущенные данные).
Затемнациональные организации проводят первоначальную обработку данных в техкомпьютерных программах и теми средствами, которые считают наиболееоптимальными в их условиях, строят дополнительные служебные переменные, азатем конвертируют данные в стандартный формат уже в анонимизированномвиде. Задачей центра по обработке является последующая пошаговая проверкаданных по заранее утвержденной процедуре, но проверка всех найденных ошибоки решение об их исправлении принимается национальными группами,337отвечающими за сбор данных.
Информация обо всех найденных проблемах, ихобсуждении и принятых решениях, подробно документируется.При такой процедуре эквивалентность обработки и представления данныхможно обеспечить при выполнении последовательных процедур:Стандартная форма представления данных опроса из разных стран,где подробно описаны все переменные – как основные, так и служебные,единообразноприсвоеныназванияэтимпеременным,перечисленывсевозможные категории ответов, включая служебные (такие как пропущенныеданные и т.п.), и согласована статистическая программа, используемая для этоговсеми исследовательскими группами.