диссертация (1335932), страница 60
Текст из файла (страница 60)
Качество выборки илиее репрезентативность зависят от теоретической схемы построения выборки икачества реализации выборки – уровня достижимости и кооперации единицотбора. Уровень достижимости (response rate) определяется как доля «успешных»или реализованных контактов (единиц отбора, информацию о которых удалосьсобрать в ходе опроса) от общего количества единиц в выборке. В дальнейшеммы будем говорить о вероятностных выборках, где каждая единица генеральнойсовокупности имеет известную вероятность отбора и эта вероятность больше нуля.266Kish L.
Survey Sampling. New York: John Wiley & Sons, Inc., New York, London, 1965. - 643 P.; Kish L.Statistical Design for Research NY: J. Wiley & Sons, 1987 - 267 P.293Применить одинаковую схему построения выборки или даже один типвыборки для разных стран пока невозможно. Построение выборки зависит отмногих факторов, которые отличаются от страны к стране, среди них:наличие и возможность доступа к «основе для выборки» (списка),включающей все единицы генеральной совокупности (с высоким, а лучшеабсолютным уровнем покрытия);территориальная разбросанность единиц отбора (домохозяйств ииндивидуальных респондентов), что связано со стоимостью и временем опроса;организационныеифинансовыеособенностиуправленияиорганизации социального исследования.В последние два десятилетия многие сравнительные академическиемежстрановые исследования, включенные в анализ, используют одну модельвыборки для всех стран-участниц – случайную вероятностную выборку.
Внекоторых исследованиях различия между странами существуют даже на уровнеобщей модели выборки или во всех странах используются не случайные квотныевыборки на последнем этапе отбора. Даже при одинаковом типе выборке –случайной вероятностной, практически во всех современных исследованияхэлементы и модели выборки для разных стран отличаются.Основные отличия в моделях случайных вероятностных выборок междустранами состоят в следующем:единица выборки – люди или домохозяйства с последующим отборомреспондента в семье;модель выборки – простая случайная или многоступенчатаякластеризованная;«источники-основы» выборки: административные списки(государственные «регистры» – списки жителей, граждан, налогоплательщиков,жилых адресов и т.п.), корпоративные списки (почтовые, жилищно-294коммунальные, избирательные, клиентские), справочные (телефонные,отраслевые по предприятиям и др.) либо территориальные выборки;при территориальных выборках домохозяйств «основа для отбора» –административные списки, предварительная перепись домохозяйств илимаршрутный отбор во время поля;метод отбора респондента внутри домохозяйства: «последний» или«ближайший» день рожденья, разные техники рандомизации выборки (вариантысхемы Киша).Как было сказано выше, различия эти связаны с различными страновымифакторами и особенностями: географическая протяженность (влияющая настоимость и время проведения интервью), наличие, доступность и характеристикиперечня выборочных единиц, наличие и доступность статистической информациио населении для выборочных единиц разного уровня.
Например, возможностьприменять простую случайную выборку респондентов есть в Эстонии,Финляндии, Исландии, Словакии, Словении, Швеции, Ирландии, Люксембурге иряде других стран. За пределами Европы возможности делать выборку из списковжителей есть в Китае, но реализовать ее можно только в отдельныхисследованиях, поддерживаемых государством, так как доступ к таким спискаморганичен. В большинстве стран всеобщих национальных списков нет вовсе(например, в Индии, в США, почти во всех странах бывшего СССР). В этомслучаеприходитсястроитьтерриториальнуювыборку–чащевсегомногоступенчатую, так как при территориальном принципе прямой отборчеловека (респондента) редко возможен.В большинстве стран на сегодняшний день для опросов на домуиспользуются многоступенчатые выборки.
Особенность этой модели выборкисостоит в том, что на каждом этапе единицы отбора разные. Сам тип иконкретные формы многоступенчатой выборки (какие именно единицы отбора накаждом этапе, сколько их, каков принцип отбора и вероятности отбора на каждомэтапе) в разных странах разные, что оказывает большое влияние на295эквивалентность выборок и ошибку выборки. Наиболее распространенной схемоймногоступенчатой территориальной выборки является отбор кластеров –географических единиц – районов, населенных пунктов, избирательных участков,почтовых отделений на первом этапе, отбор единиц меньшего размера напоследующих этапах, отбор домохозяйств и индивидуальных респондентов напоследнем этапе.
Последний этап в этой модели представляется особенно важным,так как именно там возникают наибольшие проблемы с «ошибкой выборки» и сэквивалентностью «ошибки выборки» между странами. На последнем этапе такаявыборка может быть адресной, то есть строиться на основе наличных списковдомохозяйств или населения – списков жильцов (населенного пункта или егочасти), электоральных списков, списков счетов коммунальных служб и т.п. Еслитаких списков нет, они недоступны, их качество вызывает серьезные сомнения(полнота) или в них используется определение единиц отбора, которое несоответствует целям исследования (только избиратели вместо населения в целом,только официально зарегистрированные государственными органами жильцы ит.п.), то применяется территориальная выборка домохозяйств. Такая выборкастроится либо методом маршрутного отбора, либо путем предварительнойпереписи домохозяйств/ жилых помещений на отобранной территории ицентрализованного отбора домохозяйств (метод, применяемый в ESS в России).
Впоследние годы развиваются новые или комбинированные способы подготовкисписков домохозяйств (жилых помещений) с использованием географическихгеолокационных систем. На последнем этапе отбор респондента внутридомохозяйства происходит либо с помощью Таблиц Киша, либо другимиметодамирандомизированногоотбора.Многоступенчатыекластерныетерриториальные выборки используются в постсоветских странах в большинствесравнительных межстрановых опросов на дому у респондентов.Во многих регионах мира кроме проблем на последнем этапе отбора иотсутствии списков или доступа к спискам домохозяйств или респондентов,проблемы возникают и на предыдущих этапах отбора. Например, если в страненет надежной информации о размещении населения по географическим единицам.296Такая ситуация может возникать из-за разных причин.
Например, из-за отсутствияпереписей населения за долгий период (в Украине последняя национальнаяперепись проводилась в 2001 г., в Узбекистане – в 1989 г.), отсутствия свободногодоступа к данным переписи (например, в Туркменистане), высокого уровнямиграции населения между переписями, что может происходить в периодыинтенсивной урбанизации, конфликтов, экономических кризисов. В некоторыхстранах или регионах, отдельных местностях, отсутствуют фиксированныеобозначения географических единиц (улиц, домов), или большое количествовременных строений (палаток, самодельных домов, трейлеров, лодок), которые неимеют фиксированных координат, что затрудняет построение адресной выборки.Прирасширениигеографиисравнительныхопросовивключениитерриторий с отсутствием или очень устаревшей информацией о размещениинаселения перед специалистами по выборкам встают новые задачи. Общеенаправление поисков состоит в использовании GPS технологий – разбиениетерриторий на равные квадраты, случайный отбор территорий с равнойвероятностью без учета численности и затем изучение квадратов, а также разныевозможности для оптимизации этой схемы267.При большом разнообразии в подходах к построению выборок возникаетвопрос об их эквивалентности.
Понимание эквивалентности выборок в последниегоды существенно видоизменилось. Традиционный подход состоит в том, чтоэквивалентность определяется через одинаковый достигнутый абсолютныйразмер выборки при условии общего принципа вероятностного отбора. Внекоторых исследованиях при этом применяется пост-гармонизация данныхметодом создания весов для учета различий в типе используемой выборки (учетедизайн-эффекта).Однако одинаковый размер выборки при разных схемах ее построения неведет к эквивалентности данных.
«Ошибка выборки» при этом не одинакова, как267Eckman S., Himelein K., Dever J. Innovative sample designs using GIS technology // Advances inComparative Survey Methodology, First Edition. / Ed. by T. Johnson, B-E. Pennell, I. Stoop, B. Dorer – NewYork: John Wiley & Sons, 2019. – P. 67-92.297и «эффективный» размер выборки при учете влияния дизайна.
268 В последнеедесятилетие разрабатывается подход установления равного «эффективного»размера выборки, рассчитанного с учетом дизайн-эффекта, а абсолютный размервыборки при этом может быть и действительно оказывается разным. Оннаименьшийвстранах,которыеиспользуютпростойслучайныйодноступенчатый отбор и наибольший – для многоступенчатых кластерныхвыборок. Такая стратегия используется во всех волнах для всех стран-участницESS, в волне 2017-2018 г. EVS и в ряде других исследований.Новые задачи ставит перед методологами и усложнение методов опроса,переход на «смешанные» методы, он-лайн опросы с разным подходом к отборуреспондентов.
Отдельная задача, которая пока находится только в процессерешения, это оценка эквивалентности выборок для разных методов опроса –территориальной и телефонной, телефонной и он-лайн выборок – для достиженияэквивалентности данных в рамках одного сравнительного исследования исовмещения выборок, построенных на разных источниках, для одной страны.4.1.3. Качество реализация выборок, проблемы недостижимости единиц отбораЭквивалентное определение генеральной совокупности и построениеэквивалентных моделей выборки является первым шагом к достижениюэквивалентности представления объекта в сравнительном исследовании. Вторымшагом является реализация выборки в ходе полевых работ.
Качество реализациивыборки выражается в показателях достижимости и уровня кооперацииреспондентов (response rate), а также в максимальном приближении структурывыборки к структуре представляемой генеральной совокупности. Сравнениеобычно проводится с переписями или другими внешними источникамисоциально-демографической и социально-географической информации. Низкийуровень кооперации респондентов и проблемы с общей достижимостью единиц268Hader S., Gabler S.
Sampling and Estimation. / Survey Methods in Multinational, Multiregional, andMulticultural Contexts. / Ed. by J.A. Harkness, B. Edwards, M. Braun, T. Johnson, L. Lyberg, P. Mohler, B-E.Pennell and T.W. Smith. – Hoboken, New York: John Wiley & Sons, 2003. – P. 117-136.298отбора – одна из главных и самых хорошо известных проблем массовых опросов вцелом и сравнительных межстрановых опросов в частности.