Автореферат (1138197), страница 3
Текст из файла (страница 3)
1. Результаты статистического экспериментаКак показывает график, процедура отбора приводит к искажениювременной зависимости и сильному завышению функции дожития.12Параграф 2.2 посвящён анализу длительностей в случае, когда имеютсяданные всего одного опроса и, соответственно, невозможно отследить сменусостояний изучаемых объектов.
В диссертационном исследовании эти методынеобходимы для сравнения результатов, полученных по данным РМЭЗ соценками, полученными на основании других данных. Изложенные подходы крешению этой проблемы известны в эконометрике, хотя не нашли широкогоприменения.
Причина малой распространённости заключается, видимо, в том,что в основной части исследований изучается экономика стран, относительнокоторых имеются более подробные данные, позволяющие применять болееточные методы анализа.Описывается метод синтетической когорты (см. например, Kiefer,Lundberg, Neumann, 1984), который используется в следующей главе длясравнения результатов, полученных по данным РМЭЗ, с оценками, которыеможно получить из других источников данных.
Метод предполагаетнеизменность функции дожития для состояний, начавшихся в разные моментывремени, предшествующие опросу. Подробно рассматривается частный случай,в котором приток объектов в изучаемое состояние постоянен. Подобнаяпредпосылка делается нами в дальнейшем при анализе эмпирических данных,так как мы не располагаем информацией о притоке.В параграфе 2.3 рассматриваются данные последовательности опросовнаселения.
Показывается, что особенностью этих данных является наличиеурезания слева, а также интервального цензурирования и цензурированиясправа.Цензурированиедлительностисостоянийсправаширокоипредставляетнерасространеноособойвданныхпроблемыодляисследователей. Интервальное цензурирование затрудняет оценивание моделейс различными типами выхода.
Урезание приводит к смещению отбора,последствия которого рассматриваются в диссертации далее. Учёт урезания ицензурирования приводит к подходу, существенно отличающемуся отиспользованного в предыдущих исследованиях по данным РМЭЗ – схематакого подхода изображена на рис.2. В его основе лежит тот факт, что хотя13длительности состояний, попадающих на моменты опросов населения,подвержены смещению отбора, но вероятность завершения некоторогосостояния в промежуток времени между опросами может быть состоятельнооценена.Знаявероятностьпрекращенияможновосстановитьзаконраспределения длительностей.Данные о времени завершениянаблюдавшихся при опросахсостоянийДанные о времени началанаблюдавшихся при опросахсостоянийДанные о длительностях наблюдавшихся состоянийМодель длительностиа) подход, использованный в работах (Grogan, van den Berg, 1999), Карцева (2002)Данные о завершении/не завершении наблюдаемых состояний впериод между раундами опросаМодель вероятности завершения состояний между раундами опросаРаспределение длительности состоянийб) предлагаемый подход.Рис.
2. Сравнение подходов к анализу длительностей по данным последовательности опросовнаселенияРассматривается случай наличия двух раундов опроса. На моментпервого раунда i-й объект находится в изучаемом состоянии в течение времениti. Между двумя наблюдениями за i-м объектом проходит время li. За это времясостояние может завершиться одним из S возможных типов выхода. Во второмраунде выясняется, прекратилось ли состояние, наблюдавшееся в первомраунде, и, если прекратилось, то какой тип выхода произошёл.
Наступившийвыход или его отсутствие обозначается величиной Yi, равной нулю, еслиизучаемое состояние всё ещё продолжается, иначе – номеру наступившего типа14выхода (1, …, S). В дальнейшем, в соответствии с кодировкой величины Yi, мыбудем называть изучемое состояние «состоянием 0», а тип выхода s = 1, ..., S –выходом в состояние s.Сначала решается задача анализа длительностей в случае одного типавыхода. Особое внимание уделяется оцениванию модели экспоненциальнойрегрессии, в которой предполагается, что наблюдаемые длительности Ti имеютпоказательное распределение с параметром i exp( xi ' ) , где xi – наборобъясняющих переменных в i-м наблюдении, а β – вектор коэффициентов приэтих переменных.
Показывается, что задача оценивания этой модели сводится кзадачеоцениванияcloglog-регрессии– известной и реализованной всовременных статистических пакетах процедуре:P(Yi 1) 1 exp( exp( xi ' ln li )).При оценивании cloglog-регрессии в качестве объясняющих величинфигурируют не только переменные xi, но и логарифм времени, прошедшегомежду двумя раундами опроса ln li, причём коэффициент при этойдополнительной переменной равен единице, так что при оценивании на негодолжно быть наложено ограничение.Послеэтогодопускаетсяналичиедвух типоввыхода,дляихмоделирования используется модель конкурентных рисков (competing risks).
Тоесть, длительность состояния 0 у i-го объекта задаётся с помощью двухлатентных величин T1,i и T2,i – длительностей до выхода в состояние 1 и всостояние 2, соответственно. Величина Ti - наблюдаемая длительностьсостояния 0 - задаётся следующим образом: Ti min(T1,i , T2,i ) .
Показывается, что вслучае показательного распределения величин T1,i и T2,i вероятности выходовимеют следующее выражение:P (Yi 0) exp((1,i 2,i ) li ) ,P(Yi 1) 1,i 1,i exp((1,i 2,i )li ) (1,i 2,i ) exp(2,ili ) (1 exp(1,i li )) exp( 2,ili ) ,(1,i 2,i )P(Yi 2) 2,i 2,i exp((1,i 2,i )li ) (1,i 2,i ) exp(1,i li ) (1 exp(2,i li )) exp(1,ili ) ,(1,i 2,i )15где λ1,i и λ2,i – параметры распределения величин T1,i и T2,i.Показывается, что анализ данных более чем двух опросов сводится кслучаю двух опросов искусственным увеличением числа наблюдений.Хотя функция правдоподобия может быть выписана в случае зависимостипараметров λ1,i и λ2,i от объясняющих переменных, при нахождении оценокпараметров возникает проблема множественных максимумов, так что прианализе данных РМЭЗ такой подход использовался только для определениясредней продолжительности безработицы и вероятностей выхода в занятость ииз рабочей силы.В параграфе 2.4 даётся альтернативное решение задачи, поставленной впредыдущем параграфе.
Рассматривается дискретная модель, в которой весьненаблюдаемый промежуток между раундами опроса разбивается на конечноечисло отрезков одинаковой продолжительности (в условную единицу времени).Различные варианты смены состояний изучаемого объекта, приводящие кразным значениям объясняемой переменной Yi (тип, или состояние, выхода)изображены на рис. 3 (проиллюстрирован случай двух типов выхода):Рис.
3. Возможные выходы из изучаемого состояния в течение ненаблюдаемого промежуткавремени между двумя опросами.На рис. 3 за ps(j) обозначается вероятность перехода в состояние s втечение одной единицы времени для состояния 0, продлившегося в течение jвременных единиц. Предлагается моделировать эти вероятности с помощьюлогистической модели множественного выбора:16p0 (ti | , , xi ) 1S1 exp( xi ' k k (ti | k )) k 1exp( xi ' s s (ti | s ))ps (ti | , , xi ) S1 exp( xi ' k k (ti | k )) k 1, s 1,..., Sгде βs - вектор коэффициентов при объясняющих переменных xi, которыеописывают направление и степень влияния этих переменных на вероятностьвыхода в состояние s, β - вектор всех коэффициентов модели, αs - векторпараметров временной зависимости для вероятности выхода в состояние s, α вектор всех параметров временной завимости, φs(t | αs) – некоторые функции,задающие форму временной зависимости для вероятности выхода в состояниеs.Такой подход гарантирует нахождение вероятностей в допустимыхпределах и даёт возможность интерпретации параметров β.
Значения элементоввектора exp(βs) отражают коэффициенты пропорциональности приростаотносительного риска выхода в состояние s при увеличении соответствующихобъясняющих переменных на единицу. Под относительным риском понимаетсявеличина ps ( j ) / p0 ( j ) .Вероятности возможных выходов или продолжения состояния 0 в периодмежду двумя раундами опроса имеют следующее выражение (для краткостиопущены параметры модели):ti li 1P(Yi 0 | ti , li ) p0 ( j )j titi li 1P(Yi s | ti , li ) j tiОтсюдавыводитсяj 1p(j) s p0 (k ) , s 1,..., Sk tiвыражениедляфункцииправдоподобия,максимизация которой даёт оценки параметров модели α и β. Показывается, чтовведение ненаблюдаемой разнородности в модель приводит к проблеменачальных условий, кроме того случая, когда временная зависимостьотсутствует.
Выводится функция правдоподобия для простейшей модели с17ненаблюдаемой неоднородностью и отсутствием временной зависимости –модели разделённой совокупности (split population model).Третья глава диссертации («Моделирование длительности безработицыв России») посвящена оцениванию средней продолжительности безработицыпо данным РМЭЗ, НОБУС и ОНПЗ и построению эконометрической моделидлительности безработицы по данным РМЭЗ.В параграфе 3.1 даётся обзор исследований, посвящённых проблемедлительности безработицы. Основной акцент делается на использованныхразличными исследователями методов анализа и полученных результатов вотношении временной зависимости.В параграфе 3.2 приводится теоретическое основание эконометрическихмоделейдлительностибезработицы–модельпоискаработы.Такжерассматриваются различные причины временной зависимости, в особенностипредпосылка о падении резервной заработной платы как причины роставероятности нахождения работы.Впараграфеосновывается3.3даётсядальнейшийанализируемойанализ.подвыборкиопределенияпонятияопределениебезработицыописаниеданных РМЭЗ,Подробнобезработных.«безработица».опираетсяВописываетсяРассматриваетсянастоящемнанакоторыхсоставлениепроблемаисследованииметодологиюприМеждународнойОрганизации Труда (МОТ), согласно которой безработным считается индивид- не имеющий работы,- желающий найти её и активно ищущий,- готовый приступить к работе в ближайшее время.Впрочем, при анализе использовались дополнительные ограничения.















