Диссертация (1138365), страница 10
Текст из файла (страница 10)
Так критические значениятестовой статистики для случая гетероскедастичных ошибок в уравнениипервого шага, например, приведены в работе [Kleinenberg, Paap, 2006].Энгрист и Пишке [Angrist, Pishke, 2009] предложили альтернативныйподход к тестированию релевантности инструментов, без использованиясобственных чисел матрицы Π2′ ′ Π2 . Безусловная оценка значимостиинструментов в каждом отдельно уравнении первого шага может бытьзавышена, т.к.
может существовать линейная зависимость между проекциямиинструментов на эндогенные переменные. Авторы предложили оцениватьзначимость инструментов при условии потенциальной связи междупроекциями. Такой подход получил название «условный F-тест» (conditionalF-test). Его процедура сводится к следующим шагам: 1) Оценка уравнения длякаждой эндогенной переменной, разрешенной относительно всех остальныхэндогенных переменных, 2) оценка параметров уравнений первого шага длякаждой эндогенной переменной при условии их потенциальной связи сдругими эндогенными переменными, 3) вычисление тестовых статистикусловной значимости набора инструментов для каждого уравнения.
Говоряформально, для тестирования необходимо:1) Получить МНК оценки ̂ из регрессии 2 = 2,− + 572) Получить МНК оценки ̂ из регрессии 2 − 2,− ̂ = + ′ ′̂2̂2 3) Для каждого уравнения посчитать 2|2,− =̂ ′ ̂( −2 +1)(где 2 = (2 , 2,− ), = (1 , 2 ), сравнив,)2|2,− с квантилью F-распределения.Данный тест учитывает не только объяснение инструментамисущественной доли вариации эндогенных переменных, но также ипотенциальную взаимозависимость между эндогенными переменными,которая может искажать результаты безусловного F-теста.Сандерсон и Виндмайер [Sanderson, Windmeijer, 2014] описаликорректное предельное распределение тестовой статистики, а также показалиэквивалентность данного теста тесту Стока и Його [Stock, Yogo, 2005].Преимуществом предложенного Энгристом и Пишке подхода является то, чтолимитирующее его распределение известно для случая более чем двухэндогенных переменных, т.е. для него относительно не сложно посчитатькритические значения.
Более того, он легко обобщается на случай нарушенияпредпосылок о виде ковариационной матрицы ошибок, а также нелинейныхрегрессионных функций.Модель (7) является непараметрической системой одновременныхуравнений.Рассмотримтакжеизвестныеподходыктестированиюрелевантности исключенных инструментов непараметрических моделей напримере модели одного непараметрического уравнения с несколькимиэндогенными переменными и аддитивной ошибкой, где = (1 , 2 ),() = 1 + 2 , = (1 , ), () = 1 + ,1 ≥ 0, ≥ 2 ,: ℝ(1 +2 )∗ → ℝ , : ℝ(1 + )∗ → ℝ : = () + 02 = () + , = 1, … , 2(0 , 1 , … , 2 ) ⊥ .58Ньюи[Newey,идентификации2013]полностьюсформулировалдостаточноенепараметрическоймодели.условиеТакдляидентификации достаточно, чтобы () = 0 была единственной функцией,удовлетворяющей [()|] = 0. Данное условие получило название условиеполноты.
В линейном случае оно сводится к обычному ранговому условию.Вообще же без дополнительных предпосылок условие полноты не являетсятестируемым, что было показано в [Canay, Santos, Shaikh, 2013]. В полностьюнепараметрической модели уравнения первого шага представляют собойматрицу бесконечной размерности с собственными числами, сходящимися кнулю. Неидентификация модели присутствует, если хотя бы одно собственноечисло точно равно нулю. Проблема с тестированием данной гипотезызаключается в том, что эмпирически невозможно различить модель ссобственным числом, сходящимся к нулю, от модели с нулевым собственнымчислом.Возможность тестирования полноты появляется при постановкенекоторых ограничений на вид модели. Так Ньюи [Newey, 2013] доказал, чтопри аппроксимации регрессионных функций первого шага линейнойкомбинацией известных функций (аппроксимация полиномиальной сериейили сплайнами) условие идентификации является тестируемым, не предложиводнако механизмов тестирования.
Канай и др. [Canay, Santos, Shaikh, 2013],хоть и доказали, что в общем виде тестирование идентификации невозможно,тем не менее они предложили способ тестирования идентификации длянепараметрической квантильной регрессии. Также они обсудили случаиполучения частичной идентификации модели без какой-либо необходимоститестирования.В данном исследовании введена структурная модель (7) вида0, 0 ( , 0 ) + 0 ≤ 0 = {1, 0 ( , 0 ) + 0 > 059∗∗1= 1 (−1, , 1 ) + 1…{∗∗ = (− , , ) + ненаблюдаемо, если = 0 = {∗ ,если = 1,где = (1 , … , ) = ( , − ) является набором эндогенных переменных, –набор включенных инструментов, () = , 0 – набор исключенныхинструментов из уравнения участия, (0 ) = 0 , = (1 , … , ) – наборисключенных инструментов системы одновременных уравнений, ( ) = , () = , ≥ .В параграфе 2.2 были сформулированы условия идентификации модели.Так требуется выполнение наличия значимых исключенных переменных дляуравнения участия0 (,0 )≠ 0 и рангового условия для уравнений в0приведенной форме1 [(,)] = .
Опишем процедуру тестированиявыполнения данных условий.Так как уравнение участия не является многомерным с точки зренияэндогенных переменных, то значимость исключенных переменных легкотестируется обычным F-тестом. Так при аппроксимации неизвестной функции0 : ℝ(+0)∗ → ℝ полиномиальной аппроксимирующей серией 0 (, 0 )степени 0 получим МНК оценку параметров аппроксимирующего полинома̂0 = [(0 (, 0 ))′0 (, 0 )]−1 (0 (, 0 ))′.ДалееF-тестомможнопротестировать статистическое отличие от нуля хотя бы одного параметраперед членами полинома, содержащими 0 .На втором шаге процедуры оценивания необходимо протестировать, чторанг предельных эффектов матрицы исключенных инструментов для системыВ описанной выше литературе оценки регрессионных функций назвали бы оценками «первогошага».
Т.к. при наличии выборочной селективности первым шагом является оценка уравненияучастия, а оценка параметров приведенной формы – вторым шагом, то называть теперь оценки оценками первого шага является для введенной модели некорректным.601одновременных уравнений в приведенной форме является полным, т.е. неменьшим, чем количество эндогенных переменных.Так как каждый предельный эффект (,)в линейном случае являетсяпостоянным для каждого наблюдения, то процесс нахождения собственныхчисел матрицы предельных эффектов не является затруднительным.
Внелинейном случае предельных эффект является функционально зависимымот остальных аргументов функции , что делает невозможным тестирование,основанное на подходе, предложенное Крэггом и Дональдом [Cragg, Donald,1993] и Стоком и Його [Stock, Yogo, 2005]. Сандерсон и Виндмайер доказалиэквивалентность теста Стока и Його «условному F-тесту». Следуя подходу[Sanderson, Windmeijer, 2014], обобщим его на случай рассматриваемой намимодели.Отличие от предложенного для линейного случая подхода Сандерсона иВиндмайера состоит в том, что на шагах (1-2) необходимо корректироватьошибки оцениваемых уравнений на выборочную селективность, используяфункцию коррекции от оценки предрасположенности уравнения участия. Анеизвестные регрессионные функции и функции коррекции необходимозаменить аппроксимирующими их полиномиальными сериями, следуяподходу к оцениванию, предложенному в параграфе 2.3.Процедура тестирования сводится к следующим шагам, обозначенным втаблице 1.
Предложенный тест и результаты его апробации опубликованы в[Ozhegov, 2014]. Тестовая статистика показывает совместную значимостьпараметровполиномапередчленами,содержащимиисключенныеинструменты, корректируя степени свободы на количество параметров,оцененных на первом шаге теста. Если > 0, то в числителе тестовойстатистики будет стоять квадратичная форма не всех параметров полинома,свернутая по полиномиальным членами, а только параметров , стоящихперед полиномиальными членами, содержащими исключенные инструменты,соответственно свернутых по ним.
В знаменателе же в первой скобке будет61количество тестируемых параметров за вычетом количества параметров,оцененных на первом шаге. Соответственно если тестовые статистики длякаждой эндогенной переменной статистически отличны от нуля на основаниисравнения с критическим значением F-распределения, то ранговое условие дляисключенных инструментов системы выполнено.Таблица 1. Пошаговая процедура тестирования релевантности исключенныхинструментов.№Содержательный смыслДействиешага1.Оценка уравнения для каждой Получение МНК оценок ̂ , ̂ из регрессииэндогеннойпеременной = 1 (− ) + 1 (̂ ) + ,других где = (1 ( ), 1 (̂ ))относительноэндогенныхпеременныхдальнейшегоизбавлениядляотпотенциальной коллинеарностипредельных эффектов.2.Оценка−–полиномиальные аппроксимирующие сериистепеней 1 ,̂ = [ | , 0 ] == 1 [1 ′1 ]−1 1 ′зависимости Получение МНК оценок ̂ из регрессиинеобъясненнойэндогеннымичасти1(другимипеременными)вариацииэндогенной − 1 (− )̂ − 1 (̂ )̂ == 1 (, ) + 1 (̂ ) + каждойпеременнойнабором инструментов.3.Тестирование гипотезы о том, Калькулированиечтонаборинструментовобъясняеткаждой эндогенной переменнойусловиимеждустатистики(наисключенных примере () = = 0):существенную долю вариации(притестовой |− =̂′ (1 ())′ 1 ()̂̂′ ̂(( ) − ( ) − ( ))( )взаимосвязиэндогеннымипеременными).62Глава 3.