С.С. Валландер - Лекции по статистике и эконометрике (1160549), страница 34
Текст из файла (страница 34)
Наблюдения средней группыпросто отбрасываются. Обычно в учебниках приводятся "практическиерекомендации", согласно которым в среднюю группу включаются от15% до 20% из общего числа наблюдений. При этом крайние группыпредполагаются примерно одинаковыми по размеру. Предположим дляопределенности, что N = n1 +n2 +n3 , где n1 , n2 , n3 — численности групп,начиная с "малых"значений g(Xi· , Zi· ). Таким образом, первую группусоставляют n1 наблюдений с наименьшими значениями g, а третью — n3наблюдений с наибольшими значениями g.Далее, отдельно в первой и третьей группах, оцениваютсякоэффициенты регрессии β обычным методом наименьших квадратов,а затем, также по обычной формуле (через остатки), дисперсиянаблюдений отдельно взятой группы (т.е. так, как будто в пределах2группы дисперсии одинаковы). Пусть σ∗2 и σ∗∗∗— полученныеоценки дисперсий.
В предположении справедливости основной2гипотезы однородности отношение σ∗∗∗/σ∗2 имеет (по крайней мереасимптотически) распределение Фишера Fn3 −k,n1 −k . В предположенииальтернативной гипотезы можно думать, что это отношение будетсмещено вверх (вправо). Поэтому, выбрав по уровню значимостиε верхнюю критическую точку F-распределения, мы получаеместественный рецепт — отвергать H0 , если отношение оцененныхдисперсий превышает это критическое значение.В более общей модели неоднородности (7.14) учебники рекомендуютBP-тест (Breusch-Pagan test). Опишем его схематически, следуя [25].На первом шаге к исходной модели применяется обычный методнаименьших квадратов и строится величина1 X 2σ̂ 2 =ε̂iN(оценка максимального правдоподобия дисперсии в предположенииоднородности).Анализ регрессионных предположений201Затем образуются "нормированные"квадраты остатков ε̂2i /σ̂ 2и строится регрессия этих нормированных квадратов на наборвспомогательных регрессоров g1 ≡ 1, · · · , gr (см.
(7.14); заметим,что наличие в (7.14) функции h никак не учитывается). Согласно [14] вслучае однородных нормально распределенных ошибок регрессионнаясумма квадратов RSS вспомогательной регрессии, деленная пополам,имеет асимптотически распределение χ2r−1 . Большие значения величиныRSS/2 , по-видимому, указывают на нарушение основной гипотезы(возможно, в пользу (7.14); как указывает Грин [19], имеются основаниясчитать, что BP-тест чувствителен к нарушениям предположениянормальности).7.7Панельные данныеРегрессионные модели, используемые для описания панельных данных,довольно разнообразны (см.
[19]). Мы обозначим только некоторыеидеи из этой области. Прежде всего следует отметить, что спецификуподобных данных ("двумерный", в противоположность линейному,характер множества наблюдений) можно попробовать вообще неучитывать и пользоваться OLS. Однако при этом во многих случаяхбудут получаться неэффективные оценки. Поэтому разработка методов,специально ориентированных на панели, это, прежде всего, борьбаза эффективность.
Разумеется нельзя забывать и о том, что выборспецификации модели — дело довольно тонкое, и это еще один поводк изучению подобных подходов.Мы начнем с простого замечания об индикаторных величинах.Такие индикаторы имеют вполне отчетливый смысл. Одна категорияиндикаторов может описывать аддитивным образом отличия фирмили других подобных образований и не иметь отношения к временно́йдинамике. Вторая категория индикаторов может описывать как разизменения во времени, единые для всех фирм.
Тогда мы получимследующую спецификациюYit =kXj=1βj Xit,j +NXi0 =2γi0 Ii0 (i) +TXδt0 It0 (t) + εit .t0 =2Здесь Ii0 — индикатор фирмы с номером i0 , а It0 — индикатор моментавремени t0 .202Глава 7Кроме того, предполагается, что один из основных регрессоров(как обычно, первый) — константа. В противном случае следуетсуммировать по i0 и t0 , начиная с единицы. Ошибки εit в простейшемслучае предполагаются удовлетворяющими стандартным классическимусловиям — образующими (слабый) белый шум.Подобная спецификация, скорее всего, может возникнуть какальтернатива спецификации без индикаторов. Выбор между этимидвумя вариантами можно сделать, проверяя гипотезу равенства нулювсех коэффициентов γ и δ.
Если панель вытянута в одном из направлений(скажем, довольно часто встречаются задачи, в которых N многобольше T ), введение индикаторов приводит к значительным потерямв числе степеней свободы, а потому и в эффективности. Количествокоэффициентов регрессии, очевидно, равно k + (N − 1) + (T − 1), так чтоостаетсяN T − (k + N + T − 2) = (N − 1)(T − 1) − k + 1степеней свободы (еще одна степень свободы позже расходуетсяна дисперсию ошибок). Разумеется, в каких-то задачах часть этихиндикаторов не потребуется (возможно, придется проверять гипотезу оравенстве нулю группы коэффициентов), а коэффициенты при другихиндикаторах может оказаться целесообразным считать равными (опятьже проверка линейной гипотезы, только чуть более общего вида).Другая модель, которую мы рассмотрим, трактует влияние номерафирмы и номера момента времени стохастически, через их вклад вошибку.
Более точно, можно рассмотреть следующую спецификацию(error-components model):Yit =kXβj Xit,j + εit ,j=1гдеεit = ui + vt + wit .Предполагается, что компоненты u, v и w ошибки ε являются белымишумами, не коррелирующими между собой.В этой модели число коэффициентов регрессии остается равным k,число дополнительно возникающих параметров — два (вместо однойдисперсии σ 2 появляются три — σu2 , σv2 и σw2 ). Ошибки εit становятсяАнализ регрессионных предположений203в известном смысле коррелированными:E(εi1 t εi2 t ) = σv2 (i1 6= i2 ),E(εit1 εit2 ) = σu2 (t1 6= t2 ).Оценив дисперсии компонент ошибки (читатель может сам поизобретатьтакие методы — здесь широкое поле для фантазии), мы сможемприменить обобщенный метод наименьших квадратов и получитьдля коэффициентов регрессии оценки, которые, можно надеяться,асимптотически окажутся эффективнее оценок обычного методанаименьших квадратов.Более сложные (и, может быть, более реалистичные) модели,которые мы лишь упомянем, включают (ср.
с параграфами 7.5 и7.6) автокорреляцию ошибок (в направлении t) и/или неодинаковостьдисперсий (в направлении i). Для их оценивания может использоватьсяобобщенный метод наименьших квадратов.7.8Корреляция между регрессорами и ошибкамиПри обсуждении стохастических регрессоров в параграфе 1 мыпредполагали, что E(εi |X) = 0, E(ε2i |X) = σ 2 и E(εi1 εi2 |X) = 0(i1 6= i2 ). Эти соотношения, вообще говоря, нарушаются, если допуститькорреляцию (или более сложную зависимость) между ошибками и(не обязательно всеми) регрессорами, а оценки наименьших квадратовоказываются тогда смещенными.Если допустить, что указанная корреляция сохраняется иасимптотически, то оценки эти окажутся и несостоятельными (во всякомслучае нет особых причин считать их состоятельными).
Мы сейчасрассмотрим наиболее распространенную "двухшаговую"процедуру,дающую состоятельные (и, в некотором смысле, оптимальные) оценки.Начинается построение таких оценок с нахождения специфическихвспомогательных величин, которые мы будем называть первичнымиинструментами и обозначать Z1 , · · · , Zl . Как правило, в число первичныхинструментов включаются все регрессоры, не коррелирующие сошибками (в частности, константа).
Общее число инструментов должнобыть не меньше числа основных регрессоров (более точно это описанониже). Где искать недостающие инструменты — иногда непростойвопрос. Наиболее важный пример их связан с системами регрессионныхуравнений и будет рассматриваться в следующей главе.204Глава 7Главные свойства первичных инструментов (они по мере обсуждениябудут уточняться) — отсутствие корреляции с ошибками и, напротив,наличие корреляции с основными регрессорами. Ясно, что основныерегрессоры, не коррелирующие с ошибками, удовлетворяют и второмусвойству — коррелируют сами с собой (этим и объясняется тообстоятельство, что их включают в список первичных инструментов).На первом шаге описываемой процедуры строятся регрессии всехосновных регрессоров X·j на полный набор первичных инструментовZ1 , · · · , Zl . При этом используется обычный метод наименьшихквадратов.
Соответствующие прогнозные (fitted) значения X̂·jназываются целевыми инструментами, отвечающими основнымрегрессорам. Очевидно, что для регрессоров, не коррелирующих сошибками (т.е. входящих в список первичных инструментов) X̂·j = X·j— прогнозировать какую-либо величину по информации, содержащейее саму, занятие банальное.
Для остальных регрессоров целевыеинструменты можно представлять себе как карикатуры на них, главноедостоинство которых — отсутствие корреляций с ошибками (этоутверждение на самом деле справедливо только асимптотически; оновытекает из уточненных предположений об инструментах, которыесделаны ниже).На втором шаге строится регрессия объясняемой величины Yна набор целевых инструментов (т.е. регрессия, которую можнорассматривать как карикатуру на исходную основную модель).Как мы сейчас увидим, при достаточно разумном уточнениипредположений об инструментах оценки наименьших квадратов для этойрегрессии оказываются не карикатурными, а состоятельными.
Для тогочтобы выяснить это, введем сначала необходимые обозначения.Матрицу наблюдений первичных инструментов мы обозначим (а какиначе?) Z. У нее N строк (по числу наблюдений) и l столбцов (почислу инструментов). Матрицу прогнозных значений, состоящую изстолбцов X̂·j , j = 1, · · · , k, мы обозначим X̂. Легко сообразить, что всюсовокупность регрессий первого шага можно записать единым образомв матричной форме:X̂ = Z(Z 0 Z)−1 Z 0 X.Отдельной регрессии при этом соответствует аналогичное соотношениеX̂j = Z(Z 0 Z)−1 Z 0 Xj .На втором шаге матрица X̂ используется в качестве регрессионной, такАнализ регрессионных предположений205что оценки коэффициентов основной регрессии, предлагаемые описаннойпроцедурой, имеют видβ̃ = (X̂ 0 X̂)−1 X̂ 0 Y = (X 0 Z(Z 0 Z)−1 Z 0 X)−1 X 0 Z(Z 0 Z)−1 Z 0 Y.Если k = l, то размеры матриц X и Z совпадают, и формула значительноупрощается:β̃ = (Z 0 X)−1 Z 0 Y.Разумеется, проводя формальные преобразования, мы всюдупредполагали, что возникающие обратные матрицы существуют.
Теперьпришло время сформулировать условия, которые эту обратимостьобеспечивают.Это делается почти аналогично тому, как вводились в параграфе3 условия, дававшие в тех предположениях состоятельность оценокнаименьших квадратов. Все пределы в написанных ниже соотношенияхпонимаются как пределы по вероятности.Первое условие — условие невырожденности совокупности первичныхинструментов:1 0limZ Z = QZZ ,N →∞ Nгде QZZ — невырожденная матрица. Как и в параграфе 3 предельнаяматрица QZZ предполагается неслучайной.Второе условие относится к взаимоотношениям первичныхинструментов и ошибок — надлежит обеспечить отсутствие корреляций(хотя бы в асимптотическом смысле):1 0Z ε →N →∞ 0.NНаконец,третьеусловиеобеспечиваетасимптотическуюневырожденность матрицы целевых инструментов и, тем самым,корректность второго шага описанной процедуры:1 0Z X →N →∞ QZX ,Nгде QZX — матрица полного ранга (т.е.