Хохлов Ю.С. - ПМСА для эконома (1185346), страница 11
Текст из файла (страница 11)
Сама величина α показывает величинуприбавки при переходе из одной категории в другую.Если интересующая нас качественная переменная принимает более двух значений, то можно ввести дополнительную переменную с несколькими дискретными значениями, например, 0, 1, 2, 3. Но, так как перед такой переменной будет стоять некоторый единый коэффициент,то мы неявно предполагаем, что переходы из категории0 в категорию 1 и из категории 1 в категорию 2 приводят к одинаковым изменениям изучаемой переменной Y .Часто по смыслу задачи видно, что это не так. В такихслучаях удобнее ввести несколько бинарных переменныхдля кодировки различных уровней качественного фактора.
Продемонстрируем это на следующем примере.Пример 2. Изучается объем продаж мороженого в зависимости от некоторых факторов X1 , . . . , Xm , например,цены на мороженое, цен на сопутствующие товары и т.д.Ясно, что объемы продаж мороженого зимой и летом будут разными. Поэтому хотелось бы изучить зависимостьобъемов продаж в зависимости от времени года. Для этого введем три (почему не четыре?!) бинарных переменныхd1 , d2 , d3 , которые равны 1 соответственно зимой, веснойи летом и равны нулю в противном случае.
Тогда модельизмерений будет иметь видYj = dj1 α1 + dj2 α2 + dj3 α3 + Xj1 β1 + . . . + Xjm βm + εj .Рассмотрим еще несколько примеров.87Пример 3. В 1974 году наблюдалось резкое снижениерасходов на пребретение автомобилей в США. Это было связано с арабо-израильской войной 1973 года, которая привела к увеличению цен на бензин. Затем расходывновь начали расти. Мы предполагаем, что функция спроса имела сдвиг в 1974 году. Чтобы учесть этот эффект, мывводим вспомогательную переменную d, которая равна 0до 1974 года и равна 1 после 1974 года. Если Y есть расходы на автомобили, а X есть личный располагаемый доход,то можно рассмотреть следующую модель:Yt = α + β · Xt + δ · dt + εt .Здесь t обозначает год, т.е. мы имеем модель временногоряда. По имеющим данным о расходах на автомобили вСША с 1963 по 1982 годы была проведена оценка этоймодели и получены следующие результаты.y = 0.57 + 0.035 · x − 4.40 · d .Мы видим, что α = 0.57 до 1974 года и α + δ = −3.83 после1974 года.
Гипотеза H0 : δ = 0 отвергается на 5% уровне.В заключение рассмотрим еще раз пример о зависимости величины зарплаты в Голландии от пола работника.Пример 4. Изучается зависимость величины зарплаты в Голландии от возраста (стажа работы) и пола работника. Для решения этой задачи используются данные,собранные в Голландии в 1997 году. Для исследования были отобраны 75 мужчин и 75 женщин. Введем фиктивнуюпеременную S, равную 1 для женщин и 0 для мужчин.Оценивалась линейная регрессия видаWj = α + β1 · agej + β2 · Sj + εj .88Результаты оценки модели собраны в таблицеcoefαβ1β2estimates6.110.53- 3.73SE2.390.061.35t2.568.58- 2.76p0.0110.0000.0065Таким образом, мы получили следующее уравнение регресии:Ŵ = 6.11 + 0.53 · age − 3.73 · s .Коэфициент детерминации равен R2 = 0.39.
Из таблицымы видим, что коэффициенты β1 и β2 являются значимыми на уровне 0.01. Модель объясняет поведение переменной W на 39 процентов. При прочих равных условияхразличие в зарплате у мужчин и женщин равно 3.73.89Глава 6Обобщения классическойлинейной модели6.1Обзор результатов для классическойлинейной моделиПрежде, чем переходить к обобщениям классической линейной модели, напомним основные результаты, полученные в рамках этой модели.Пусть мы имеем одну зависимую переменную и m факторов (объясняющих переменных). Проводится N измерений, причем предполагается, что имеет место следующаямодельYj = g(Xj1 , . . . , Xjm ) + εj .Всюду далее в этом параграфе предполагается, что выполнены следующие основные ограничения:1) модель линейна по параметрамYj = α + β1 Xj1 + .
. . + βm Xjm ) + εjили, в матричной форме,Y = Xθ + ε ,90(6.1)где Xj0 ≡ 1, θ = (α, β1 , . . . , βm )T ;2) X – неслучайная матрица;3) {εj } – независимы (некоррелированы);4) M (εj ) = 0;5) D(εj ) = σ 2 для всех j (гомоскедастичность);Из (3)-(5) следует, чтоΣε = M (ε · εT ) = σ 2 · E ,(6.2)6) Ошибки {εj } имеют нормальное распределение.Основной задачей является оценка параметров θ и дисперсии ошибок σ 2 .
Если матрица плана эксперимента X T Xневырождена (эквивалентно X имеет ранг m + 1), то существуют оценки по МНК и они имеют видθ̂ = (X T X)−1 X T Y = θ + X T X −1 X T ε .(6.3)Оценка дисперсии σ 2 находится по формулеσ̂ 2 =NX1(Yj − Ŷj )2 .N − (m + 1) j=1(6.4)Полученные оценки обладают следующими свойствами:1) оценка θ̂ – линейна;2) θ̂ – несмещенная оценка для θ;3) θ̂ – оптимальная в среднем квадратическом оценка вклассе всех линейных несмещенных оценок;4) если N1 X T X → ΣX при N → ∞, где ΣX – невырожденная матрица размера m + 1, то θ̂ = θ̂N – состоятельнаяоценка, т.
е. θ̂N → β, N → ∞;5) σ̂ 2 – несмещенная и состоятельная оценка для σ 2 .Предположение о нормальности используется при построении доверительных интервалов и проверке гипотез.916.2Модель со стохастическими факторамиВ реальных ситуациях мы не можем управлять проведением экперимента и факторы X1 , . . . , Xm сами являютсяслучайными величинами. Ниже будет показано, что привыполнении некоторых ограничений это не нарушает основных результатов, полученных для классической линейной модели.6.2.1Описание моделиПусть, как и ранее, проведено N измерений и выполненыследующие ограничения:1) модель линейна по параметрамY = Xθ + ε ,2) X –случайная матрица, но Xj0 ≡ 1, причем (без ограничения общности) M (Xjk ) = 0;3) X и ² – независимы (некоррелированы);4) M (ε) = M (ε|X) = 0 ;5) Σε = M (εεT ) = M (εεT |X) = σ 2 · E ;6) (Y, X1 , .
. . , Xm ) имеют невырожденное нормальное распределение.В силу закона больших чисел получаемN1 T1 XPε ε=ε2j → σ 2NN j=1(6.5)1 TPX X → ΣXX ,N(6.6)92где ΣXX – невырожденная квадратная матрица размераm + 1,1 T PX ε→0.(6.7)N6.2.2Оценки параметров и их свойстваПрименяя обычный МНК, мы получаем оценки для θ иσ2:θ̂ = (X T X)−1 X T Y = θ + X T X −1 X T ε ,(6.8)σ̂ 2 =NX1(Yj − Ŷj )2 .N − (m + 1) j=1(6.9)Покажем, что эти оценки обладают всеми свойствами,которые были доказаны в рамках классической линейноймодели.Пусть выполнены условия 1)-6), сформулированные выше. Тогда справедливы следующие свойства.1) θ̂ – линейна по параметрамЭто свойство есть прямое следствие вида оценки θ̂ (см.(8)).2) θ̂ – несмещенная оценка параметра θ.Для доказательства нужно применить формулу полного математического ожидания к выражению (8) и использовать свойство 4).3) θ̂ = θ̂N – состоятельная оценка.Для доказательства используем явный вид (8) для оценки параметра θ, а также соотношение (7):θ̂ = (X T X)−1 X T Y = θ + X T X −1 X T ε =93µ¶ µ1 T −11 T=θ+X X·X εNN¶P→ θ + (ΣXX )−1 · 0 = θ .Важным моментом последнего доказательства являетсято, что X и ε являются некоррелированными.
Если этоне так, то мы получаем1 T PX ε → ΣXε ,Nгде ΣXε есть вектор ковариаций факторов X1 , . . . , Xm иошибки ε. Если какая-то из компонент этого вектора неравна нулю, т. е. соответствующий фактор коррелирует сошибкой измерения, то для такой же компоненты вектораоценок параметров не выполняется свойство состоятельности.4) θ̂ оптимальна в среднем квадратическом в классевсех линейных несмещенных оценок.Мы уже доказали это свойство для случая, когда матрица X неслучайна.
Для завершения доказательства нужно применить формулу полного математического ожидания (Задача!).5) σ̂ 2 – несмещенная и состоятельная оценка для σ 2 .6.2.3Метод инструментальных переменныхВыше, при доказательстве состоятельности оценок, былоотмечено, что это свойство нарушается, если факторы коррелируют с ошибкой измерений. В подобной ситуации применяют иак называемый метод инструментальных переменных.
Суть этого метода состоит в том, что мы заменяем "плохие"(коррелирующие с ошибкой) факторы на некоторые новые переменные, которые тесно связаны (сильно94коррелируют) с теми переменными, которые мы удаляем,но сами не коррелируют с ошибкой.Пусть мы имеем матрицу Z размера N ×(m+1), Zj0 ≡ 1,измерений некоторых новых измерений, причем выполнены следующие условия:1 T PZ ε→0,(6.10)Nт. е. новые переменные не коррелируют с ошибками,1 TPX X → ΣZX ,(6.11)Nгде ΣZX – невырожденная квадратная матрица размераm + 1, т. е. новые и старые переменные коррелируют имогут быть выражены друг через друга.В качестве новой оценки для параметра θ предлагаетсявзятьθ̃ = (Z T X)−1 Z T Y = θ + (Z T X)−1 Z T ε(6.12)Покажем, что эта оценка является состоятельной.
В силусвойств (10) и (11) получаемµθ̃ = θ +1 TZ XN¶−1 µ¶1 TPZ ε → θ + Σ−1ZX · 0 = θ .NРеально матрица Z строиться из матрицы X заменойнекоторых переменных, которые коррелируют с ошибками, на экзогенные переменные, которые всегда предполагаются некоррелированными с ошибками.6.3Обобщенный метод наименьших квадратовВ классической линейной модели предполагалось, чтоY = Xθ + ε95и ошибки измерений имеют следующую матрицу ковариацийΣε = M (εεT ) = σ 2 · E ,что эквивалентно тому, что ошибки в разных измерениях некоррелированы и имеют одинаковые дисперсии. Вомногих реальных экономических задачах это не так. Интуитивно понятно, что, как правило, большим значениямXjk соответствует и больший разброс значений Yj .
Прианализе временных рядов естественно предположить, чтоYj и Yj−1 (эквивалентно εj и εj−1 ) коррелированы. Дляописания подобных ситуаций рассмотрим более сложнуюмодель. Предположим, чтоΣε = σ 2 · Ω ,(6.13)где Ω – известная симметричная положительно определенная N × N -матрица, σ 2 – неизвестный параметр.Если для оценки параметров θ применить обычный МНК,то получим оценкуθ̂ = (X T X)−1 X T Y = θ + X T X −1 X T ε .Если выполнены основные ограничения классической линейной модели с заменой свойства (2) на (13), то оценкаθ будет несмещенной и состоятельной, но, как мы увидимниже, она не будет эффективной (оптимальной в среднемквадратическом).
Для получения оптимальной оценки сведем задачу к классическому случаю. Так как Ω есть известная симметричная положительно определенная матрица, то можно найти невырожденную матрицу P размераN × N такую, чтоΩ = P · PT .(6.14)Отметим, что матрица P определяется не единственнымобразом. ПоложимY∗ = P −1 Y , X∗ = P −1 X , ε∗ = P −1 ε .96(6.15)Для новых переменных мы имеем модельY∗ = X∗ θ + ε∗и(6.16)Σε∗ = M (ε∗ εT∗ ) = M (P −1 εεT (P T )−1 ) == P −1 σ 2 Ω(P T )−1 = σ 2 P −1 P P T (P T )−1 = σ 2 · E .Таким образом, мы вновь имеем классическую линейнуюмодель. Применяя к ней обычный МНК, т.














