Хохлов Ю.С. - ПМСА для эконома (1185346), страница 14
Текст из файла (страница 14)
По заданному уровню доверия γ по таблицам распределения Стьюдента находим такую константуt(γ) > 0, чтобыP (|T | < t(γ)) = γ .(8.6)Окончательно для aN +1 получаем следующий доверительный интервал:qâN +1 − t(γ) · S ·XN +1 (X T X)−1 XNT +1 < aN +1 <qâN +1 + t(γ) · S ·8.3XN +1 (X T X)−1 XNT +1 .(8.7)Оценка значения прогнозируемой величиныВ этом случае нам нужно оценить не aN +1 = M (YN +1 ), асамо будущее значение YN +1 = aN +1 + εN +1 . В качествеоценки предлагается вновь взять ŶN +1 = âN +1 = XN +1 · θ̂.Но теперь мы оцениваем не aN +1 , а YN +1 .
Поэтому нас115интересует разностьŶN +1 − YN +1 = xN +1 · θ̂ − aN +1 − εN +1 .(8.8)Отметим, что ŶN +1 − YN +1 имеет среднее, равное нулю,(аналог несмещенности) и ŶN +1 есть линейная по Y оценка.Теорема 2 . В классе всех линейных и несмещенных оценок Ỹ для величины YN +1 оценка ŶN +1 , построенная поформуле (3), является оптимальной, т.е.M (ŶN +1 − YN +1 )2 ≤ M (ỸN +1 − YN +1 )2 .(8.9)Для построения доверительного интервала нужно дословно повторить все рассуждения, приведенные в пункте 2, но для разности ŶN +1 − YN +1 вместо âN +1 − aN +1 .Едиственное различие состоит в том, что D(ŶN +1 −YN +1 ) =σ 2 · (XN +1 · (X T X)−1 · XNT +1 + 1) за счет слагаемого −εN +1 .Таким образом, доверительный интервал для YN +1 имеетвид:qŶN +1 − t(γ) · S ·XN +1 (X T X)−1 XNT +1 + 1 < YN +1 <ŶN +1 + t(γ) · S ·qXN +1 (X T X)−1 XNT +1 + 1 (.
8.10)Мы рассмотрели только простейшую ситуацию классической линейной модели. В реальных задачах нужно учитывать то, что факторы могут быть стохастическими, атакже присутствие гетероскедастичности и автокорреляции ошибок.116Дополнение A.Гильбертовопространствослучайных величинВ этом разделе мы выделим некоторое подмножество случайных величин и покажем как в нем можно ввести геометрическую структуру. Далее мы решим важную с точкизрения приложений задачу о наилучшей линейной оценке.Задача о наилучшем линейном приближении в конечномерном пространствеДля лучшего понимания задач, рассматриваемых в этомразделе, мы начнем с задачи о наилучшем линейном приближении в конечномерном пространстве.Пусть мы имеем конечномерное линейное пространствоRN . Мы предполагаем, что в этом пространстве выделеннекоторый базис и любой элемент x ∈ RN можно записатьв виде x = (x1 , .
. . , xN )T . Далее, в этом пространстве задается обычным образом скалярное произведение, т.е. любымдвум элементам x, y ∈ RN приписывается число (x, y) по117правилу:(x, y) :=NXxj · y j .j=1Это позволяет нам определить длину элемента x ∈ RN :qkxk :=vuNuXu(x, x) = t x2j ,j=1и расстояние между элементами x, y ∈ RN :ρ(x, y) := kx − yk .Таким образом, RN становится метрическим пространством, в котором можно определить понятие сходимости,открытые и замкнутые множества и т.п. Кроме того, определяется важное для нас понятие ортогональности.
А именно, два элемента x, y ∈ RN будем называть ортогональными, если (x, y) = 0.Пусть теперь в RN выделено некоторое замкнутое подмножество L и некоторый элемент y ∈ RN . Будем говорить, что элемент ŷ ∈ RN является наилучшим приближением элемента y во множестве L, если:1) ŷ ∈ L,2) ky − ŷk ≤ ky − xk для любого x ∈ L.В силу замкнутости L такое наилучшее приближениесуществует.Наиболее интересным для нас является случай, когдаL есть линейное подпространство в RN . В этой ситуациисправедлива следующая важнаяЛемма о перпендикуляре. Элемент ŷ является наилучшим приближением элемента y в линейном пространстве L тогда и только тогда, когда1) ŷ ∈ L,1182) (y − ŷ, x) = 0 для любого x ∈ L.Отсюда следует, что ошибка приближения e = y−ŷ естьвектор, ортогональный ко всем элементам пространства L,а само наилучшее приближение ŷ есть проекция вектораy на подпространство L. Эта геометрическая интерпретация поможет нам далее более наглядно представлять себеполученные результаты.Гильбертово простраство случайных величинРасмотрим множество L2 , состоящее из случайных величин ξ таких, что M (|ξ|2 ) < ∞.
Используя неравенствоКоши-Буняковского, нетрудно показать, что L2 это линейное пространство (задача!). Для каждой пары ξ, η ∈ L2определим число(ξ, η) := M (ξ · η) .Будем говорить, что случайные величины ξ и η совпадаютпочти наверное (п.н.), если P (ξ 6= η) = 0. В дальнейшем мы не будем различать такие случайные величины иобъединим их в один класс. Таким образом, мы рассматриваем L2 как совокупность классов эквивалентности.Задача.
Введенный выше функционал обладает следующими свойствами:a) (ξ, ξ) ≥ 0, (ξ, ξ) = 0 ⇔ ξ = 0 п.н.,b) ∀ξ, η ∈ L2 , (ξ, η) = (η, ξ) ,c) ∀ξ1 , ξ2 , η ∈ L2 , c1 , c2 ∈ R1 (c1 ξ1 + c2 ξ2 , η) = c1 (ξ1 , η) +c2 (ξ2 , η) .Функционал, который приписывает каждой паре элементов из линейного пространства некоторое число так,119что выполнены свойства a)-c), называется скалярным произведением. Используя скалярное произведение, можноопределить норму произвольного элемента ξ ∈ L2 :qkξk :=(ξ, ξ) = (M (|ξ|2 ))1/2 .Норма элемента ξ определяет его длину. Будем говорить,что последовательность с.в. {ξn } сходится в среднемквадратическом (с.к.) к с.в.
ξ, еслиkξn − ξk2 = M (|ξn − ξ|2 ) → 0, n → ∞ ...В этом случае мы будем писать ξn → ξ. Можно показать,что пространство L2 полно относительно такой сходимости, т.е. всякая фундаментальная последовательность в L2имеет предел. Линейное пространство, в котором определено скалярное произведение и которое полно относительно порожденной этим скалярным произведением сходимости, называется гильбертовым пространством.
Такимобразом, мы показали, что L2 – гильбертово пространство.Выше мы отмечали, что норма вектора определяет егодлину. Но в геометрии нам необходимо измерять не только длины, но и углы. Используя аналогию с понятием скалярного произведения в планеметрии, определим косинусугла α между элементами ξ, η ∈ L2 по правилуcos α = qM (ξη)M |ξ|2 · M |η|2=(ξ, η).kξk · kηkНазовем ξ и η ортогональными, если (ξ, η) = M (ξη) =0.Замечание.
Пусть M ξ = M η = 0. Тогда имеет местоследующее:1) M (ξη) = cov(ξ, η) = 0, т.е. понятие ортогональностисовпадает с понятием некоррелированности;1202) cos α = ρ(ξ, η), т.е. косинус угла между случайнымивеличинами совпадает с коэффициентом корреляции.Задача о наилучшей линейной оценкеДалее, используя введенные выше понятия, мы решим оченьважную с практической точки зрения задачу.
Пусть L ⊂L2 – некоторое линейное подпространство, которое замкнуто относительно сходимости в среднем квадратическом.Пусть далее η ∈ L2 – произвольный элемент.Определение 1 . Случайная величина η̂ ∈ L2 называется наилучшим приближением с.в. η в пространствеL, если1) η̂ ∈ L ,2) kη − η̂k2 = M |η − η̂|2 ≤ M |η − ξ|2 = kη − ξk2 , ∀ξ ∈ L .Лемма о перпендикуляре. С.в. η̂ является наилучшим приближением с.в. η в линейном пространстве Lтогда и только тогда, когда1) η̂ ∈ L ,2) (η − η̂, ξ) = M [(η − η̂)ξ] = 0, ∀ξ ∈ L .Доказательство.
Пусть выполнено свойство 2 и ξ ∈ L.Тогдаkη − ξk2 = M |η − ξ|2 = M |(η − η̂) + (η̂ − ξ)|2 == M |η − η̂|2 + M |η̂ − ξ|2 + M [(η − η̂)(η̂ − ξ)] == M |η − η̂|2 + M |η̂ − ξ|2 + 0 ≥ M |η − η̂|2 .Здесь мы использовали тот факт, что η̂ − ξ ∈ L.Обратно, пусть мы знаем, что η̂ наилучшее приближение для η в L.
Возьмем произвольные ξ ∈ L и λ ∈ R1 . Всилу оптимальности η̂ получаемM |η − η̂|2 ≤ M |η − η̂ + λξ|2 =121M |η − η̂|2 + 2M [(η − η̂)ξ] · λ + M |ξ|2 · λ2 .Последнее выражение есть полином второго порядка отλ, у которого коэффициент при λ2 положительный и который принимает минимальное значение при λ = 0. Изкурса математического анализа мы знаем, что в этом случае коэффициент при λ, т.е.
M [(η − η̂)ξ] равен нулю. А этои есть условие 2.Дадим геометрическую интерпретацию полученному результату. Свойство 2 означает, что η − η̂ является перпендикуляром к подпространству L (эквивалентно: η̂ –проекция η на L).Иногда с.в. η̂ называют условным математическиможиданием в широком смысле с.в. η относительно подпространства L.Рассмотрим несколько более общую ситуацию.
ПустьL = ξ0 + L0 , где ξ0 ∈ L2 – фиксированный элемент, а L0– замкнутое линейное подпространство в L2 . Если ξ0 6= 0,то L не является линейным пространством и называется гиперплоскостью. Пусть далее η ∈ L2 – некотораяс.в. Определение наилучшего приближения η̂ для с.в. ηв гиперплоскости L дословно повторяет определение 1.Нетрудно доказать следующий результат.Задача.
η̂ является наилучшим приближением для η вгиперплоскости L, если1) η̂ ∈ L ,2) (η − η̂, ξ − η̂) = M [(η − η̂, ξ − η̂)] = 0 , ∀ξ ∈ L .Применим эти результаты к следующей задаче. Пустьξ, η ∈ L2 –две случайные величины. Необходимо найти наилучшее линейное приближение с.в. η с помощью случайнойвеличины ξ. В этом случае L = {c1 + c2 ξ , c1 , c2 ∈ R1 }. Этодвумерное линейное подпространство в L2 , базисом кото122рого являются с.в. ξ1 = 1 п.н. и ξ2 = ξ. Наилучшее приближение должно иметь вид η̂ = ĉ1 +ĉ2 ξ, т.е. мы должны найтиĉ1 и ĉ2 . По лемме о перпендикуляре (η − η̂, θ) = 0, ∀θ ∈ L.В частности,(η − η̂, ξ1 ) = M [(η − η̂) · 1] = M η − ĉ1 − ĉ2 M ξ = 0 ,(η − η̂, ξ2 ) = M [(η − η̂) · ξ] = M (ηξ) − ĉ1 M ξ − ĉ2 M (ξ 2 ) = 0 .Решая эти уравнения относительно ĉ1 и ĉ2 , получим:ĉ2 =cov(ξ, η)ση= ρ(ξ, η) ·,D(ξ)σξĉ1 = M η − ρ(ξ, η) ·ση· Mξ ,σξгде ση2 = D(η), ση2 = D(η).















