1625915153-62da7fb2e48a28563c377c8e71d63db2 (843881), страница 13
Текст из файла (страница 13)
Доказать от противного обратное утверждение: точки минимума в (∗) удовлетворяет тождеству ортопроекции.Введем пространство L2 (Ω, P) – множество всех случайных величин, заданных напространстве элементарных исходов и имеющих конечный второй момент (мы не различаем в этом пространстве случайные величины ξ и ξ 0 , если P(ξ = ξ 0 ) = 1. Все такиеслучайные величины «стягиваются» в одну точку, т.
е. мы тем самым вводим классы эквивалентности или, как говорят, строим фактор-пространствоL2 (Ω, P) = {ξ : Eξ 2 < ∞}.В этом пространстве введем скалярное произведение (второй смешанный момент):(ξ, η) = Eξη. Очевидно, что скалярное произведение задано корректно. Например, дляпроверки третьего свойства нужно отметить Eξ 2 = 0 тогда и только тогда, когда ξ = 0 (свероятностью 1). Тогда получаем гильбертово пространство с нормой1/2Zpkξk = Eξ 2 = ξ 2 (ω)P(dω) .ΩРассмотрим пару случайных величин ξ ∈ R и η ∈ Rn . Введем замкнутое линейное подпространство в L2 (Ω, P):Z22L(η) = {g(η) : Eg (η) < ∞} = g(x) :g (x)Pη (dx) < ∞ = L2 (Rn , Pη ),64т. е.
L(η) – класс всех детерминированных (неслучайных) борелевских преобразованийвектора η с конечным вторым моментом. Этот класс еще называют пространством, порожденным вектором сопутствующих наблюдений η.Определение. Условное математическое ожидание (УМО) случайной величины ξ при фиксации вектора сопутствующих наблюдений η есть ортопроекция в L2 ≡L2 (Ω, P) случайной величины ξ на замкнутое линейное подпространство L(η):b L(η) = gb(η).E(ξ|η) = ξ|Эту случайную величину еще называют УМО ξ относительно η.З а м е ч а н и е. В классической вероятностной литературе аналогичное условное математическое ожидание вводится для более широкого класса случайных величин, имеющих лишь первый момент. На наш взгляд, это же понятие, определенное для болееузкого класса случайных величин с конечными вторыми моментами (что вполне достаточно для многих приложений, таких как задачи прогноза или построения эффективныхстатистических оценок), выгодно отличается от общепринятой схемы своей нагляднойгеометрической интерпретацией, что позволяет лучше усвоить этот довольно непростойматематический объект.Свойства УМО1.
Линейность. E(c1 ξ1 + c2 ξ2 ) = c1 E(ξ1 |η) + c2 E(ξ2 |η). Напомним, что здесь равенство понимается как равенство в пространстве L2 , т. е. мы не различаем случайные величины, отличные на множестве вероятности ноль. В дальнейшем мы будемпонимать все равенства и неравенства именно так, не снабжая знаки равенствоаббревиатурой «п.н.».В силу определения ортопроекции ∀g ∈ L(g)b g(η)) = 0 = E(ξ − ξ)g(η).b(ξ − ξ,Отсюда мы получаем тождество ортопроекцииbEξg(η)= Eξg(η), ∀g ∈ L(η).Докажем линейность УМО. Мы хотим доказать, чтоbbc1 ξ\1 + c2 ξ2 = c1 ξ1 + c2 ξ2 .Подставляя в тождество ортопроекцииE(c1 E(ξ1 |η) + c2 E(ξ2 |η))g(η) = c1 E(E(ξ1 |η)g(η) + c2 E(E(ξ2 |η)g(η) =[в силу тождества ортопроекции для ξ1 и ξ2 ]= c1 Eξ1 g(η) + c2 Eξ2 g(η) = E(c1 ξ1 + c2 ξ2 )g(η)Следовательно, в силу единственности ортопроекции имеем:bbc1 ξ\1 + c2 ξ2 = c1 ξ1 + c2 ξ2 .652.
Монотонность. Если ξ > 0, то gb(η) = E(ξ|η) > 0 ∀η.Предположим противное: ∃Ω0 ⊂ Ω : P(Ω0 ) 6= 0 и gb(η) < 0 для всех элементарныхисходов из Ω0 . Рассмотрим измеримую ограниченную функцию g0 (η) = I(g(η) <0). Тогда g0 (η) ∈ L2 . Далее используем тождество ортопроекции:E(E(ξ|η))g0 (η) = Eξg0 (η).Тогда если P(Ω0 ) 6= 0, то одновременно выполнены следующие два неравенства:E(E(ξ|η))g0 (η) < 0 и Eξg0 (η) > 0, что невозможно.
Мы получили противоречие.Значит, P(Ω0 ) = 0.Следствие. Если ξ1 > ξ2 , то E(ξ1 |η) > E(ξ2 |η) ∀η. Доказательство напрямуюследует из линейности и монотонности. В частности, отсюда немедленно (сравни сдоказательством аналогичного утверждения для обычных средних) следует неравенство треугольника|E(ξ|η)| 6 E(|ξ||η).3. Пусть f – ограниченная функция. Тогда для любого вектора сопутствующих наблюдений ηE(ξf (η)|η) = f (η)E(ξ|η).Упражнение. Доказать, что это утверждение можно распространить нанеограниченные функции f при условии, что ξf (η) ∈ L2 (использовать срезки случайной величины f (η)).Д ОКАЗАТЕЛЬСТВО . Нам нужно доказать, что\ξf(η) = f (η)E(ξ|η).По тождеству ортопроекцииEf (η)E(ξ|η)g(η) = EE(ξ|η)eg (η) = Eξeg (η) = E(ξf (η))eg (η).Первое равенство справедливо в силу того, что ge(η) = f (η)g(η) ∈ L2 (так как fограничена, а g(η) имеет второй момент, то и f (η)g(η) имеет второй момент).4.
Формула полной вероятности для УМО:EE(ξ|η) = Eξ.Эта формула прямо получается из тождества ортопроекции при g(η) = 1.5. Если случайные величины ξ и η независимы, то E(ξ|η) = Eξ.В самом деле,E(Eξ)g(η) = EξEg(η) = Eξg(η).Последнее равенство имеет место в силу независимости. Значит, тождество ортопроекции для правой части предполагаемого выше равенства выполнено.Следующее свойство обобщает предыдущее.666. Пусть случайные величины ξ и η – независимы, f (x, y) – измеримая функция,для которой Ef 2 (ξ, η) < ∞. ТогдаE(f (ξ, η)|η) = Ef (ξ, y)|y=η .Приведенное равенство указывает нам правило вычисления E(f (ξ, η)|η) в случаенезависимых компонент.Д ОКАЗАТЕЛЬСТВО .
Пусть ϕ(y) = Ef (ξ, y). ТогдаZ ZZEϕ(η)g(η) =f (x, y)Pξ (dx) ḡ(y)Pη (dy) =ϕ(y)g(y)Pη (dy) =Z Z=f (x, y)g(y)Pξ (dx)Pη (dy) = Ef (ξ, η)g(η).RRRRТак как|f (x, y)|2 Pξ (dx)Pη (dy) < ∞ то|f (x, y)|Pξ (dx)Pη (dy) < ∞. Следовательно, можно применить теорему Фубини и переставить интегралы (третье равенство).7. Определим условную функцию распределения случайной величины ξ при фиксации сопутствующего наблюдения η по формуле Fξ (t|η) = E(I(ξ < t)|η).Введенная функция по t обладает всеми свойствами обычных функций распределения (но все соотношения выполняются с вероятностью 1). Скажем, монотонность сразу следует из свойства (2) УМО.
Покажем, что и пределы этих функцийна бесконечности положительного или отрицательного знаков будут соответственно 1 либо 0. В самом деле, в силу монотонности существует измеримый пределg + (η) = limt→∞ Fξ (t|η) 6 1. Если допустить, что событие Ωε = {g + (η) < 1 − ε}будет иметь ненулевую вероятность для некоторого положительного ε, то в силутождества ортопроекции и теоремы Лебега о мажорируемой сходимости мы получаем равенство EFξ (t|η)I(Ωε ) = EI(ξ < t)I(Ωε ) → P(Ωε ) при t → ∞. В то жевремя, левая часть этого тождества не превосходит величину (1 − ε)P(Ωε ). Получили противоречие, которое явилось следствием предположения, что P(Ωε ) > 0.Совершенно аналогично доказываются равенство нулю предела условной функции распределения при t → −∞.Упражнение. Доказать, что любая условная функция распределения с вероятностью 1 непрерывна слева.Упражнение.
Доказать, чтоZE(ξ|η) =xdFξ (x|η),Rгде интеграл понимается в смысле Римана–Стилтьеса.678. Пусть (ξ, η) – случайный вектор с плотностью совместного распределениякоординат pξ,η (x, y) (где ξ – скаляр). Тогда верна формула БайесаZpξ,η (x, y)dx,E(ξ|η) = xpη (η)Rpξ,η (x, y)– это апостериорная плотность ξ при фиксации η.pη (η)Д ОКАЗАТЕЛЬСТВО . ОбозначимZpξ,η (x, y)dx.ϕ(η) = xpη (η)гдеRДокажем, что ϕ(η) = gb(η). Вновь проверим тождество ортопроекции:ZZ Zpξ,η(x,y)Eϕ(η)g(η) = ϕ(y)g(y)Pη (dy) =xdx g(y)Pη (dy) =pη (y)Z[так как интегрируем на носителе η, то pη (y) = pξ,η (x, y)dx 6= 0]RZ Z=pξ,η(x,y)xdx g(y)pη (y)dy =pη (y)[по теореме Фубини]ZZ=xg(y)pξ,η (x, y)dxdy = Eξg(η).bИз теоремы единственности вновь следует, что ϕ(η) = ξ.9. Пусть даны произвольная случайная величина ξ ∈ L2 и дискретная случайная величина η с атомами {ai } и соответствующими массами {pi }.
Тогда(E(ξ|η = ai ) с вероятностью pi ,E(ξ|η) =i = 1, 2, . . . , (pi 6= 0).Д ОКАЗАТЕЛЬСТВО . Напомним, что классическое условное среднее определяетсяпо формулеEξI(B)E(ξ|B) =,P(B)где B – событие ненулевой вероятности. Нам надо доказать, чтоXb L(η) .E(ξ|η) =E(ξ|η = ai )I(η = ai ) = ξ|i>168По тождеству ортопроекции имеемEg(η)XE(ξ|η = ai )(η = ai ) =i>1XE(ξ|η = ai )Eg(η)I(η = ai ) =i>1X E(ξI(η = ai )X E(ξI(η = ai )Eg(η)I(η = ai ) =g(ai )pi=pipii>1i>1XX=E(ξI(η = ai ))g(ai ) = Eξg(ai )I(η = ai ) = Eξg(η),i>1i>1так какPдискретная случайная величина g(η), очевидно, задается по формулеg(η) = i>1 g(ai )I(η = ai ).Задачи прогноза случайных последовательностей.Пусть имеется последовательность случайных величин ξ1 , ξ2 , .
. . , ξn , . . ., которые могут быть зависимыми. Индекс интерпретируем как момент времени, считая «n» за настоящее время, то есть последовательность ξ1 , ξ2 , . . . , ξn описывает всю предысториювплоть до настоящего времени.