А.Н. Ширяев - Вероятность-1 (1115330), страница 77
Текст из файла (страница 77)
$8. «МЕТОЙ ОЙНОГО ВЕРОЯТНОСТНОГО ПРОСТРАНСТВА» 487 Теорема 2. 1. Пусть (Е, У, р) и (Е', в", р') — сепарабельные метрические пространства, Х„-+Х. Пусть отображение Ь = Ь(х), х е Е, Р(ип Х(ы) нагл) =О. (6) ! 1»ь)~.и»-1»и|чн)/~. о Е е (8) 15 — 9727 Тогда Ь(Х„)- Ь(Х). 2. Пусть Р, Р„, и > 1, — вероятностные распределения на сепарабельном метрическом пространстве (Е, У, р) такие, что Р- Р и й =Ь(х) — измеримое отображение (Е, У, р) в сепарабельное метрическое пространство (Е', Ф', р'). Пусть Р(х 1 "х Е Ьь) =О.
Тогда Р, "— Р", где Р„"(А) = Р„(п(х) е А), Р" (А) = Р(й(х) е А), А е в '. Доказательство. Как и в теореме 1, достаточно доказать справедливость лишь, скажем, первого утверждения. Пусть Х* и Х„', и > 1, — случайные элементы, построенные «методом «У «У одного вероятностного пространства», такие, что Х' =Х, Х„' =Х„, и > 1, н Х„* — ''+ Х*. Пусть А'=(ы': р(Х„', Х') ~ О), В'=(ы': Х*(ы*)е25„). Тогда Р"(А*15В') =О и для ы* рА' С1В* Ь(Х„'(«7*)) — ~ й(Х'(ю")), а это означает, что й(Х„') — ' — '+Ь(Х').
Как уже отмечалось в п. 1, отсюда следует, что й(Х„') — й(Х*). Но й(Х„') =п(Х„), й(Х*) = й(Х). Поэтому й(Х„) -+ Ь(Х). С) 4. В $ 7 при доказательстве импликации (с) теоремы ! было использовано утверждение (13). Приведем сейчас его доказательство, снова обращаясь к «методу одного вероятностного пространства». Пусть (Е, Ю, р) — сепарабельное метрическое пространство и У вЂ” класс равностепенно непрерывных функций у= д(х) таких, что (у(х)(<С для всех х е Е, д ~ У и некоторой константы С. Теорема 3. Пусть Р, Р„, и > 1, — вероятностные меры на (Е, Ю, р) такие, что Р„- Р.
Тогда *.р !1«)~'.ич — 1«>~<а)/-о. - . п1 ЕЕУ ~е е Доказательство. Пусть (7) не имеет места. Тогда существуют а > О "функции д1, дз„... из У такие, что 458 ГЛ. Ш, СХОДИМОСТЬ ВЕРОЯТНОСТНЫХ МЕР длл бесконечно многих а. Переходя «методом одного вероятностного пространства» к случайным элементам Х" и Х„(см. теорему 1), перепишем (8) в виде )Е*д„(Х„*) — Е*д„(Х') ! > а > 0 (9) для бесконечно многих и. Но в силу свойств класса У для всякого е > 0 найдется такое б > О, что )д(у) — д(х)! < е для всех д Е У, если р(х, у) <б, Кроме того, !у(х)! <С для всех хЕЕ и дЕУ.
Поэтому (Е*у»(Х;) — Е*у»(Х*)((~ Е'((фп(Х,*) — у»(Х')!; р(Х;, Х') > б)+ + Е" ((у» (Х„*) — д»(Х') (; р(Х„', Х') < б) < 2СР*(р(Х„', Х*) > б) + е. Поскольку Х;, --' — ' Х*, то Р'(р(Х,"„Х*) >б)- О, н — оо. Следовательно, в силу произвольности е> 0 )нп (Е'д„(Х„') — Е*д„(Х")(=О, что противоречит (9). П 5. В этом пункте идеи «метода одного вероятностною пространства», использованные в теореме 1, будут применены к оцениванию сверху значения метрики Леви †Прохоро ЦР, Р) между двумя распределениями вероятностей на сепарабельном метрическом пространстве (Е, Ю, р). Теорема 4. Для каждой пары мер Р, Р можно найти вероятностное пространство (й', зг', Р*) и случайные элементы Х и Х на нем со значениями в Е такие, что распределения Х и Х совпадают с Р и Р соответственно и ЦР, Р) <др.(Х, Х)=!п((е>0: Р'(р(Х, Х) >е) <е). (10) Доказательство.
Согласно теореме 1, действительно можно найти вероятностное пространство (й',,У*, Р') и случайные элементы Х и Х такие, что Р*(ХЕА)=Р(А), Р'(ХеА)=Р(А), А еег. Пусть е>0 таково, что Р'(р(Х, Х) > е) < е. Тогда для всякого А е Ю Р(А) =Р'(Х ЕА)=Р*(Х ЕА, ХЕА«)+Р'(ХЕА, ХфА')( < Р*(Х Е А «) + Р '(р(Х, Х) > е) < Р(А') + е, 48. «МЕТОД ОДНОГО ВЕРОЯТНОСТНОГО ПРОСТРАНСТВА» 459 где А' = (х Е Е: р(х, А) < е). Поэтому по определению метрики Леви — Прохорова (п. 2 $7) 3 (Р, Р)<е. (12) Нз (! 1) и (12), переходя к !п( по е>0, получаем требуемое Утверждение (10).
П Следствие. Пусть Х и Х вЂ” случайные элементы, заданные на вероятностном пространстве (й, »«, Р) и принимающие значения в Е, Пусть Рх и Р» — их распределения вероятностей. Тогда Е(Рх, Р») < !»Р(Х, Х). Замечание 1. Проведенное доказательство показывает, что на самом деле (10) справедливо всякий раз, когда на каком-либо вероятностном пространстве (й', Я'", Р*) можно указать случайные элементы Х и Х со значениями в Е, распределения которых совпадают с Р и Р и для которых множество (ы*: р(Х(ы*), Х(ш*)) > г) Е Я*, е > О. Тем самым качество оценки (10) существенным образом зависит от тою, насколько удачно по мерам Р и Р построены объекты (й, Я', Р') и Х, Х.
(Процедуру построения й*, Р', Р' и Х, Х по Р и Р называют каплингом — от англ. соир(!пд — соединение, сцепление.) Можно, например, взять «каплингмеру» Р' равной прямому произведению мер Р и Р, но такой выбор не приводит, как правило, к хорошей оценке (!0). Замечание 2. Естественно поставить вопрос о том, когда в (10) имеет место знак равенства. На этот счет приведем без доказательства следующий результат: пусть Р и Р— две вероятностные меры на сеаарабельном метрическом пространстве (Е, ь', р); тогда существуют такие (й*, я ', Р*) и Х, л, что ЦР, г ) = ар (Х, Х) = 1п((г > 0: Р» (р(Х, Х) > е) < г), 6.
Задачи. !. Показать, что в случае сепарабельных метрических пространств действительная функция р(Х(ы), У(ь!)) является случайной величиной для любых случайных элементов Х(ы) и У(ы), определенных на некотором вероятностном пространстве (й, Я, Р). 2. Доказать, что функция др(Х, У), определенная в (2), является метрикой в пространстве случайных элементов со значениями в Е.
3. Доказать справедливость (5). 4. Показать, что множество Ьь = (х Е Е: Ь(х) не р-непрерывна в точке х) Е в. !5 ГЛ. Ш. СХОДИМОСТЬ ВЕРОЯТНОСТНЫХ МЕР ф 9. Расстояние по вариации между вероятностными мерами. Расстояние Какутани — Хеллингера и интегралы Хеллингера. Применение к абсолютной непрерывности и сингулярности мер 1. Пусть (й, У') — измеримое пространство и Я =(Р) — семейство вероятностных мер на нем. Определение 1. Расстоянием ло вариации между мерами Р и Р из о" (обозначение: ))Р— Р11) называется полная вариация меры (со знаком) Р— Р, т.
е. величина мг-~) р!!Ф )юР-~>/, (О где зир берется по классу всех лг-измеримых функций рйи), удовлетворяющих условию ((е(и )( < 1. Лемма 1. Расстояние ло вариации !(Р— Р)) =2 зир (Р(А) — Р(А)!. (2) АЕУ Доказательство. Поскольку для всякого А е Я Р(А) — Р(А) = Р(А) — Р(А), то 2)Р(А) — Р(А)) = 1Р(А) — Р(А)!+ )Р(А) — Р(А)! < ()Р— Р1!, где последнее неравенство следует из (1). Для доказательства обратного неравентсва обратимся к разложению Хана (см., например, [33, $5 гл.
ЧЦ или (70, с. 121]) мерм со знаком раз Р— Р. Согласно этому разложению, мера р представима в виде р= =р+ — р, где неотрицательные меры р+ и р (верхняя и нижняя вариации меры р) имеют вид р+(А) = ) с(р,,и (А) = — ) г(р, А еЯ, Аом АЛМ где М вЂ” некоторое множество из Я.
При этом Чагр=Чагр++Уагр =и+(П)+,и (0). Поскольку р,(П) =Р(М)-Р(М), р (П) =Р(М)-Р(М), то !!Р— Р!! =(Р(М) — Р(М))+(Р(М) — Р(М)) <2 знр )Р(А) — )э(А)1 С) А Е.Р $9. РАССТОЯНИЕ ПО ВАРИАЦИИ 46! Определение 2. Последовательность вероятностных мер (Р„)„>~ называется сходящейся по вариации к мере Р (обозначенне: Р„- — ' Р), если [!,Є— Р]] - О, л — оо. Из этого определения н теоремы 1 $ ! нетрудно видеть, что сходнмость по вариации вероятностных мер, заданных на метрическом пространстве (й,.йг, р), влечет нх слабую сходнмость.
Близость распределений ло вариации является, пожалуй, наиболее сильной формой близости вероятностных распределений, поскольку если два распределения близки по вариации, то практически в конкретных ситуациях нх можно считать неразличимыми. В этой связи может создаться впечатление, что исследование расстояния по вариации не представляет большого вероятностного интереса.
Однако, например, втеореме Пуассона (ф 6 гл. 1) сходнмость бнномнального распределения к пуассоновскому имеет место в смысле сходнмостн к нулю расстояния по вариации. (Ниже, в $12, будет дана оценка сверху для этого расстояния.) Приведем также пример нз области математической статистики, где необходимость нахождения расстояния по вариации между мерами Р н Р возникает естественным образом в связи с задачей различения по результатам наблюдений двух статистических гипотез Н (нстннное распределение есть Р) н Й (нстннное распределение есть Р) относительно того, какая из вероятностных моделей (П, се, Р) нлн (й,,йг, Р) более соответствует «статнстнке» результатов наблюдений. Если ш е Й трактовать как результат наблюдения, то под тестом (для различения гипотез Н и Й) понимают любую м -измеримую функцию у = р(ш) со значениями в [О, 1], статистический смысл которой состоит в том, что !с(ш) есть «вероятность, с которой принимается гипотеза Й, когда результат наблюдения есть ш».
Будем качество различения гипотез Н н Й характеризовать вероятностями ошибок первого и второго рода: а(у) = Еу(ш) (»» «вероятность принять Й, если верна Н»), )у(Р)=с(1 — р(ш)) (= «вероятность принять Н, если верна Й»), где Е н Š— усреднения по мерам Р н Р.
В том случае, когда гипотезы Н н Й Равноправны, оптимальным естественно считать тест !ь* =~р*(ш) (еслн таковой сушествует), который минимизирует сумму ошибок а(Р)+)у(!ь). Положим й'г(Р, Й) = !п1 [а(!с) +)3(<р)]. (4) ГЛ. !и. СХОДИМОСТЬ ВЕРОЯТНОСТНЫХ МЕР Пусть !',)=-(Р+Р) и г= —, г= —. Тогда 1 дР йр 2 сй;>' д0' яг(Р, Р) = !п! [Е!с+ Е(1 - у) ! = !и! ЕО [г!ь+ г(1 — !с) [ = 1 + !я! Ео [р(г — 2) ! (здесь и далее Ео — математическое ожидание по мере !'!). Нетрудно видеть, что !п1 достигается на функции ф (ш) =/(г <г), и поскольку Ео(г-г) =О, то Вг(Р, Р)=1 — -ЕО[г-2[=1 — -[[Р— Р[! ! 1 2 2 (5) где последнее равенство следует из приводимой ниже леммы 2.
Таким образом, из (6) ясно, что качество различения гипотез, характеризуемое функцией Лгг(Р, Р), зависит от степени близости мер Р и Р именно в смысле расстояния по вариации. Лемма 2. Пусть !е — некоторая о-конечная мера такая, что дР дР Р«Ге, Р«() из= —,2= — — производные Радона — Никодима мер Щ' д!> Р и Р относительно !е. Тогда (6) [[Р— Р[[ = Ео[г — г! 1 и если !Е = -(Р+ Р), то 2 [[Р— Р[! = ЕО [г — 2! = 2ЕО[1 — г[ = 2ЕО [1 — г!. (7) доказательство. Для всех я-измеримых функций гр=яш) таких, что [ф(ш)! < 1, по определению г и г находим [Е4 — Ет)! =[ЕОф(г — 2)! < ЕО~чД [г — 2! < ЕО[г — г!.