А.Н. Ширяев - Вероятность-1 (1115330), страница 81
Текст из файла (страница 81)
имеет место сходимость по Р-вероятности. Из теорем ! и 2 $ 3 главы !'1Г следует также, что для каждого х е р имеет место и сходимость с вероятностью единица: при Д1- со Гн(х; ы)- Г(х) (Р-п.н.). (3) Весьма замечательно, что имеет место и более сильный результат о том, что сходимость в (3) равномерна по х. Теорема 1 (Глнвенко и Кантелли). В сформулированных условиях (случайные) величины 0н(ы) = зпр [Гн(х; ы) — Г(х)[ сея сходятся к нулю с вероятностью единица: Р(!пп Рн(ы) = О) = !.
Доказательство. Пусть 9 — множество рациональных чисел на к. Понятно, что зпр [Гн(г; ы) — Г(г)] гео есть случайная величина. И поскольку Он(ы) = зир [Гн(х; ы) — Г(х) [ = зир [Гн(г; ы) — Г(г)], кея гео то статистика 0н(ы) также есть случайная величина и, следовательно, можно говорить о ее распределении. Пусть целое М > 2 и й = 1, 2, ..., М вЂ” !. Определим последовательность чисел хм ь = гшп(х е Д: й/М < Г(х)), полагая также хм,ь = — оо, хм,м =+со. Пусть интервал [хмы хмл+!) фа! и х принадлежит этому интервалу. Тогда очевидным образом Гч(х; ь!) — Г(х) < Гя(хм ь+! — О) — Г(хмь) = = [Гн (хм ь+! — О) — Г(хмл+! — О)]+ [Г(хм ь+! — О) — Г(хмл)] < <Г„(х.,+, О)-Г(хмл„'-О)+!! «13 ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 483 Аналогично, снова предполагая, что х е [хмл, хм »+1), находим, что Ен (х; ш) — Е(х) > Ен (хмл, 'ш) — Е(хмл) — 1/М. Тем самым, лля каждого х Е )г [Ен(х; ы) — Е(х)[ < < 1пах ([Ен(хмл', ы) — Е(хмл)[, [Ен(хи1 — О; ы) — Е(хм1 — О)[)+1/М 1К«ИМ-1 1<(<М-1 и, значит, Р-п.
н. 1нп зцр [Ен(х; «1) — Е(х) [ < 1/М. » со Отсюда в силу произвольности М получаем требуемое утверждение (5). О Теорема Гливенко и Кантелли, являющаяся одной из фундаментальных теорем математической статистики, утверждает, как уже отмечалось, принципиальную возможность проверки на основании наблюдений над (независимыми одинаково распределенными) величинами С1, Сз, ... того, что функцией распределения этих величин является именно функция Е =Е(х). Иначе говоря, эта теорема гарантирует возможность установления согласия «теории и эксперимента».
3. Несмотря на отмеченную принципиальную важность этой теоремы, она не отвечает на вопрос о скорости сходимости величины отклонения 0н(ы) к нулю при А! - оо и, тем самым, не позволяет судить о спгепени правдоподобности того, что результаты наблюдений «идут» от (независимых) случайных величин, имеющих своей гипотетической функцией распределения функцию Е=Е(х), х е Я.
Из центральной предельной теоремы следует, что для каждого фиксированного х Е)т ,/А!(Ен(х; ы) — Е(х)) —" — .+(О, Е(х) [1- Е(х)]), (6) что означает сходимость распределений величин т/РЕн(х; «1) — Е(х)) к нормальному распределению с нулевым средним и дисперсией Е(х)(1 — Е(х)). Более интересно, конечно, получить предельное распределение для (Равномерной) статистики Он(ш) =вцр [Ен(х; ы) — Е(х)[ к или, скажем, родственной статистики Он+(ы) =зцр(Ен(х; «1) -Е(х)). (7) к ГЛ. Ш. СХОДИМОСТЬ ВЕРОЯТНОСТНЫХ МЕР Следуюшее наблюдение (А. Н.
Колмогоров) является ключевым при отыскании предельных распределений для этих статистик. Лемма 1. Пусть !Р— класс непрерывных функций распределения Г = Г(х). Для каждого Д() ! распределение вероятностей статистик ()н(ь«) одно и то же для всех Г е !Р. Аналогичное справедливо и для статистики Вн+(ь«). Доказательство. Пусть Пь «Гг, ...
— последовательность независи мых одинаково распределенных случайных величин, имеюших равномерное (((=У(х)) распределение на [О, ![: Р(п! <х)=х, 0<х<1. Утверждение леммы будет следовать из того, что, как оказывается, для каждой непрерывной функции Г=Г(х) распределение статистики знр [Гн(х; ы) — Г(х)[ совпадает с распределением зир [Ун(х; и«) — (I(х)[, « « где функция есть эмпирическая функция распределения величин пь ..., г)н. Обозначим через А множество интервалов г'=[а, в], — со<а<в <со, постоянства функции распределения Г = Г(х), т.
е. пусть Р(4! Е 1) = О. Тогда Пн(ы) =зир [Гн(х; ы) — Г(х)[=зир [Гн(х; ь«) — Г(х)[. «ея «еА Вводя величины г!ь =Г(сь) и эмпирические функции распределения Ун(х; ь«) = — ~ Щ(ы) < х), ! находим, что для х е А и и («н(Г(х); ы) = — ~ l(Г(сь(ш)) < Г(х)) = —. ~~~ !(Ел(ь«) < х) = Гу(х; ь«), ! Ф=! э=1 поскольку для таких х (ип сл(ь«) < х) =(ик Г(сь(и«)) < Г(х)). Таким образом, Пн(ы)=зир [Г~(х; ю) — Г(х)[=эир [(I~(Г(х); ы) — Г(х)[= «еА «еА =зир ~Ин(Г(х) ь«) — Г(х)[= эир [У~(у;ы)-у[: — "'"' зир [(«н(у;ы)-у[, «ея дейки уе!Ол! 4!3. ФУНДАМЕНТАЛЬНЫЕ ТЕОРЕМЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 485 Р кн. где последнее равенство ( ='') следует из того, что Р(б, =О)=Р(б, = Ц=О.
(8) Покажем теперь, что случайные величины й» имеют равномерное (на [О, 1]) распределение. С этой целью обозначим (для у е (О, 1)) х(у) =1п((х е гг; г(х) ~ эу), Тогда находим, что г(х(у)) = у, у Е (О, 1), и р[й <И=РК(с ) <И=РК(с ) <Г(х(у)Н=Р(с <х(уи=~(хЬ)) =у. Вместе с (8) это доказывает, что случайная величина гл (а значит, и каждая нз величин 41з, г)з, ...) имеет равномерное распределение на [О, 1]. П 4.
Установленная лемма показывает, что для отыскания предельного при А/ - оо распределения статистик Рн и Р+ (в классе Р непрерывных функций распределения г"=г(х) для наблюдений Сь Сз, ...) достаточно сразу предположить, что (н Сз, ... — это последовательность независимых одинаково распределенных случайных величин с равномерным распеределением на [О, 1]. Зафиксируем некоторое М > 1 и упорядочим (для каждого ш Ей) величины 4Ь Сз, ..., Сн в порядке их возрастания, обозначая эти новые величины (порядковые статистики) через ~~~~, сз~~, ..., сй~, где (~ гп1п((~ 6 ". Ь) " (н 1 гпах(4~ 4я ° 4н). (Вероятность совпадения двух таких упорядоченных величин равна нулю.) Полагая и,(р; ) С; ((Е,()<у) 1 (9) »»и имеем (10) Рн(ш) =шах [Ун(у; ы) -у[. уел Нетрудно видеть, что максимальное значение правой части может достигаться лишь в точках скачков функции распределения Рн(у; ы), т.
е. в точках С1н1, 4з1н1 С1»О. Тем самым, Рн(ш) =шах[ — -с» 1»О1 »Кн [АГ Отсюда следует, что для отыскания распределения статистики Рн(ы) надо знать совместное распределение порядковых статистик 4~~~, се~~,..., сй ГЛ. П). СХОДИМОСТЬ ВЕРОЯТНОСТНЫХ МЕР С целью отыскания этого распределения рассмотрим последовательность г,), г',м ... независимых экспоненцнально распределенных (Р(г,"» >х) = =е ') случайных величин, и пусть 5„=~1+Ьэ+...+~„, п>1. Лемма 2.
Совместное распределение вектора (~)~, сэ, ..., сн ) совпадает с совместным распределением вектора Доказательство. С одной стороны, для 0 <у) «... Уч < 1 Р(»«] Еа)у) ..., »«й Едун)=~~~ Р((» Еду) ... (» Едун), (12) где суммирование производится по всем перестановкам (/г), ..., Йн) чисел (1..... й)). (В (!2) н также в дальнейшем используется несколько вольная «днфференцнальная» форма записи, которой нетрудно придать точный смысл.) В правой части (12) величины с»„..., с», независимы, равномерно распределены на [О, 1]. Число перестановок чисел (1, ..., йГ) равно )ч'1, поэтому правая часть в (12) равна ))11ду) ...дун.
Следовательно, если (уы ..., У,) Е Ьн, где Ьн = (у) Е [О, 1], ..., Ун Е [О, 1]: 0 < у) «... Ун < < Ц, то Р((С)н) Е)(у), ..., (~~) Е с(ун) = Ф! с!У)...с(ун. (!3) Если же (уы ., у«) Ф ~в. То (14) Рф ) е г(у), ..., (н е дун) =О. Покажем теперь, что, с другой стороны, точно так же Р~ — Еду,, ..., — Едун)= 5н 5н+) 5нч.) п))ау)" ауи (Уы ",Ун)Ес»и О, (Ун ", Ун) ФАч. С этой целью рассмотрим совместное распределение случайных величин 5), ..., 5н+1. Если (х), ..., хм+1) е с»н+1, то находим, что Р(5) Едх), 5э Едхэ, ..., 5и+) Едкие))= =Р(~) е ах), г,з Е ах» — х)..., гн+1 Е ахне) — хн) = ««е-ме-(м-м) е-1»и+~ -ки) дх) с(хн+) — е-»и+)ах) с!хн+) (!о) 4!3.
Фундлментдльные теОРемы мАтемАтической стАтистики 4зт Если же (хн ..., хм+1) ф4)а+ь то Р(5, Едхь 5зЕдхз, .", 5а+~ Едха+,)=О. (! 7) Поскольку 5а+~ =~~+ ... +~а+О где ~н ..., ~а+~ — независимые экспоненциально распределенные случайные величины, то (задача 3) кане хоы Р(5а+1 Е дХа.Ь~) = ~'о~ Г(Ха+о Из (16) н (18) находим, что для (хь ..., ха+1) ЕЛа+~ Р(5, Еа~хн ..., 5а Ег(ха [5а+~ Едха4д=М!ха™, дх~ ...уха.
(19) Если же (хн ..., ха+1) К Ьа+н то левая часть в (19) равна нулю. В результате видим, что (18) / 51 5а Р~ — Е4(Ун " — а ЕдУа [5а+~ =ха+~) = ~5а+~ ' '"' 5а+! ТУ!ду,...дуа, (у,, ..., Уа)ЕОа, О, (У| " Уа)ясьа 4ИОа(ы) = т% шах е ]54 А зка 5а+~ (20) где равенство = означает совпадение ао распределению величин в левой н правой частях. Из (20) е А! 154 — А й 5м+1 — А! уЖ0а(ы) = — гпах~ — —— (21) 5а+~ ела[ ~/М А! ~ГМ Это соотношение весьма удобно для исследования предельного поведения величин т7%0а(ы) прн АГ- оо.
У Поскольку — — 1 (Р-п. н.), то, полагая для ! Е [О, 1] 5а+~ Х!а! 5! ! — [Лч] ,/У находим, что Ощ р(,/Я7)а(ы) <у)оо 1!гп Р( зир [Х, — ГХ1 [~У) М оо а оо ~аякс~ н в силу независимости правой части от ха+1 приходим к справедливости представления (15), сопоставление которого с (13), (14) доказывает утверждение леммы. П Из этой леммы вытекает, что ГЛ.
и!. СХОЛИМОСТЬ ВЕРОЯТНОСТНЫХ МЕР Тем самым, вопрос о предельном распределении величин ~(М0н(и0 сводится к изучению предельного поведения (по распределению) величин зир ]Х!»О — !ХРО] при й!-«со. о«к1 При каждом фиксированном 1 Е [О, 1] предельное распределение величин Х~~ в соответствии с центральной предельной теоремой (теорема 1 в 3 4) совпадает с распределением величины Вн являющейся гауссовской с ЕВ~ — — 0 и ЕВ~з= !. На самом же деле можно угверждать больше. Именно, рассмотрим введенный в $13 главы П процесс броуновского движения (винеровский процесс) В = (В~)як~< ~.
Такой процесс был там определен как гауссовский процесс с Во = О, ЕВ~ — — 0 и ковариационной функцией ЕВ,В~ = пнп(з, !). Так вот, оказывается, что в соответствии с замечанием 3 к теореме 1 в $8 гл. т'П совместное распределение Р1~! величин (Х~!"О, ..., Х~лз) слабо сходится к совместному распределению Р, н величин (В,„..., Вь). (О слабой сходимости см. 33 1, 2.) Поэтому естественно ожидать, что распределение и величин зцр [Х]~ — 1ХРВ] сходится к распределению акга~ величины зцр ]В~ — !В~].