М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 42
Текст из файла (страница 42)
я, -и„' о,', в,', ~ в» оь сведем вопрос к следующему общему утверждению. Лемма 2. Пусть последовательности ся.в. У„, 0„, У„, л =1, 2, ..., таковы, что лри всех у, таких, что б(у) ~непрерывна: У(У„<у)-» б(у), л-~ьо, где б(у) — некоторая ф. р., У,-~- 1, У„ -~0, л -»- ьо. ь "т (13) Тогда УЯ„(У„+ У ) су) б(у), л во всех точках непрерывности функции б(у). Доказательство. Пусть е>0 произвольно.
Имеем ()» (У„+ У„< у) < йь (У„< у+ е, Щ < е) + + в»((У„1)е) <У(У„<у+а)+йь(1У„!>а). Переходя здесь к верхнему пределу по л и используя (13), полу. чаем (14) 11щзпрУ(У„+У„<у)<11щзпру»(у„~у+а) б(у+е). (15) Проводя преобразования йь (У„+ У„< у) > У (У„< у — е, 1У„1< е) ~) )~Р(У„<у — е) — У(У„<у — е, !У„(> е) >~ > а»(У„< у — е) — и» () У„! > е), и имеют конечную дисперсию. Если исключить искусственные примеры, то, явно или неявно, сходимость в (12) связана с суммированием независимых нли слабо зависимых сл. в.
Определение 2. Последовательность оценок Топ(х„), л =1, 2, ..., называется агимлтотичгски нормальной, если выполнено соотношение (12); и„(9) называется при этом асимлтотичгским средним, оэ„(9) — асимптотической дисперсией оценки Тщ»(х„). (Коротко: Т~"'(х„) аснмптотнчески нормальна Ж(р,(9), о' (9)).) Параметры р„и о„определены в (12) неоднозначно. Нетрудно проверить, что если р'„и о'„удовлетворяют условиям и'„= =и,:+о(1)о„, о'„=о„(1+о(1)), л-+ьь, где о(1), л-+оо, обозначает последовательность, стремящуюся к нулю, то в (12) можно заменить и„, о„на р'„, о'„. Действительно, используя преобразо- ванне аналогично (15) находим 11щ(п1У(У +У,~у)ъб(у — е). 240 (16) Из (15) и (16) ввиду произвольности е и непрерывности б(у) в точке у получаем Вш Р (У„- У„< д) =б (д).
(17) Далее покажем, что У„У„- О. (18) е Действительно, при любом а Р (1У„У„! > е) ~ Р(1У„У„) > е, ! У„~ ь. а) + У(1У„! > а) ь. < У(1У„) > е/а) + Р ( 1 У„~ > а) . (19) Переходя в (19) к верхнему пределу по л, получаем 1ии вирР(! У„У„~ >е) ~б( — а)+1 — б(а — 0). (20) Устремляя в (20) а к со, приходим к (18). Для доказательства (14) можно сначала воспользоваться результатом (17), а затем применить к сл.в. У„'=У„+У„, Ьн 1 и У ну н+ У и (7е (1 н+ Уп» последовательно (18) и (17).
ф Когда Тои(х„) рассматривается как оценка параметрической функции ф(8), то хорошо, если свойство асимптотической нормальности (12) выполнено для йн(9) =9(8). В етом случае статистику Тии(х„) называют асимлтотически несмещенной. Йормнрующнй множитель о,(6) в (12) характеризует в етом случае разброс распределения статистики вокруг оцениваемой параметрической функции. В частности, можно написать 4Р6(о(9) Уи (Тее(Х)) — ф(6))СГ)-~ Ф(1), л-+со. (22) Рв(х„:Тм>(х„) — х~ е(й((0,1)) а„(9) ч ~р(9) < < Тее (х„) — х (У (0,1)) а„(9)) яе а, (21) где степень приближения растет с увеличением л, х,(М(0, 1)»вЂ” а-квантиль распределения М(0, 1).
В предыдущей главе мы видели, что при соблюдении определенных условий регулярности приближение оценка Тии(х„) к 9(8) имеет с ростом л порядок 15л. Позтому множитель а (9) в (12) в статистике обычно имеет вид о„(8) о[9)5л, о(9)>0. Запишем окончательно наиболее важный для статистики варяант предельного соотношения (12): 4. Преобразование статистик.
В случае, когда имеет место (22), очень полезным оказывается следующий простой результат. 241 Лемма 3. Пусть Т!">(Х„), л-1, 2, ..., асимлготически нормальна А>(6, л->от(0)) и у(1) — дифференцируемая функция, у'(9)ФО. Тоеда у(Т!">(Х„Ц, л=1, 2, ..., асимлтогически нормальна А1(у(0)), у'(9)то(9) л !). Доказательство. По формуле Тейлора у(1) — й(9) = (1 — 9) (к'(6)+а(1; О)), (23) где с>(1; О)- 0 при 1-!.9. Подставим в (23) 1=Т!">(Х„): у'и (у(Т'"> [Х„)) — )у(6) =у' Я) у'л (Теь (Х ) — 6) >с х(1+ а (Т!"> (Х ); 9)/у' (8)). (24) Так как, очевидно, Т!"> (Х„) -«О, л ->.>х>, ьь то второй множитель в (24) сходится по вероятности к 1, и, применяя к (24) лемму 2, получаем требуемый результат.
° Асимптотическую нормальность (22) можно использовать для построения приближенных (при больших л) доверительных интервалов. Один путь состоит в том, чтобы заменить в (22) о(0) на о(9(х„)), где 9(х„) — некоторая оценка 9. Более интересен подход, основанный на применении леммы 3. Именно допустим, что функция у(О) выбрана так, что у'(8)о (О) с, (25) где с — постоннная. В таком случае оценка у(Т!">(х„)) аснмптотически нормальна А>(у(6), с'л-'), и, следовательно, приближенный а-доверительный интервал для у(9) имеет вид у(Т >(„)) —, м(М(0,1)).1)/ <у(6)< ь у(7т" (х„)) — «ь,>(А>(0,1)) с/~л). (26) Так как функция у(9) монотонна, то, разрешая неравенства (26) относительно О, получим а-доверительный интервал для параметра О.
Для нахождения у(0) необходимо решить дифференциальное уравнение (25). Приведем пример. (1) В схеме испытаний Бернулли с неизвестной вероятностью О, 0(Оч.1, из предельной теоремы Муавра — Лапласа У((5 -лО)1УлО(1-8) ~1)-«Ф(1), л ьь, вытекает, что статпстика 242 является аснмптотически нормальной )т'(8, л-'8(1 — 8)). Преобра- зование 5)(8) находим из уравнения (25) для с= 1/2: е и(8) = ! =- агсз!п)ГО, г УВ(à — 61 о Таким образом, статистика агсз!п)' Т" (х„) асимптотически нормальна У(агсз!пЩ (4л)-'). 5. Аснмптотическая нормальность выборочных квантилей.
Пользуясь представлением (5) порядковой статистики Х)„„повторной выборки нз равномерного распределения на (0,1), получаем (27) где Я„=Х)+...+Х, л)=1, ..., л+1; Хь /=1, ..., л+1 — независимые сл.в., распределенные экспоненциально б(0, 1). Проводя элементарные преобразования над (27), получаем (28) Допустим, что Аимй„-)-оо, л-!.со, так что й„/л-~р, 0<р(1, например й,=(лр). Применяя к суммам )В.— Й)))% )5.
— В.— ! -! 1 — !))4/Б +1 — ! ))9 центральную предельную теорему для независимых одинаково распределенных слагаемых, получаем, что каждая из величин (29) имеет в пределе нормальное распределение У(0, 1). Принимая во внимание независимость сл. в. (29), используя лемму 2 и закон больших чисел для 5,+)/(л+1), получаем, что (28) имеет предельное распределение Ф(0, р(1 — р)). Таким образом, Я)„„аснмптотическн нормальна )т'(р, р(1 — р)л-').
Пусть Е(х) — непрерывная ф. р., обладающая плотностью /(х). Тогда Е-)(Х),,„) распределена как й-я порядковая статистика повторной выборки из распределения Е(х) (см, конец п. 1). Вычис. ляя производную обратной функции Е-)(г), находим пЕ )(х)/с(х 1//(Е )(я)). Допустим, что /(х,) >О, где х, — р-квантиль распределения Е, и применим лемму 3 с б(/) =Е-'(/).
В результате получаем следующее утверждение. 243 Теорем а 2. Если ф. р. Е(х) имеет нолохсительную нлотность /(х) в окрестности квантили хы 0<р<1„то выборочная квантиль Х<„ю, „повторной выборки из Е(х) асимнтотически нормальна /</(. „р(1 — р)/(. ) и '). В порядке иллюстрации рассмотрим повторную выборку из нормального распределения Л<(«, о'). Среднее <х является медианой распределения. Выборочная квантиль Х<ыпь„асимптотически нормальна М(1<, яа'/2п). Выборочное среднее нормально /</(1<, ат/н). Отношение дисперсии выборочного среднего к асимптотической дисперсии выборочной медианы равно 2/я=0,6366. 6. Аснмптотнческая нормальность оценок максимума правдо- подобия. Рассмотрим повторную независимую выборку и предположим для определенности, что модель непрерывна.
Пусть 0<">(х„) — состоятельный корень уравнения правдоподобия а/<- (х„; 9)/а9=0, (ЗС) Положим при любых Оеп6, б>0 Вв".ь =(х„: д1~'(х„; 0<м(х„))/дб =-О, 16~"'(х„) — 91< 6). Точный смысл утверждения о состоятельности корпя 9<">(х„) состоит в том, что существует, возможно не всюду определенная, статистика 6<"<(х„), л=1, 2, ..., для которой прн любых 6~6 и б>0 имеет место предельное соотношение Р (В~~а)-ь1, л-ььь (см. п. 2). Выражаясь не точно, можно представить себе, что прн каждом Оеп9 мера Рь в основном сосредоточена на подмножестве В~ее н в пределах этого подмножества уравнение правдоподобия (30) имеет корень, лежащий в интервале (Π— б, О+6).
В таком случае при б)0 достаточно малом возникает идея линеаризовать уравнение (30) в окрестности любой точки О и найти приближенное решение этого уравнения для х„еп Ве . Фиксируем <ь< произвольное Оьеп9 и запишем по формуле Тейлора линейное приближение для левой части уравнения (30): й (х, ~1 и (х, в~) + дч (, ~ы)(6 — 9,)+а(х„; 9). (31) дв да даь (32) 244 Для х„~ Вфь отбросим остаточный член в (31) и найдем приближенное решение 6<"'(х„; 9,) уравнения (31): 6<М(Х . О ) О д< (хь', Вь1 /д'< (кы ВЬ) х ь О дп < дай Покажем, что статистика Ооо(х„; Ов), рассматриваемая по мере Рв„прп выполнении некоторых условий регулярности асимптотнческн нормальна. Эти условия следующие: (А) Плотность распределения /(х~, О) отдельного наблюдения дважды дпфференцпруема при Овнб,  — интервал прямой.