М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 28
Текст из файла (страница 28)
Статистика Т(х) на (х',гЗ,(РВ,ВеиЩ) со значениями в измеримом пространстве (ф, лй) называется полной, если семейство ее распределений вероятностей ЯВ(А) = РВ(х: Т (х) еп А), А ен А, является полным. Если достаточная статистика Т(х) полна н уравнение (1) разрешимо, то его решение существенно единственно. Мы увидим, что соответствующая несмещенная оценка имеет минимально возможную дисперсию.
Рассмотрим примеры полных достаточных статистик. (11) Статистика хеп в модели повторных независимых испытаний с равномериылг на (О, 6), 6>0, распределением полна (см. пример (11) 5 !6): из уравнения И Мой(Лсо) = ~ й(1) ПГ"-'В-"с$Г =.- О, 0 > О, о сразу получаем, что псрвообразпая функции й(1)1"-' равна нулю, а следопстельно, й(1) =0 всюду, кроме множества меры Лебега нуль. (1И) Рассмотрим статистику (лхпы ~ (хи> — хи1)) в выборке из экспоненциального распределения с плотностью а-'ехр( — а-'(х — р) ), х> )г, — оо(и(ао, а>0 (см.
пример (111) $16). Так как Х=пХп> и г'= ~Г (Х„, — Хпг) г независимы н имеют соответственно экспоненциальную н гамма плотности: Г"' (х) =а-' екр( — (х — рл) а-'), х > лр, )о„(у) =, екр( — уа-'), у > О, то уравнение (12) преобразуем следующим образом: % Ф Ж О= ~' ~й(х,у)уо'(х)Уа(17) Ыу=5 Р2 (х)(х~й(х.у)РФ(у) (у= йьо оо о =. ( 1охо(х)йо(х)г(х=-а ' ехр(лра-') ) ехр( — ха-')Ьо(х)г(х. (13) йо ло 157 !р(8) = ~ е-о'у(х)!(х, — ос<8<+ ос, (15) однозначно определяет функцию у(х) для почти всех х.
Уравнение (12) для семейства У(1л, оо') после элементарных преобразований принимает внд ехр((л — )Л(х) ехр !1 — ) дх=О, — оо<р<+ со, х т х которое приводится к (15) заменой переменного у х/ооо, так что Л(х) = — 0 почти всюду. я л Положим Х=~~'Х„У=~~ (Х; — Х)'. Так как Х н т независ-! ! ! симы и имеют соответственно распределения !!!'(п(л, оо) н 6(1/(2оо), (а — 1)/2), то уравнение (12) для пары статистик и !я' ~! х„~~ (х; — х)о) записывается в виде ! ! 0= ~ ~Л(х,у)фо(х)ф(у)!1х!(у = ~ 1!хо(х)!(х~Л(х.у)ф(у)йу. -'.» о — ~а о ФпкспРУем о; пользУЯСь полнотой семейства 1х"'(х), -оо(1!Кое, находим, что для почти всех х (Л(х,у)1о(у)!(у=:О, у) О.
о 158 Рассматривая '(13) как уравнение относительно 1о при фиксипованиом о, легко видеть, что, за исключением множества меры Лебега нуль, Л'(х) =О, так что для почти всех х Ф ) Л(х, у)ф" (у)ду.=О. (14) о Исг!оз!луя полноту семейства 6(о-', л — 1), получаем Л(х, у)=0 для ючти всех у прп всех х, для которых выполнено (14), что и доказывает полноту статистики (лх!и. ~ (х<п — х<п)1. ! 2 (1Ъ') В модели повторной выборки из распределения Л'(р, оо) я и полной ЯвлЯетсЯ статистика (~~' ль ~Г (х; — х)'1, ПРовеРим ! 1 ! ! сначала, что распределение У(н, оо') иа (1(!, Я!), где -оо<р~ ( +со, оо')Π— фиксировано, является полным. Воспользуемся аля этого тем, что двустороннее преобразование Лапласа Теперь, используя полноту семейства б(1/(2а'), (и — 1)/2) (см, пример (1)), получаем, что для почти всех у и почти всех х Л(х, у) О.
° Имеет место следующая Теорема 1. Пусть плотность /а(х) принадлежит Л-параметрическому экспоненциальному семейству: /в(х)=Л(х)ехр Яа»(9)Т»(х)+Ь(9)), 8епб. »» Если множество значений функции а (9) (а» (8),..., а (9) ), бев9, содержит Л-мерный параллелипипед, то Т(х) (Т,(х),..., ..., Тл(х) ) — полная достаточная статистика. Доказательство теоремы можио найти в [11, 121. 2.
Наилучшие иесмещеииые оцеики в дискретиой модели. Рассмотрим дискретную статистическую модель ! х', М, (Рв, 9 еп 8)), и пусть Т(х) — полная достаточиая статистика. Допустим, что существует иесмешеииая оцеика 5(х) параметрической функции»р(9): М,5(Х) =»р(9), 8яв. (16) Будел» искать функцию й(1) такую, что М й(Т (1() ) = р (8), (17) Введем разбиеиие (Ю») множества Ж, порождаемое достаточиой статистикой Т(х): х» — — (х: Т (х) =!).
(18) Запишем уравнение (!7) в виде ~~~8(Т!х))Рв(х) ~~),"Рв(Ж»)д(1)=»р(8), 9е=9. (19) 3 » где суммирование при каждом 8евст ведется по тем 1, для которых Рв(Х») ) О. Из (16) имеем, что для всех 8еи9 »р (9) =~» 3(х) РВ(х) ~'РВ(Ж») ~»" 3(х) РВ(х)/РВ(Х ), (20) ле»е» с теми же ограничениями иа область суммирования по /, что и в !19). Сравнивая (19) и (20) и учитывая, что ввиду полноты Т(х) решение уравиеиия (19) существеиио единственно, обнаруживаем, что о (1) = ) 3 (х) РВ (х)/РВ Ф'»), !21) лаю» 169 где семейство условных мер Рг (х) РО (х)/РО (Юю), х аи Ми (22) не зависит от 9 ввиду достаточности статистики Т(х).
(Напомним, что формула (22) при данном 1 определяет меру Р'(х], если ."лиествуст хотя бы одно Оеп6, для которого Р'(2'~) >О н д::ч всех таких 6 значение Р'(х], хви 2и одно и то же; см. $1а.1 Перепишем формулу (21), задающую функцию д(1), с учетом (22] а обозначениях, не содержащих 9: (23) у (1) =. )Г 3 (х) Р' (х), ча чч Итак, получено следующее утверждение. Л с ч м а !. Если Т(х) — полная достаточная статистика в дискретнт й модели (Ж, й, (Рв, 9 еи 6)) и существует статистика 3(х), несмещенно оценивающая параметрическую функцию ц(6), то статистика у(Т(х)), где у(1) задается формулой (23), также несмещенно оценивает ф(9).
Статистика у(Т(х)) существенно единственна. ° Формула (23) определяет у(1) вне зависимости от того, является ли достаточная статистика Т(х) полной или иет — оценка ,й(Т(х]) остается все равно несмещенной: ййву( ()) ~у() в( ) т =~,"Рв(~,) ~~ В(х)~ (х)=~~3(х)РВ(х]=ф(9]. па й'ч '1'аким образом, справедлива Л е и и а 2. Если Т(х) — достаточная статистика в дискретной модели (Х, ч9, (РО, Оя чт)) и существует несмещенная оценка 3(х) параметрической функции ф(9), то статистика у(Т(х)), где у(1) определена формулой (23), также несмещенно оценивает р(9]. Лемм а 3. В условияк леммы 2 имеет место соотношение Оф (Х) =-0ву (Т (Х)) + ййв (3 (Х] — у (Т (Х)))'.
(24) Доказательство. Для дисперсии 5(Х) имеет место следующее представление: (]вд(Х) =У(3( ) — ~(9))*рв(*) = й '=~Раж Е (3( ) — ф(9))'Р ( Ирвж (23) кем~ 160 где 2'х определено в (18). Преобразуем внутреннюю сумму в (26), используя обозначение (22): (5(х) — й(1)+ д(1) — р(6)ар~(х)) = вам'г (5 (х) — д (1))' Р' (х) + 2 (а (1) — зр (6)) х залез Х Я (5(х) — дф)Р'(х)+(611) — <Р(6))е. (26) залез Ввиду (234 среднее слагаемое в (26) равно нулю. Подставляя (26) в (26), получим (Ув5(Х)=~рв( ) ~ (5() — й())'Рв()1рв(.6',)+ $ хауз + ~рв(.2,) (У(1) ф(6))авв 1 = ~ '(5 (Х) — й (1))я РВ(Х~)+ (уеб (Т (Х)), х откуда и вытекает равенство (24). Из формулы (24) следует, что 1лэ5(Х))ОЕАР(Т(Х)), причем равенство выполняется, лишь когда 5(Х) н й(Т(Х)) совпадаютс Ро-вероятностью единица.
Если достаточная статистика Т(х) полна, то имеется существенно единственная функция п(1), такая, что й(Т(х)) несмещенно оценивает ф(6). Формула (23) при этом определяет сушественно одну и ту же функцию п(1), вне зависимости от того, какая там взята несмещенная оценка 5(х). В таком случае, используя лемму 2, получаем, что й(Т(х)) имеет нанмепьшу1о возможную дисперсию в классе всех иесмешенных оценок. Подведем итог всему сказанному. Теорема 2*>.
Если Т(х) — достаточная статистика в дискретной модели (го, Я, (Ро, 6 еи сз)) и 5 (х) — какая-либо негл~ещенная оценка парал~етрической функции ф(6), то статистика й(Т(х)), где д(1) определена формулой (23), также несмещенно оценивает зр(6) и 1)еп (Т (Х)) < 1ув5(Х), причем равенство соблюдается лишь при условии совпадения й(Т(Х)) и 5(Х) с Рв-вероятностью единица. Если к тому же оостаточная статистика Т(х) полна, то д(Т(х)) — существенно " Теоремы 2 н Э являются варнантамн теоремы Блекуэла — Холмогорова— рао, а также включают утвержденне теоремы Лемана — Шеффе о полных достаточных статистиках.
161 О,' м. В. Козлов. д. В. Прохоров единственная статистика, являющаяся функцией Т(х), которая несмещенно оценивает 6(8), и она имеет наименьшую возможную дисперсию в классе всех несмещенных оценок. Функция у(!) мо- жет быть найдена как решение уравнения Мву(Т()()) — ~' у(!)РвЮ)=вр(6), 6 =8, либо получена из формулы (23), где 8(х) — произвольная несме- щенная оценка ~р(6). Рассмотрим примеры. (Ч) Пусть 2' (х,= (хь..., хв): х;=0 или 1, 1 1,..., и), Ре(х„) =етгв '(1 — У)) "4 и Т(хв)=Х. ев 0<8<1, в в Статистика Т(х ) — полная достаточная. Действительно, прирав- нивая математическое ожидание к нулю: и м,е(т(х„))=~8(!)с'„е (1 — 6)" = в е ='~1'„ц!)с„'( —,8,) (1 — 8) =о, в е (27) Вычисляя по формуле (23), находим у,(!) = 1 х,(С,',) '.=(С„') ' Я 1=(С,') ' С,' 1=!/и.
в,+...+в~ В-1 ъ„:т<ввв Таким образом, наилучшая несмещенная оценка 6 есть ув(Т(х„)) =-~ х;/и — — х. Веп 162 получаем, что многочлен от переменного х=е/(1 — 8), х)0, тождественно равен нулю. Следовательно, его коэффициенты равны нулю, т. е. )в(!) =О, 1=0, 1,..., и. Возьмем статистику Зв(хв) =хь Поскольку Рв(Х~ 1) 8, Рв(Х1=0) 1 6 МвХ~ 8, то оценка 5, (х„) — несмещенная. Далее, при Т(х„) ! имеем по формуле (22) Р (х„)=Ев(1 — 8)" 7(С'.ев(1 — Е)" )=(С„')-' Возьмем статнстнку Вз(х ) =(х! — х!)«(2. Имеем й(а (Х, — Х,)'/2 = Ма (Хз~ — 2Х,Х, + Х!~)12 = 0 (1 — В), т.
е, статистика 5«(х„) несмещенно оценивает 0(1 — В) — днсперсню отделыюго наблюдення. По формуле (23) находнм ц, (1) =: — ~ (х, — х,)' (С') с,:г(в, ! ! = — (2 ~)' 1 (Са) ) (Сь) Сй-2 = с.+".+~„-! †! откуда получаем нанлучшую несмещенную оценку для 0(1 — О): л ь д,(Т(х„)) = ' ~~ »;(л — Tх!) = — "»(1 — х). п(а — 1) ~ сы ) а — 1 ! 1 ! ! Она не совпадает с результатом подстановкн в формулу В(1 — В) нанлучшей несмещенной оценкн В=х, но она совпадает с несмещенной выборочной оценкой днсперсин зз: — (л ~)„'х, — ("~'х,)') = ' (п~~)'х~ — л«) = ! ! ! 1 с-! ~~~~« ~«' чч(», )«з« в — ! а — ! ! ! ! ! где мы учлн, что х', =хо (1~1) Пусть Я=(х„=(х„..., х„):х!=1, 2, ..., Ф; !'=1, ..., и), Р„(х„)=Ф ', х„яХ, У=1, 2, ....
Провернм, что достаточная статнстнка Т(к,) =х! ! является полной. Имеем (см. прнмер (П1) $15) Рл(х„:Т(ха)=8)=У "((" — (! — 1)") 1=1, 2 ' 'э Ф, откуда уравненне (12) прнобретает внд н О=й(лй(Т(к„)) =Х Ь(1)У (га — (1 — 1)а), У=1, 2, ..., илн 163 е!! ч и потому Ь(1) =0 при 1 1,2,.... Наилучшая несмещенная оценка У равняется д(х~ >), где д(1) находится нэ условия ~~„6(1)М (!" — (1 — 1)")=Ж, /Ч=1, 2, (28) Из (28) получаем а (й/) (/Уи (й/ 1) э) й/а+~ (/У 1)л» 6 (1) — 1(1 (1 )/1) а+1) /1 (1 1/1) л) нлн п(1)= 1 5(х)Р (х), Ж=(х: Т(х)=1), (29) Р'(х) = Р (х)/Р М,), 6 еп 9. Статистика д(Т(х)) принимает постоянное значение на элементах разбиения (Й~), и зто значение равно среднему значению статистики 5(х) по условной мере Р' (х).