М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 26
Текст из файла (страница 26)
Как и в дискретной модели, минимальное достаточное разбиение, правда прн некоторых ограничениях, образуется из классов эквивалентности по отношению Й: хйуввга(ХИа(у) не зависит от 9. (41) Проверим это утверждение на экспоненциальной модели (39). За. метим, во-первых, что плотности (39) обрашаются в нуль на общем множестве (х: Ь(х) =О) н потому можно исключить из рассмотрения все такие х. Далее, отношение 7а (х)/Да (у) ехр(~!" а!(9)(Т;(х) — Т,(у))) для данных х, у не зависит от 8, если либо Т(х)=Т(у), либо функции 1, а!(8), 8~6, !=1,...,й, линейно зависимы и коэффициенты с!=Т,(х) — Т!(у) таковы, что с!а! (9) + ...
+ с„а„(8) = — соп51, 9~6. (42) Если прн некоторых с!,...,с~, с!5+...+сР)0, имеет место равенство (421, то модель можно редуцировать, взяв из системы 1, а!(8), !=1,...,й, максимальную линейно независимую подсистему 147 Поэтому в примерах (37), (39) можно было рассматривать только случай п=1. ф Из теоремы факторизации при дополнительных ограничениях (16), (17) вытекает, что векторная статистика Т(х) (Т!(х),..., ..., Та(х)) является достаточной в модели (36). Отметим, что ограничения (16), (17) являются излишними при более широком понимании достаточности.
Как н в дискретной модели, интерес представляют достаточные статистики, сокрашаюшие данные в наибольшей степени. Достаточную статистику $(х) назовем минимальной достаточной статистикой, если она представима как (вектор-) функция от любой достаточной статистики. С достаточной статистикой Т(х) свяжем достаточное разбиение множества М: и зьчеьпв в (39) остальные функции а!(8) иа линейное представление через зту систему. Поэтому мы предположим, что 1, а!(9), !=1,...,й, — линейно независимые. В таком случае разбиение на классы эквивалентности по отношению к (41) совпадает с достаточным разбиением (40).
Покажем, что зто разбиение минимально. Пусть достаточная статистика $(х) такова, что (43) Б(х) ф(Т(х)). По теореме факторизации, если Б(х) $(у) =з, то Еэ(х) =8!(э; 8)йг(х). Ев(у)=8,(э; 9)йг(у) и для всех 9~6, таких, что и! (з; 9) ьО, отношение Ев (х)ЕЕ9 (у) == 6!(х)ЕЬ! (у) ие зависит от 9, т.
е. Т(х) =Т(у). что н требовалось установить. ° Подчеркнем, что в (43) рассматриваются лишь такие миннмальные статистики 8(х), которые удовлетворяют ограничениям (18), 117), и тем самым утверждение о минимальности Т(х) доказа!!о лишь в этом классе статистик. В примерах (37), (38] требования (10), (17) удовлетворяются, и достаточные статистики а н га л Д ."', являются минимальными соот- ( 1 ! ! ! ! ! ветсзеенно для выборок иэ распределений 6(й; р) и йЕ(р, и). В линейной статистической модели с нормальными наблюдениями 127) статистики (29), служащие оценками коэффициентов 8 и а'.
также являются мпнпмальнымп достаточными. Равномерное распределение на (О; О) (см. пример (П)), экспоненциальиое распределение с параметрамп сдвига-масштаба (при. мер !111)) не принадлежат к семейству экспоненциального типа. Ха1актерная осооенность этих распределений заключается в том, что чножество, где плотность распределения отчична от нуля (носптель распределения), зависит от параметра, в то время как в (38) носитель у всех распределений один и тот же — (х: й(х) ) =«0».
Однако минпмачьность рассматриваемых в примерах (П), (1П) достаточных статистик доказывается теми же рассуждениями, что и для семейств экспоненциального типа. Такое же заключение справед1нво и для цензурированной выборки примера (1Ъ'). ° К построению минимального достаточного разбиения имеется н другой подход. Оказывается, что, как и в дискретной модели, достаточное разбиение порождается следующей системой статистик: Е.(х; 8)= Еп (х).
Оеяв, 148 зависящих от 9 как от параметра, а минимальное достаточное разб!;ение порождается функциональной статистикой (.(х; 9)/Ь(х; 9„); Оев9, (44) в предположении, что существует такое Ооепа, что носители всех мер Рв содерм<атся в носителе Рв„, Если носители всех мер Рв с:впадают, то в (44) удобнее перейти к логарифмам 1пцх; 9) — 1п цх; 9,) а(х;9), 9 =В.
(45) Рассмотрим, к чему приводит этот под!.од в экспоненциальной модели (39). Подставляя ДВ(х) из (39) а (45), получаем д(х; 9) = ~~' (а,(8) — а;(9,)) Т,(х)+(б(9) — Ь(8,)), Оы !9. (46) Следовательно, разбиение Х, порождаемое совокупностью статистик (45), совпадает в этом случае с разбиением, порожденным векторной статистикой Т(х) = (Т!(х)„..., Ть(х)), которая, как мы уже проверяли, является минимальной достаточной. Таким образом, в экспоненцпальной модели (39) удается сократить минимальную достаточную функциональную статистику (45) до й-мерной векторной Т(х).
Полезно отметить, что если в экспоненцпальной модели (39) система функций 1, а!(9), !=1,...,й, 8~6 взята линейно независимой, то, как нетрудно понять, можно подобрать значения 9<!>~8, !=1,...,й, так, что матрица [а!(8<!!) — а (Оо), !,1=1,...,й) невырождена, и из соотношений (46) Т;(х), 1 1,...,Ф, могут быть линейно выражены через функции 1, а(х; 9!!!), !=1,...,й: Т! (х) = с~~" + ~!' с!!" д(х; 9'!'). ! Перейдем к произвольной непрерывной модели (Ю, аи, (Рв, 9~ я 9)), у которой носители всех мер Рв совпадают.
Рассмотрим пространство 2' всевозможных конечных линейных комби. наций: ! 9(х)=-с,4- ~ с!9(х; О!), / 1 где О;я6, с, — произвольные постоянные 1=1,...,1, ! — любое .!а!ур,!.!ьное..У является линейным пространством, вообще гово. !и.
бесьонечиомерным. В случае экспоненциальной модели, как мы только что видели, 2' конечномерио: 1, Т!(х), !' 1,...,К поги!ждает .У. Допустим, что в 2' имеется не более чем счетный 'чанс 1, Чь(х), !'=1,...,й (й может быть и оо), так что любой 149 элемент !р(х)аи!а. представим в виде конечной линейной комбинации элементов базиса: !р(х) =Ь,+ ~!" 6!!р!(х).
! В частности, это верно и для каждой функции 9(х; 9), Оеи6. В таком случае, й-мерная статистика (!р!(х), <рт(х),...,<ра(х)), й(со, (47) эквивалентна функциональной статистике 9(х; 9), Ос=9, тзк как 9(х; 9)ен,У при любом Он=В, н поэтому линейно выражается через систему.
Отсюда совпадение разбиений, порождаемых систе. мой статистик д(х; 9), 9~6, и й-мерной статистикой (47), и, следовательно, статистика (47) минимально достаточна. Интересно заметить, что если размерность й статистики (47) конечна, то, записывая при каждом Оец 9 разложение элемента я(х; 9)ен,У по базису 1,!р!(х),...,Ч!~(х), получаем 1п~в(х) — 1пД~, (х) =9(х; 9) = )" а!(9)!р!(х)+Ь(9), откуда 7в(х)=1в,(х)ехр1~ а!(9)!р!(х)+Ь(9)1, !=! (48) 9 (х; 9) =1п гв (х) — )п Цв (х), О ен 6, (49) и 2' — линейное пространство функций <р(х), порожденное линейными комбпнациямн функций системы (49).
Допустим, что 1, <1;(х), !=1,...,й (й может равняться и со) — базис 2', так что при любом Оеар и!6) д(х; 9) = ~' с!(9)!р!(х)+с,(9). ! ! (50) Из предыдущего вытекает, что й-мерная статистика (гр!(х), !Гр(х),...,!ра(х)) является минимальной достаточной. Подчеркнем, что здесь всюду 150 т. е. статистическая модель является экспоненциальной. Таким образом, семейство распределений с общим носителем является экспоненцпальным тогда и только тогда, когда пространство У конечномерио. Я Рассмотрим, что дает описанный подход в модели с независимой повторной выборкой, когда плотность ),(к), Ос=8, отдельного наблюдения сосредоточена на одном и том же множестве. Пусть х — скалярная переменная. Перейдем теперь к повторной неза- висимой выборке объема л.
Очевидно, л я(х„; 9) = ~) д(х!; 9), 9яя В, !=! а из (50) вытекает, что л л!(6) п(х„; 9) = ~ ( ~Г с (О) !р (х!) + с (9) ! ) ! 1=! л!(0) е = Я с!(9)~~' !р!(х(),-лс„(9). В таком случае ясно, что й-мерная статистика е (ф,(х„), ..., фэ(х„)). !р!(х„) = э' !р!(х!), ! =1, ..., й, (Ы) (=! является минимальной достаточной. Если размерность й статистики (Ы) конечна, то при л)Й она дает сокращение данных по сравнению с тривиальной достаточной статистикой — вариационным рядом.
Заметим, что при этом, как вытекает из (48), распределения отдельного наблюдения и всей выборки принадлежат экспоненциальному типу. Однако при условии й~л остается открытым вопрос о сокращении размерности статистики (51) с сохранением достаточности. При дополнительном предположении, что все плотности /в(х) 9ы 6, непрерывно дифференцируемы на некотором общем для всех интервале Ь, мы докажем следующее утверждение: любые з. з(!п(п(й, л), компонент статистики (51) функционально независимы.
При й(л отсюда, очевидно, следует, что размерность статистики (51) не может быть поиижена с сохранением свойства достаточности. Действительно, пусть некоторая статистика (д!(х.),...,д!(х.)), 1(й, является достаточной; тогда ввиду минимальности статистики (51) все ее компоненты ф!(х„), 1=1,...,Ф, должны функционально выражаться через д!(х,),...,д!(х.). Но поскольку !(й, это приводит к функциональной зависимости !р!(х„),...,!р~(х,). При й)л из сформулированного утверждения вытекает, что размерность достаточной статистики не может быть сделана меньше л. В самом деле, в этом случае статистики !)!(х„),...,!р,(х,) функционально независимы, и потому якобиаи д(!р!,..., !р,)/ !д(х;..,.,х„) отличен от нуля на множестве Л"=(х„:х!ецЛ, !=-!...,л). Следовательно, найдется интервал Лый, что иа подмножестве Л"с: 'ъ' зависимости !1,=!1,(х,)„(="1,...,г!, можно однозначно разрешить относительно х,.
Учитывая, что !51 л л ф> (Х„) =- ~ >Т> (х,) =- Я >Р> (Х>;>лл ф> (Х>ц, ..., Х,л>), > 1 > получаем, что соотношения ф>=ф>(х>ц,...,х>ю) также однозначно. разрешимы относительно х>ц,...,х>л>. Итак, в некоторой области Лл переменных х>,..., хл (имеющей положительную меру при каждом Оое6) статистика (х>ц, ..., х, >) эквивалентна статистике (ч>(хц».,х>л>),,фл(х>ц,...,х>л>)). Поэтому достаточное разбиение, которое порождает вариационный ряд в области Лл, является минимально достаточным, т. е. (хп>,...,х>л>) — минимально достаточная статистика по крайней мере в области Лл.
Докажем теперь сформулированное выше утверждение о функциональной независимости статистик ф>(х,),...,ф,(х.). Предположим противное. Тогда якобиан д(>1,, ..., ф,)/д(х„..., х,)= =де1(д>1>(х„)/дх>, >, /=1...,, з]=.>)е11>Р;(х>), >', / — -1, ... „з) (52) тождественно равен нулю в /эл=(х„:х>~Ь, >'=1,...,п). Приведем это к противоречию с линейной независимостью системы 1, >р>(х),...,>р,(х). Будем действовать по индукции, При з=1 по- лучаем >р'>(х>) авО, >г>(х>) сопз1, и противоречие получено. Допус- тим, что д(ф>,...,ф. >)/д(х>,...,х, >)ФО.