М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 24
Текст из файла (страница 24)
(»ь»з, ..., »,), которая с равными вероятностями принимает и1 значений ((н 1ь ..., 1„) — перестановок нз чисел (1, 2, ..., л). Определим результат составного эксперимента как последовательность сл.в.: Մ— -(Х,, Х„..., Хп). Х~ =У»,. 1=1 2 . ° Найдем плотности распределения случайного вектора Х„. Выбе. рем произвольные попарно различные числа хь хь ..., х„и б)0, такое, что интервалы (х„х;+б], 1=1, ..., н, попарно не пересекаются. По данным х„найдем такую перестановку (йь йз, ..., Й„) индексов (1, 2, ..., и), что хм < хм < ... < хз„. Тогда, учитывая, что У~<уз<...<у„с вероятностью 1, получаем Р(х,< Х~ Сх~+В, 1=1, ..., п)=Р(х,( У„,<х~+6, 1=1, ..., и) =Ф(хз <У» <хз+б, у=1, ...,и)= =У(хз <У» ч~хз +Ь, »з =1, 1=1, ".,и)= / Ф! ! ' ! =,к» (хз < У, ~ х,, + б, »з, = у, 1 = 1, ..., и) = =Р(х < У~ схз +б, !'=1, ..., л)йэ(»з — — /, у=1, ..., и)= ,,+а 'з„+з 11Ь,)1(Ы" 1(И.)бр " Ф.( 1) ' яз Юз Производя сокращение на л1, получаем отсюда, что случайный вектор Х„имеет плотность 1(х~)1(хз)...)(х„).
Итак, вектор Х„ получен в два этапа: на первом — образован вектор Т„ ° =(Хнь ..., Хон), на втором — с помощью случайного механизма, не зависящего от неизвестной плотности Цх), получен уже сам вектор Х„. Проведенная конструкция показывает, что Т„содержит всю информацию о плотности 1(х). (П) Пусть Ф=й+"=(к„чей":х~)0, 1 1, ..., и), ау=за+аммьЯ ЙЙ+", а мера Р~. 0<0<+со, задается плотностью 1(х„; 0)=8-" при х„~)с~", хгсй, 1=1, ..., л 134 н 1(х„; 8) =О для остальных х». Такнм образом, рассматривается случайная выборка объема и нз равномерного на (О, О) распределения. Мы покажем, что вся ннформацня о параметре 8, содержащаяся в выборке х, заключена в статнстнке х< ~ шах(хь ...
..., х„). Используя предыдущнй прнмер, перейдем от выборки х„к ее варнацнонному ряду Т„= (хнь хяь ..., хоо), не потеряв прн этом информации о параметре О. Плотность распределення Т„(Х„) запишем в виде )т„(1„) = и) 6, 1„~ )~+, 1, ( 1, ( ... ( 1» ( 0 (!) и положим ее равной нулю прн остальных значениях 1„. Так как Ра(Хр,><1) =1»6 ", О» 1» 8, 7х, (1)= п( '0-" О ( 1 ( О.
Отсюда условная плотность Хоь ..., Хг» н при условии Хно равна прн О<1,«... 1„<0 7х,...., х,„„~ хна(1~ . ° .! ~(1,)=)ет„(1»Иах„(1„)= (и — !)1 С ~'. (2) Функция К(гь ..., 1 -!', 1) = (н — !)11 г»», О(11(...(1„-1(1, представляет собой совместную плотность порядковых статистик случайной выборки объема н — 1 нз равномерного на (О, 1) распределения (ср. (1)). Соотношение (2) устанавливает, что 6»....хм О!Х„„(1~.. Г»-~(Г) Ы((т Г»-~' 1») для всех г, О, таких, что аахм,(Г))О. Это означает отсутствие о дополнительной информации о 8 в значениях Хоь ..., Хг» н, если известна Х< ь (111) Пусть, как н в предыдущем примере, Ж' =Я+, сй =й+, а мера Р„,„— ао<Р<+со, о>О, задается и-мерной плотностью » 1(х»; р, о)= !!о-'~((х~ — Р)/о), ~(х)=е-», х) О.
1 ! Покажем, что двумерная статистика » За(х„) =(хн>, ~, (хю — хн>)) 1 2 содержит всю информацию о двумерном параметре (р, о). Перейдем от Х к Т (Х )=(Хнь ..., Хпо), сохранив всю информацию 135 о (р, о), а затем взаимно-однозначным преобразованием переи- дем к вектору У„=(уь ..., У„), У,=( — /+!)(Х,„— Х„„), !-1, ..., а, Хин = О. Вви/!у леммы ! $ б сл. в. У„ /=1, ..., и, независимы и экспоненциаль !о распределены: У! — с плотностью а-' ехр( — (у! — пр)!о), //;> !!!. а У;, />2, — с плотностью и 'ехр(-у/!о), у/)О.
т. е. плотность распределении вектора 7„ равна /!т„" (у„) = и ехр ! — о-! ! Я у/ — лр ! !, / 1 у/ ) О, /= 2, ..., п, у, ) ар. (3) По лемме ! $ У У! !- ° ° ° + У = Ъ (и — ! -!- 1) (Х//! — Хи-!!) ,с.~ / 3 и л = ~/' Х//! — (и — 1) Хи! ~' (Х!/! — Хи!) / з /-з имеет распределение 6(о-!, а †!) с плотностью уа (/) ° ' '" а (а — 21! Ом-! и С .
н и ь 'ры(У.У + .. +У )=(Х, ~'(Х!// Х )) равна й',т.+ ... +т„(з* /) = /!!"( (з) Я.+ ... +т,(/) = ехр( — о-'(/+з — пр)), /> О, я ) лр. (4) (а — 2) / !/! Сделаем взаимно-однозначный переход от вектора У„к вектору 2„ по формулам Е! У!, 2/=У!+...+У/, !=2... а. Якобиаи перехода от у„к Е„равен 1, так что ввиду (3) и (4) Д'„'(х„)=-о 'ехр( — и-'(г!+г„— ар)), 0<а,« ... г„г/>ар, /х,;х (г!, з„) = " ехр( — и !(г!+а„— рп)), з„)0, г!>пр. ' а !' " (а 21!еа 136 Отсюда получаем при х!>ли, х„>х„!»...хэ>0: !х>,...,х,!х„х„(хм ....х !!хм х„)= =~'Я(х„)!!ох;;х (г„х„) =(и — 2)1!4 '.
Таким образом, условная плотность Ем ..., Я ! прн условии Яп Е„не зависит от параметров р, о, и, следовательно, вся информация о параметрах содержится в статистике (г„, г„)=(у,, у,+... +у„)=1х<н, у' (х®л — хп!);, ! 2 или в эквивалентной ей статистике (х!н, х). Отметим, что оценки параметров р, о, с которыми мы встречались в $6 и 11, являются функциями статистик (х<н, х).
(1Ъ') Пусть Ф=)т'', Я Я", а мера Р„... — оо(н<+оо, о О, задается л.мерной нормальной плотностью о (2по)-"ехр ~ — — э' (х! — р)э). 2о лы ! 1 От случайного вектора Х„с плотностью й!(Р.1, о'!), где 1= = (1, ..., 1), ! — единичная пХп.матрица, с помощью ортогоиальнои матрицы С, у которой последний столбец имеет вид и-!!т1', переГщем к вектору У„Х„С, имеющему распределение й!(р!С, о'!). При этом (см. п. 3 $8) о в-! !-! 11 ! ! сл.
в. У!, ! 1, ..., а, независимы, У„имеет распределение . '(иул, о), а вектор о-!(У» ..., У„!) — стандартный нормальный. Вектор т'„получен из Х„взаимно-однозначным преобразованием и, следовательно, как носитель информации полностью эквивментен Х„. Поскольку плотность распределения вектора (У, ..., У„,) !г;;.,г„,(у„..., у„!)=()/2по) " 'ехр ~ — — ~~~„у!э) (6) сфсрически симметрична, то нетрудно понять, что условное распределение точки (Уь ..., У„!) иа сфере у!т... туо-! =сев Равномерное. Нам важно лишь, что это распределение не зависит 137. от р и о.
Проверим это, переходя к полярным координатам г, ф!, ..., ф 2 по формулам (О~ф!~п), (О кфг<л), Д! = Г со5 ф ! Дзллг 51П ф! СО5 фз (7) 138 Дл-2 = Г 51П ф! $1П фз... $1П фл-З СО$ фл — 2 (Окфл з~п), Дл-1 = Г $1П ф! $1П ф2 .. ° ЯП фл-З 5! П 1Рл-2 (О~г).
При этом, очевидно, 81+... +уз 1= Гз, а ипдукцией по и легко установить, что якобиан перехода равен ! '...—.'. а(к....,к ) ~ а(Г, р,,...,ф,) 5=5!ил 2!у!э!пл зфз .. ° '$1п фл-з $1пфл-з. (8) ВВЕДЕМ СЛ. В. !т, ФЬ ..., Ф„з, СВяЗаННЫЕ С У1, ..., Ул ! ТЕМИ жЕ СООтНОШЕНИяМИ (7), Чта КООрдИНатн Г, фп ..., фл 2 СияэаНЫ С у1, ..., 8, !. ВЕРОятНОСтЬ ПОПадаНИя ТОЧКИ (В, Ф1, ..., Фл 2) В борелевское множество В вычисляется как интеграл (9) в по области В', являющейся образом В при отображении (7). Совершая в интеграле (9) замену переменных (7) и учитывая (6) и (8), приведем его к виду ~ф2по) +'ехр( — — гз)1 -29(фз ...
пф, !!Г, (10) 2ез в где $, определенное в (8), является функнией только 1р1, ..., фл 2. Из (10) вытекает, что совместная плотность сл. в. !т, Ф!, ..., Фл 2 равна ~не,.„„ф „(г, !р,, ..., ф 2)=-()Г'Бо) "'Г'ехр ( — — Гз) г"-%. (11) (Отметим, что полярные координаты находятся во взаимно-однозначном соответствии с декартовыми прн условии гэ!п1р! ... 5!и фл 2~0, по так как )7$!ПФ! ... 5!п Ф„за с вероятностью ! по любой мере Рл., то никаких осложнений не возникает.) Поскольку о-2)72 = о-2(У!+... -'.
У,, 1) имеет распределение Ъ; 1=С(1,2, (л — !)!2), то !тз имеет распределение С(1; (2о'), (п — !)/2) с плотностью (см. (2), э 7) .4л-3) '2 /л — ! (2О2!Гл !"2Г ~ — ~ '1 з откуда и ф'(г)=2гбл(!') =- 2м-3)м а-! 1. (~ ) 2 Интегрируя (1!) по множеству (г>0) и учитывая, что интеграл от плотности (12) равен 1, найдем плотность уф„ „ ч, ,(!Рл, ..., ф, !) = с„ з!п"-'<Рл з!и"-'!Рл ... з!и' Щ, л з!и !Р, з, (! 3) где с„— постоянная, которая пе зависит от и и о. Совместная пло!!!ость (1!) равна произведению плотностей (!2) н (13). Таким образом, случайный вектор (У,, Рл, Ф!, ..., Ф„г) находится во взаимно-однозначном соответствии с вектором )л„за исключением множества значений Р„,,-меры нуль. Его плотность равна к,о !г„.жэ,..... „, (у г !р! ° !р !)= = Й„(У.) 1йл(г) 1Ф,,:. „л(Р . !Р— ") Отсюда условная плотность величии Ф!, ..., Ф>, л при условии сл.
в. У„, )с равна их безусловной плотности (13) н не зависит от (н, о). Следовательно, двумерная статистика л !! (У„, г) =- = ~~),хо ~~~(х; — х)' (14) Л !' ! (=! содержит всю информацию о параметрах р, а. Вместо (!4) можно рассматривать эквивалентные статистики ю л л ( ~~У» х! ~~) х! ) Или (х, 5 ), зл = — ~~)~~ ~(х! — Х)~, (1о) ! ! ! ! ! ! связанные с (14) взаимно-одпозначныы преобразованием. Таким образом, выборочные среднее х и дисперсия зл' образуют достаточную статистику. 2. Определение достаточной статистики, теорема факторизации. Как мы уже отмечали, понятие достаточной статистики в непрерывной модели вполне аналогично дискретному случаю. Однако математические тонкости, связанные с введением условных вероятностей, не позволяют нам дать определение достаточной статистики в его общей форме.
Мы будем рассматривать только параметрические модели н, если пе оговорено противное, только такие статистики Т,(х„) = (Т! (х„), ..., Т,(х„) ), которые можно до- 139 полнить статистикой Тл .(хл) =(У>(хл), ..., У„,(хл)) такой, что замена переменных 1; =Т>(х„), ..., 6=7л(хл) У> у>(хл)~ ° Ул-л )л-л(хл) (16) взапмно-однозначна на множестве Р,-меры единица при любом Оы6, а плотности меры Рл в координатах хл и (1„у, .) связаны на множестве Р,-меры единица соотношением 4л (хл) = ~тт,,х„>, т„,х„, (1„у.,) !,7(, (17) где ~ 7~ ~ г(>ь ° 6 гь ° ° °, Ул-л) ~ а(я,,"," ..1 — якобпан перехода от координат (1„, у„ „) к (х„). Иначе говоря, предположение (16), (17) означает, что, во-первых, существует плотность случайного вектора (Т,(Х,), Т,,(Х„)), н, во.вторых, при использовании этой плотности для вычисления интеграла ) ...,) /ет <х,>.т >х„> (1.
У вЂ”.) Н!> ° >У,йу> НУл —. в можно воспользоваться заменой переменных (16) и свести этот интеграл к следующему где В' является прообразом В прн отображении (16). Определение. Пусть статистика Т,(хл) такова, что выпол. няются предположения (16), (17). Если условная плотность. определенная прн 6„6, таких, что 7т,<х„>(1) )О, формулой з >х <х »т(х >(У (1 ) >тл>х > т <х >(1 Ул- )>>т <х >(1 ) (16) в ,а >ат,>х„> (1л) = ) ° ° $ >зт,>хл>. т >х„>(1 ° у - ) "у> ° йу -' Теорема факторизации.