XVII Математическая статистика (1081432), страница 9
Текст из файла (страница 9)
1(1 Заметим, что к яг(х„) = ~~» (х,-х)' ° =1 поскольку для нормальной модели п»4 — За~ 1ХЪ'Ц. В результате получим ЮУ(Х„) = — и е(д) = 1, п1(о) 2. ТОЧЕЧНЫЕ ОЦЕНКИ является несмещенной оценкой параметра оз (см. замечание 2.4), но для нормальной модели Ф(р,д) зта оценка не является эффективной. Это вытекает из теоремы 2.3 о единственности существования эффективной оценки. Можно показать, тго 4 вУ(х„) =— и — 1 Следовательно, 1 в — 1 е(д) = = — < 1.
оЦВ)ВЯз(х ) Пример 2.6. Рассмотрим экспоненциальную модель ! 1 -е л, я>0, О, я<0. Покажем, что Х является эффективной по Рао — Крамеру оценкой неизвестного параметра д. Действительно, в(х) =в( — ',~ х;) =-вх= —, 1 1 е"" и .
и и ю=! 1'(д) = М~ — (1п -е В )~ = М(- — + — ) /д 1- — !~ 1 Х Х вЂ” д~з М(Х вЂ” д)з ВХ Ф 1 = ( — )- д~ 1 04 6~ Ф йз ' откуда заключаем, что е(д) = —, =1. ! В~ ив в!'„ 2.2. Понятие достаточных статистик 2.2. Понятие достаточных статистик Применение в реальных прикладных задачах методов математической статистики, как правило, связано с обработкой н хранением больших массивов статистических данных, относящихся к изучаемому объекту или процессу. Поэтому в этой области существует проблема сокращения объемов исходных данных без потери информации о статистической модели. Именно в связи с этой проблемой рассматривают так называемые дастпаточные статистики, к изучению которых мы приступаем.
Пусть Х„ — случайная выборка из генеральной совокупности Х с функцией распределения Г(х;й), где й — неизвестный параметр. Пусть, далее, Т = Т(Х„) — некоторая статпистика (функция случайной выборки). Предположим, что нам известна не выборка х„, являющаяся реализацией случайной выборки Х„, а только значение Т(х„) = 1 статистики Т. В дальнейших рассуждениях нас будет интересовать условная функция распределения Ро (хы...,х ~Т(Х )=2) случайной выборки Х„..., Х„при условии, что статистика Т(Х„) приняла значение ~.
Заметим, что в общем случае это условное распределение зависит от параметра й. Определение 2.5. Стпатистпику Т(Х„) называют достаточной для параметра у, если условная функция распределения Ру (хы...,х„~ Т(Х„) = с) случайной выборки Х„при условии Т(Х„) = 8 не зависит от параметра й при любом возможном значении 1. Согласно определению 2.5, при фиксированном значении 8 изменение параметра й не влияет на условный закон распределения случайной выборки Х„при условии Т(Х„) =2. Это 3. ТОЧЕЧНЫЕ ОЦЕНКИ означает, что значение 1 статистики Т(Х„) дает полную ин- формацию о параметре д.
Замечание 2.В. Поскольку для непрерывной статистичеи а Ру (гм...,г ~ Т(Х ) = ~) = а ы /...~~„( „...,~(т(г„)=в~~...~.. а для дискретной Ру (гм... г (Т(Х ) =1) = в Р(Хы = х~, ..., Х1„= х„' ( Т(Х„) = Ф), '=~ ге*';<а то в случае достаточной статистики Т(Х„) соответственно условная плотность распределения рв (гы...,г ~ Т(Х„) = Ф) и условная вероятность Р(Х1 = х(, ..., Х„= х~ ~ Т(Х„) = г) не зависят от д. Пример 2.7. Пусть Х;, г = 1, н, — число успехов в е-и испытании по схеме Бернулли.
Рассмотрим статистику Т(Х„) = Х +... + Х„, имеющую смысл числа успехов в п испытаниях по схеме Бернулли. Покажем, что она является достаточной для параметра д — вероятности успеха водном испытании. Найдем условное распределение вероятностей, которое для случая дискретной модели будем записывать в виде Р(Х1 —— хм ..., Х„= х„( Т(Х„) = Ф). 2.2. Понвтне достаточных статистик Согласно определению условной вероятности, имеем Р(х, = *„..., х„= *.
~ т(х.) =1) = Р (Х1 = хм ..., Х„= х„, Т(Х„) = Ф ) Р(Т(Х„) = г) Если х1+...+х„= с, то Р(Х1 = хы..., Х„= х„, Т(Х„) = Ф) = =Р(Х1 = хм ...,Х„=х„~ =В'(1 — В)" '. Напомним, что случайные величины Х;, 1= 1, в, могут принимать здесь только значения 1 илн О, причем Х1+...+Х„=Ф. Поскольку вероятность Р(Т(Х„) = с) определяется формулой Бернулли Р(Т(Х„) =1) =С„'В'<1 — В)" ', то условную. вероятность можно переписать в виде Р(Х1 — — хы...,Х =х )Т1Х„) =1) = о 1 / т.е. она не зависит от В. Если же х1+... + х„~ 1, то Р(Х1 —— хы ..., Х„= х„,Т1Х„) =1) =О, а следовательно, и Р(Х1 —— хм ..., Х„= хн ~ Т'1Х„) = с) = О, т.е. опять-таки условная вероятность не зависит от В, а значит, согласно определению 2.5, Т1Х„) = Х1 +...
+ Մ— достаточная статистика для параметра В. Проверять достаточность конкретных статистик, основываясь на определении 2.5, довольно сложно. Следующая теорема 3. ТОЧЕЧНЫЕ ОЦЕНКИ дает критерий достаточности статистики, который помогает выполнять такую проверку. Предварительно введем функцию ЦХ1,...,Х„;д) =р(хл,.д) ...р(х„;д), (2.6) которую называют функцией правдоподобия. Здесь р(х; д) обозначает плотность распределения непрерывной случайной величины или вероятность события (Х = х) в случае дискретной случайной величины, а Х;, 1 = 1, п, — элементы случайной выборки Х„. Теорема 2.5 (критерий факторизации Нейнана— Л'арсена'). Статистика Т = Т(х1,..., х„) является достаточной для параметра д тогда и только тогда, когда для любой реализации (х1, ..., х„) случайной выборки (Х1, ..., Х„) выборочное значение функцин правдоподобия имеет вид ь(х1,...,х„;В) =д(Т(х1,...,х„),д) Чх1,...,х„), (2.7) т.е.
может быть представлено в виде произведения двух сомножителей, из которых второй не зависит от б, а первый (зависящий от В) зависит от результатов наблюдений х1, ..., х„только через статистику Т = Т(хы..., х„). < Приведем доказательство для дискретной модели и учтем, что в рассматриваемом случае нероятность р(х;;д) =Рл(Х1=х;), 1=1,п, зависит от д.
Поэтому будем использовать следующую форму записи: и и Рл(Х. =х.) = ПР,(Х; = х;) = Пр(хбб), 'Е. Нейман (1894-1981) — америкыкиий математик и статиспи; Э. Ниреои (1857-1936) — аиглийавш математик, биолог и философ. 2.2. Поиитие достаточных статистик что в соответствии с (2.6) приводит к равенству А(х„;д) = Рв(Х„= х„). Если статистика Т = Т(Х„) достаточна, то при любом фиксированном значении 2 из области возможных значений условное распределение выборки Рв(Х„= х„~ Т(Х„) = с) й(х„; д) = Рв (Х„= х„) = Рв(Х„= х„, Т(Х„) = Ф) = = Рв(Т(Х„) = ~) Рв(Х„= х„( Т(Х„) = 2) = д(с,д) Ь(х„), т.е. имеет место равенство (2.7).
Наоборот, пусть имеет место представление (2.7). Тогда нри любом х„, для которого Т(х"„) = Ф, с учетом равенств Рв (Х„= х„, Т(Х„) = Ф) = Рв (Х„= х„) = х,(х„; д) имеем Рв (Х„= х„, Т(Х„) = 2) Р,(Х„=х„!Т(Х.) =2)- Рв(Т(Х )=Ф) д(с, д) Ь(х„) Ь(х„) Х,(х„;д) Е Цх"„;д) Е д(Ф,д)Ь(х ) Е Ь(х )' Т(яо)=С Т(х„)=1 Т(у )а т.е. условное распределение выборки не зависит от д.
Если же х„таково, что Т(х„) ф 2, то очевидно, что Рв(Х„= х„~ Т(Х„) =2) =О. не зависит от д н, следовательно, его можно записать в виде Ь(х„,с) или Ь(х„), так как 8 — фиксированная величина. Пусть Т(Х„) = 2. Тогда для любой реализации х„случайной выборки, удовлетворяющей условию Т(х„) = Ф, событие (Х„=х„) включено в событие (Т(Х„) =2), т.е. (Х„= х„) С С (Т(Х„) = с) и, следовательно, 80 3. ТОЧЕЧНЫЕ ОЦЕНКИ Таким образом, в любом случае условная вероятность Рв (Х„= х„( Т(Х„) = г) не зависит от В, а это и означает достаточность статистики Т(Х„) согласно определению (2.5). > Заметим, что всякая эффентиенал оо Рао — Крамеру оценна В = В(Х„) параметра В является достаточной статистикой.
Зто следует из равенства д(1прв (Х,В)) а(в) (в(х„) — в) = (критерия эффективности олл регулярных моделей, см. замечание 2.6) и соотношения (2.7). Обратное утверждение неверно (см. пример 2.27). Приведем без доказательства следующие утверждения. 1 . Если существует эффентненал оценка параметра, то она является функцией от достаточной статистики.
Из этого утверждения следует, что эффективную оценку следует искать среди функций от достаточных статистик. 2'. Если Т(Х„) — достаточная статистика для параметра В,то таковой же является и любая взаимно однозначная функция от Т(Х„). Нахождение эффективных оценок с помощью достаточных статистик связано с понятием полноты достаточной статистики, которое здесь мы не будем рассматривать, а отсылаем заинтересованного читателя к специальной литературе'.
Замечание 2.9. Определение 2.5 достаточной статистики можно обобщить на случай вектора параметров В = (Вы ..., В„). Векторную статистику т=(т, ..., т,) =(т (х,...,х ), ..., т,(х,",х )) Смо Ивченко Г.И., Медведев Ю.И. 81 2.2. Понятно достаточна!х статистик будем называть достаточной для вектора параметров о, если условное распределение выборки Х„ = (Х!, ..., Х„) при условии Т(Х„) = 1, где Г = (1!, ..., 1„) — некоторое фиксированное значение, ие зависит от параметра о. При этом критерий факторизации — теорема 2.5 — обобщается иа случай векторной статистики.
Ф Как уже отмечалось выше, достаточные статистики позволяют сократить объем исходных данных, сохранял всю содержащуюся в этих данных информацию. Кроме того, один из наиболее уииверсзльиых методов иахождения оцеиок для неизвестных параметров — метод мансаиального праедонодобиц который приводит к оненнаа параметров через достаточные статистики. Приведем примеры, поясняющие смысл и свойства достаточных статистик. Пример 2.8.
Пусть 1х!, ..., яо) — реализация случайной выборки 1Х!, ..., Х„), и случайная величина Х имеет экспоиеициальиое распределение, т.е. х д -е д, х)О; О, х ( О. В этом случае функция правдоподобия имеет вид ЦХ!,...,Х„;В) =Пое ! = — р(- — ~~> Х;), 1 — — ' 1 1 з=! вхп откуда в соответствии с критерием факторизации Неймана— Пирсона следует, что статистика 2. ТОЧЕЧНЫЕ ОЦЕНКИ является достаточной. Здесь роль множителя д(Т(хм..., х„), В) играет все выражение для Ь(хы...,х„;В), а Ь(хм...,х„) = 1. В данном случае существует эффективнал оценка параметра В, выражающаяся через достаточную статистику, а именно: оценка в=-т=-') х;=х, «=1 как было показано в примере 2.6, является эффективной по Рао — Крамеру.