Учебник_Бочаров_Печинкин (846435), страница 39
Текст из файла (страница 39)
Обозначим через Х„* максимальный член вариационного ряда. В качестве оценки параметра д возьмем д* п.ь1Х* !ЗЗ 2. Доставгочные оценки Функция распределения Гх. (х) статистики Х„задается формулой Гх (х) = Р(Х' < х) =- Р(Х, < х,, Х < х) = =Р(Х~ <х) Р(Х„<х)=( — ) (0<х<д). Тогда Мтт* = ~ пх г(х =- тт. оэ1 ( х" и ~ гтв о Значит, опенка д* несмещенная. Далее, и ) дв п(п Ч2) о з 0д* = М(яп) — (Мд")т = п (и -~- 2) Мы видим, что дисперсия оценки д* при и — оо убывает, как 1/пт. Такая оценка оказалась более эффективной, поскольку дисперсия эффективной оценки убывает только, как 1/и. Разгадка парадокса чрезвычайно проста' для данного семейства не выполнены условия регулярности, необходимые при доказательстве неравенства Рао — Крамера.
Используя понятие достаточной статистики, в следующем параграфе мы докажем минимальность дисперсии данной оценки. П В заключение этого параграфа отметим, что эффективные по РаоКрамеру оценки существуют крайне редко. Правда, как мы увидим в параграфе 4, эффективность по Рао — Крамеру играет существенную роль в асимптотическом анализе оценок, получаемых методом максимального правдоподобия. Кроме того, существуют обобщения неравенства Рао — Крамера (например, неравенство Бхаттачария (7]), позволяющие доказывать оптимальность более широкого класса оценок.
В следующем параграфе мы рассмотрим другой подход к определению оценок с минимальной дисперсией, базирующийся на достаточных статистиках. Наиболее распространенные методы нахождения оценок приводятся в параграфах 3 — б. Наконец, в параграфе 7 описан подход к построению доверительных интервалов для неизвестных параметров. 2. Достаточные оценки Первый шаг в поисках другого (не основанного на неравенстве Рао — Крамера) принципа построения оценок с минимальной дисперсией состоит во введении понятия достаточной статистики (отметим, что достаточные статистики играют в современной математической статистике весьма важную роль, причем как при оценке неизвестных 184 Гл. 2.
Оценки неизвестных параметров параметров, так и при проверке статистических гипотез). Назовем й-мерную статистику Я = (Яы...,Яь) = (Я,(ХБ...,Х„),,яь(ХБ...,Х.)) достаточной для параметра д, если условное распределение Рх, х„(хы...,хп ~ Я = з) выборки Хы...,Х„при условии о = в не зависит от параметра д. Пример 14.
Пусть Х, — число успехов в 1-м испытании Бернулли (см. пример 1). Рассмотрим статистику Я = Х! е ... 4 Х„ — обгцее число успехов в п испытаниях Бернулли. Покажем, что она является достаточной для вероятности успеха д. Для этого найдем условное распре- деление Р(Х~ = хи, ..,Х„=- х„) Я = в).
Воспользовавшись определением условной вероятности, получаем Р(5 = в) Если х1 Ч-.. 4 х„ = в, то вероятность Р(Х~ =. хи ,Х„ = х„, Я =. в) совпа- дает с вероятностью Р(Х1 = хи, Х„= х ), т, е. Р(Х~ = хы, Х„= х„, Я =- з) = Р(Х~ = хи..., Х„=- х„) = д'(1 — д)" (напомним еше раз, что каждое х, может принимать здесь только значение О или 1, причем х~ + . 4 х„= з). Поскольку вероятность Р(Я = з) определя- ется формулой Бернулли Р(я=в) =- (")дв(1 — д) -', то из (9) получаем, что дв(1 З) — к Р(Х~ = хн,Х„= х„Я = в) = — —— (".)'('-" ' (".Г т е.
не зависит от д. Если же х~, ... Е хк ф в, то Р(Х1 =- тп, Х„=- х,, Я =- в) = О, откуда Р(Х~ = хы, Х„= х„) Я = в) = О, т е. опять-таки ие зависит от д. Таким образом, 9 — достаточная статистика О Очевидно, что использовать приведенное выше определение для проверки достаточности конкретных статистик весьма сложно, особенно в непрерывном случае. Простой критерий достаточности задается следующей теоремой. Теорема 2 (факторизационная теорема Неймана — Фишера).
Для того чтобы статистика Я = Я(ХБ..., Х„) была достаточной для параметра д, необходимо и достаточно, чтобы ряд распределения Р(х1,, х„; д) = Р(хи д) Р(х„; д) в дискретном случае нлн плотность распределения р(хи..., хп; д) = р(хи д) . р(х„; д) 2. Достаточные оценки 185 в непрерывном случае выборки Х!,..., Хв были представнмы в анде Р(х!, ", х»; д) = А(х!,..., хо) В($; д), р(х!,..., хгд д) = А(хг,..., х„) В(В; д), (10) гле функция А(х1,...,х ) зависит только от х1,...,хо, а функция В(з; д) — только от з и д. Доказательство. Для простоты изложения ограничимся только дис- кретным случаем.
По определению условной вероятности, Р(Х» = хы...,Х„= х„! ~В = з) — ' '''''', " "" . (11) Р(9 = з) Очевидно, что числитель в правой части (1!) совпадает с вероятностью Р(Х» = хы..., Х„= х„) в том случае, когда в = В(хы..., х„), и равен нулю в противном. Поскольку событиями нулевой вероятности можно пренебречь, то ограничимся случаем е = Я(т», ..,,х„) и запишем (11) в виде Р(Х» =хм...,Х„=х„~ В= з) = ( ' '* '' " ") .
(12) Р(о = в) Теперь, если  — достаточная статистика, то левая часть (12) не зависит от д. Обозначая ее через А(хы ..,, х„), а Р(Я = з) — через В(а; д), приходим к (10), что доказывает необходимость (!О). И наоборот, пусть выполнено (10) Тогда Р(В=а) = 2' Р(х»,...,х;д) = ю.....*„» зт», .» 1=» = В(е;д) 2 А(хы..,,х„). »....,» Щт... юд=» Подставляя последнее равенство в (!2), имеем Р(Х~ =х»,...,Хч=х (В=в)= = А(хы, .., х„) [ 2 А(ры..., у„)~ ю ...,ж, Я!у», ...к 1=» 3 а м е ч а н и е к теореме 2.
Очевидно, что представление (10) справедливо с точностью до функции у = о(В), зависящей только от В = В(хы, хч). Пример 15. Пусть Хы,Х,» — выборка из генеральной совокупности с теоретической функцией распределения, являющейся нормальной со средним д» и дисперсией да. Покажем, что (двумерная) статистика Я = (оы Яр), где Ь, = — '(Х, + ..+Х„), Яа=(Х, — Я,)з+ .+(Մ— Я)', является достаточной для (двумерного) параметра д = (д», дз) (см. также пример 3 из гл 1). Действительно, плотность распределения р(хы, х„;д) выборки Хы ...,Х„ представима в виде 3 йп!3» — с»01 р(х,, т„; д) = (2ядз) "Г е т.е. имеет вид (10), где А(х»,...,х„) = 1, В(5;д) = (2-гдт) "~ е т.е, не зависит от д, а значит, статистика В является достаточной П 186 Гл. 2.
Оценки неизввотньгх параметров Пример !6. Пусть Х),...,Хь — выборка из генеральной совокупности с равномерным на интервале (О,д) теоретическим распределением (см. пример 13). Покажем, что максимальный член вариационного ряда В= 8(Х,,,Х.) =. Х„' является (одномерной) достаточной статистикой для д. Действительно, вспоминая, что плотность р(х; д) равномерно распределенной на интервале (О, д) величины равна 1,)д при х Е (О,д) и нулю в противном случае, получаем для плотности распределения выборки Хн ...,Х„ выражение ) ) — если 0<х, <д для всех т; р(хн,,.,а;„;д) = д 0 в противном случае В частности, область изменения каждого аргумента х, при отличной от нуля плотности распределения зависит от параметра д.
Рассмотрим функцию о' = Я(хц..., т,„,) .= шах х, ~к кь и положим ) ) ) (-), если О<Я<д; В(о;д) = 0 в противном случае, П 1, если х, ) 0 для всех й А(хы, х„) .= 0 в противном случае. С учетом введенных функций р(хм..., х„, д) = А(хи ., ., х„) В(8, д). Здесь уже при определении функции А(х),..., х„) на х, сверху не наложено никаких ограничений, поскольку они автоматически ограничены своим максимальным значением )д', которое в свою очередь не превосходит д. Но зто означает, что функция А(х), ,х„) не зависит от параметра д и в сответствии с теоремой 2 статистика Я = о(Хн, Х ) = Х„* является достаточной для параметра д. )З Пример 17.
Покажем, что для экспоненциального семейства (7) сушествует одномерная достаточная статистика. Этот факт легко установить, если подставить выражение (7) в формулу для плотности распределения выборки р(хц, .., хнц д) = р(хб д) .- р(х„;д) = 1 ( ) 1 ( ) !вем)-~-...-~-в)*„))А)д)д вгд) Полагая теперь А(хы..., х„) = )г(х1) 6(хь), о — 'о(х~ . ° х ) =о(х))ч ч о(х ) В(8 д) вл!д) ).ьн!д) видим, что одномерная статистика Я(Хп..., Х„) = о(Х)) ч'-... + Я(Х ) 2.
Достаточные оценки !В7 является достаточной для параметра д. сз Как уже говорилось в гл. 1, смысл достаточной статистики Я заключается в том, что она включает в себя всю ту информацию о неизвестном параметре д, которая содержится в исходной выборке Хы..., Хн. Интуиция подсказывает нам: оценка с наименьшей дисперсией (если она существует) должна зависеть только от достаточной статистики Я. И действительно, следующий наш шаг будет заключаться в переходе от произвольной оценки д' к оценке дч, зависящей только от достаточной статистики Ь', причем этот переход совершится таким образом, чтобы дисперсия оценки дь ие превосходила дисперсии исходной оценки д*. Начиная с этого момента и до конца параграфа будем для простоты предполагать, что неизвестный параметр д является одномерным.
Пусть имеется некоторая оценка д* этого параметра, а также (произвольная) статистика Я. Рассмотрим условное математическое ожидание М(д Я) случайной величины д' при условии Я (см. часть 1, гл. 7, параграф 5). Следующее утверждение, играющее основную роль в наших рассуждениях, было получено независимо Д. Блекуэлом, М. М. Рао и А. Н. Колмогоровым. Теорема 3 (улучшение оценки по достаточной статистике). Пусть о' достаточная статистика, а д' — несмещенная оценка параметра д. Тогда условное математическое ожидание дч = М(д* ~ Я) является несмещенной оценкой параметра д, зависящей только от достаточной статистики 5 н удовлетворяющей неравенству (13) Одв ( 0д* прн всех д.














