Ю.П. Пытьев, И.А. Шишмарёв - Курс теории вероятностей и математической статистики для физиков (1134036), страница 32
Текст из файла (страница 32)
Множество А Яп .., $,) называется 1ООууо доверительным множеством для О, или, иначе, доверительным множеством уровня у; Пусть $П ...,$л — выборка из распределения йГ(р, оз), дисперсия о' известна. Положим л И(х„...,х„, р) = ( ) ехр ~ — —, ~~~(хт — р)в~. / — 1 В данном случае свойство монотонноати д по и не выполнено. Поскольку статистика л — 21пйефо ..., $„, р) — 2п!п()I2п о) = — ~)~Яр — р)в !=1 зт распределение 7,' с п степенями свободы, определим таблице распределения уз постоянную с из условия Р(т,'< !и с) ='у.
7 Ю. П. Пыеьев, И. А. Швшыерев 193 Тогда неравенство определяет доверительное множество для. 1х уровня у. $17. ТОЧЕЧНЫЕ ОЦЕНКИ Рассмотрим типичную ситуацию, в которой возникают задачи точечного оценивания. Пусть ~= ($г, ..., $,) — случайная 'выборка из распределения г(х, 6), зависящего.от параметра 0= (Ог, ..., 6а)ее6 и т(6) — известная функция, опреде.ленная на 6. „Требуется, вычислить .значение т(0), но аргумент Юеей неизвестен. В . этом случае единственная доступная наблюдению информация.
о т(6) заключена в выборке 4 (и функции' чз(. )), и -лучшее, что можно сделать в такой ситуации, это построить так называемую оценку т(0), основанную на выборке ~. Иными словами, речь идет о йостроении функции 1( ), определенной на выборочном пространстве Д„, с целью использовать ста. тистику г($) вместо т(0). Статистика 1(5) называется (точечной) оценкой т(6), и при этом, естественно, предполагается что распределение 1(Е) в известном смысле концентрируется около значения т(0), где 6 — параметр распределения выборки $.
Прежде чем сформулировать условия, определяющие оценку, рассмотрим несколько характерных примеров. Пусть $= Я„..., Ь) . — выборка нз нормального распределения, У(1а, оз), 0= (Н, аз), 6=( — сгзч.1!<се, 0 коа). Рассмотрим статистику Так как' Ме(а„= — ~~ Ме$1 =р, (2) г=! то, используя 1х, в качестве оценки математического ожидания И=т(0), мы не будем- совершать систематической ошибки в том смысле, что Ма(1а„— 1х) =О. Оценки, обладающне свойством (2), называются несмещеннымн. * МЕ и 0е — обозначения математического ожидания и дисперсии, отвечающих распределению.с(, 8).
194 Поскольку 1 ч'ч 1 Ме(р,— р)' = Пер„= — '~; Оеар! = — а*, (3) .*Ь 1=! то согласно лемме 3 10 1!„ при 膫со сходится по вероятности к р. Это означает, что распределение 11„ при и-!.оь концентрируется около 1!, поскольку при и- со вероятность любого уклонения 1!, от 0 стремится к нулю: Р(~р — 11~)е~0)( ~ -«-'О, п-!-оо, (4) ее! для любого е)0. Оценки, обладающие свойством (4), т.
е. сходящиеся па вероятности к оцениваемому параметру (функции параметра) при объеме п выборки, стремящемся к бесконечности, . называются состоятельными. Это, безусловно, желательное ,свойство оценок, но оно не определяет качества оценки при фиксированном и, если качество определить, например„ как величину уклонения 1! от р и задать числом мв(11, — 11)т. Разумеется, чем меньше ' М,(1!„— 1!)~, тем лучше оценка. В данном случае речь идет о несмещенной оценке, и ее качество определяется величиной дисперсии. Поэтому наилучшую оценку 1! естественно определить как оценку с минимальной дисперсией среди всех несмещенных оценок. Далее мы покажем, что в этом смысле р„действительно наилучшая.
Какова в данном' случае роль несмещенноети? Пусть 'на - основании независимых выборок я! =($!ь ..., Ь'„), ее (Я,. !. ...,~~,),...Де=ф ..., $„„),из распределения Р(л, О) построены оценки 1! Я!), Я'), ..., 1ьф') значения т(0), причем М,1!(й!) =т(0)+еь Р!1!(с!) =о!!~о', 1='1, 2,...,й. ' Тогда'для статистики 'Р = —,~'11(Й 1 чч найдем е й Ме Ти = — ~„Ме 11(У)=т(0) + — лт е! 1 1 %! д, а 195 1 кч Если смещение — д ес не стремится к нулю при Й-~оо .Г аД ! ! то Т, при л-с-оо не сходится к истинному значению т(0). Например, при ес=е, 1 1, 2,...,й, Ть сходится по вероятности к т(8)+е, что, разумеется, нежелательно.
С другой стороны, если е;=О, 1=1, 2, ..., й, то можно говорить о сложе-. нии информации о т(0), содержащейся в независимых не- смещенных оценках 11(ас), /=1, 2, ...,й. о Вместе с тем, очевидно, что если речь идет об оценке ! с минимальным уклонением Ме(1 — т(0))' = ппп Ме И вЂ” т(0))', (5) то при прочих равных условиях дополнительное требование несмещенности может лишь увеличить уклонение (5), так как условие Мс1ы"т(6) сужает класс оценок, по которым ищется минимум в (5).
Более того, 'класс несмещенных оценок может оказаться даже пустым. ' Действительно, пусть, например, $ — число успехов в последовательности л испытаний Бернулли с неизвестной вероятностью успеха р=О, 0<0 с1, н требуется несмещенно оценить т(6) =6-'. Для всякой такой оценки 1Ц) должно выпол, няться равенство М91($) = ХСс„Ос(1 — 6) -с1(1) = 8-1 Сс Е для всех 6~(0, 11. Но, это, очевидно, невозможно; так, для любой функции 1( ) при 8- 0:М,1($)- С„о1(0), а Π— с-с.оо.
Рассмотрим статистику о а,' = — $~Яс — (с„)' = (6) о — 1 аю е — 1 с 1 где 0= Яс, ...,0,) —, выборка из су()с, а'), П! — оператор ортогонального йрое!ктйрования в ст„, введенный в 8 14. Согласно следртвию 1 теоремы 1 $14 статистика (6) имеет распределение (аз/л — 1)Хс„!. Поэтому согласно формуле (53) $9 -з а' Меа, = МХ„', =а!, л — 1 -! ос Я Ре а„= РеХ„' ! = —.ч-О, л-э ос.
О! о †! Следовательно, статистика о ' является несмещенной состоя- 196 тельной оценкой ог=т(8), 0= (н, о'). Однако Ме 1 — 1(/ — Пг) ге ге — аг) =' — 12,(л — 1) + (л — 1)г1— 1 л / лг — 2 — (л — 1) + ое = ~ — — — )хге < Ре 6„, и = 1, 2, .... е4 /2 11 г л 1л лг) Поэтому для каждого л=1, 2, ... статистика о~ = — 1(/ — П,) Цг меньше уклоняется от а', чем о', хотя и имеет сМещение, ибо Мейл = ае — ое/л. Так как Ме(олг — ог) = пг/л-~.О, л-+ оо, г е4 2л — 2 Ре(пл — ог) = Ме(п» вЂ” аг)г — — = — ае-~-О, л-~-оо, лг л' то оценка олг при и-~со сходится по вероятности к а', т.
е. состоятельна. В данном случае смещенная оценка олг диспер- сии а' оказывается предпочтительнее несмещенной о„'. Впрочем, заметим, что статистика ",гг 1(/ — ПО11г л+1 обладает еще меньшим уклонением от'ог, более того мини- мальным среди всех статистик рида сопзЦ~(/ — П~)Цг, 1 ~г 2еа Ме 1 — '1(/ — П,) Це — ог) .
= —. 1 л+1 л+1 Статистики рл и о,' как оценки для математического ожи- дания и дисперсии сохраняют ряд свойств и без предложения о нормальности выборки., Действительно, если $ь, $ ' выборка из произвольного распределения, причем М$; 1г, Р~~=ог, /=1, 2,...,л, то согласно (2), (3) МЙ =р Рр,=ог/л и тем самым р, — несмещенная и состоятельная оценка 1г. Так как согласно определению оператора проектирования Пг 1(/ — Пг) Иг =1( — ) — ПД вЂ” ) Р = л = ~ $ — пг 1г — ~ П, ($ — гп) )г ='~~ К/ — р)' — л 1/ 1 Х Я/ — р)), , л /=! где т = (р, ...,)г), то М!! (/ — Пг) ЦР лог — о'.
197 Слеловательио, и без предложения о нормальности статисти- ка о„в.является несмещенной, оценкой для ов. Однако ника- кого заключения о состоятельности о,в без дополнительных предположений о распределений на сей раз сделать не удаст- ся. Что касается оценок о,в и о в, то в данном случае они утрачивают преимущества перед о '. Итак,.для дальнейшего обсуждения мы выделяем следу- ющие свойства оценок: 1) несмеи)енноствс М,/(5) =«(0); 2) минимальность уклонения: Мв(!(В) — «(0))в-щ!и или, в частности, минимальность дисперсии, если речь идет о не- смещенных оценках; 3) СОстоятельность: !„.($) — ~«(0), п-~-оо. Каждое из этих условий является' ограничением на !($), и далеко 'не всегда можно гарантировать существование оценки с такими свойствами.
! '., Несмещенные оценки минимальной дисперсии Как было отмечено, не всегда можно удовлетворить тре- бованию несмещенности. Однако если существует несмещен- ная оценка минимальной дисперсии (Н..О.М.Д.), то она единственна. Лемма 1. Пусть !1 и !в — Н.О.М,Д. Тогда !1=!в с веро- ятностью единица. - Доказательство. Обозначим Мв!1 — Мв(в=«(0). Тогда и для оценки !в — — 1/2(!«+ !в): Мв!в =«(0). Кроме того, в силу неравенства Коши — Буняковского Рв!в = 1/4 (Рв!1 + Рв!в + 2 сот Щ < ~1/4(Рв/~ + Рв/в+ 2(Рв! Рв/ )пв) = ' (7) ='1/4 ((Рвй~)пв + (Рв! )'м)в Равенство в (7) выполняется тогда и только тогда, когда с вероятностью единица !, — (0) =й(0) (!, —.
(0) ), й(0): о. Обозначим Рв!1=Рв!в=б. Из (7) следует, что Вв!в<!/4(6+ + 6+ 26) = 6 Поскольку !~ и !в — оценки с минимальной дисперсией, должно быть Рв!з~б, следовательно, Рв!в=6. Поэтому в (7) выполнено равенство и, следовательно, с ве- роятностью единица !; — (е) =й(0) (!,— (0)).