Учебник_Бочаров_Печинкин (846435), страница 38
Текст из файла (страница 38)
Пример 7. Оценка д* неизвестной вероятности успеха д из примера ! является несмещенной. Действительно, Мд* = — М(Х! ц- ., -ь Х„) = — (МХ! +... ч- МХ„) = МХ = д. О 1 1 и и П р и м е р 8. Выборочные моменты ть являются несмещенными оценками теоретических моментов ть, поскольку Мти!", = — М(Х!ь ц-...
-Ь Х~) = — (МХ!~ ц-... ц- МХ~) = МХь = ты и и Вычислим теперь математическое ожидание выборочной дисперсии о~ ! М т " =- М ( — '((Х! — т" ) -'и ... -'и (Մ— т'1 ~)) = — МХ, — — ~ М(т*Х,) . М(т*) и, и 2 и = итз — —;~ ~ М(Х,Х,) -~ —,;~ ~ М(Х,Х,) = =! т=! = тз — — ~ МХ~ — — ~ М(Х,Х,) = тз — —, ~ М(Х,) М(Х,) = =! и! *й! *й! и — ! и — ! и — ! тз — ги = о' и и и Таким образом, аз* является смещенной (хотя и состоятельной, см. пример 5) оценкой дисперсии о'. Поскольку з и з и — ! то Мвз* = сг з и в~* представляет собой уже несмещенную оценку о.
Можно показать также, что выборочные центральные моменты дь (к > 3) являются смещенными оценками теоретических центральных моментов аь. О Пример 9. Пусть Х!,...,Մ— выборка из генеральной совокупности с теоретической функцией распределения )г(а) = Ф(л; д, о ), являющейся нормальной с неизвестным средним д, Поскольку МХ = д, то оценка д* = д (Х!,..., Х ) = Х! является несмещенной. Очевидно, однако, что она не является состоятельной. 0 Примеры 8 и 9 показывают, что состоятельная оценка может быть смещенной и, наоборот, несмещенная оценка не обязана быть состоятельной. 178 Гл.
2. Оценки нвизвесмных парамвгпров Рассматривая несколько оценок неизвестного параметра д, мы, разумеется, хотели бы выбрать из них ту, которая имела бы наименьший разброс, причем при любом значении неизвестного параметра д. Мерой разброса оценки д; как и всякой случайной величины, является дисперсия Од* = !ь!(д* — !ь1д*)' (дисперсия, как и распределение оценки, зависит от неизвестного параметра д). Однако для смещенной оценки д* дисперсия служит мерой близости не к оцениваемому параметру д, а к математическому ожиданию Мд*. Поэтому естественно искать оценки с наименьшей дисперсией не среди всех оценок, а только среди несмещенных, что мы и будем делать в дальнейшем. Для несмещенных оценок дисперсия определяется также формулой г!д" = М(д* д)2 Имеется несколько подходов к нахождению несмещенных оценок с минимальной дисперсией.
Это связано с тем, что такие оценки существуют не всегда, а найти их бывает чрезвычайно сложно. Здесь мы изложим понятие эффективности оценки, основанное на неравенстве Рао-Крамера. Теорема 1 (неравенство Рао †Краме). Пусть д* — несмещенная бй оценка неизвестного параметра д, построенная по выборке объема и. Тогда (прн некоторых дополнительных условиях регулярности, наложенных на семейство Г(якд)), 1 Од,*., > —, где 1 = 1(д) — информация Фишера, определяемая в дискретном случае формулой 1 = М((1, (Х; д))',)' =- ~- [~'(" ~) ~ Р(Ь!; д).
1=-1 а в непрерывном формулой г — нвь„(хлц',Г- ) (",~"„',~! р(,:,,~|в. Прежде чем переходить к доказательству теоремы, заметим, что по неравенству Рао — Крамера дисперсия любой несмещенной оценки не может быть меньше 17(п1). Назовем эффективностью е = е(д) несмещенной оценки д' величину ! п1 Рд' й Статистические оценки и их свойства 179 Доказательство теоремы !.
Доказательство этой и всех остальных теорем будем проводить (если не сделано специальной оговорки) для непрерывного случая. Это связано с тем, что непрерывный случай, как правило, более сложен, и читатель, усвоивший доказательство для непрерывного случая, легко проведет его для дискретного. Как мы увидим из хода доказательства, условия регулярности семейства Г(х;д), упомянутые в формулировке теоремы, есть не что иное, как условия, гарантирующие законность дифференцирования под знаком интеграла в формулах (1) и (3).
В разных книгах сформулированы различные достаточные условия. Мы упомянем одно из них, приведенное в ]11]: функция р(х; д) для всех (точнее, для почти всех) х непрерывно днфференцируема по д, информация Фишера )(д) конечна, положительна и непрерывна по д. Приступим теперь к собственно доказательству теоремы. Заметим прежде всего, что, дифференцируя тождество [ р(хч д) г!х = ! (1) (в силу сформулированного условия это можно делать), получаем Ю О ( ~ р(х;д) с(х) = [ Ре * р(х;д) с(х = О. — О0 Далее, в силу несмещенности оценки д]„! — — д1„1(Хи...,Х„) имеем Мд,*„,= [ ...
[ д,*ю(хн...,х„)Р(хид) "Р(х„;д)дх, "дх„=д. (3) Дифференцируя это равенство по д и учитывая очевидное тождество др(хыд)" ре(хид)" р(х;д)с(хш с(х„=О, полученное из (1) и (2), находим (2) Г 1(~];и(*п,*-)- ].(хы ) '.хид) '(х.; )) * '.О С' г д .. [ ]д~п>(хн,х~) — д][~ " ]р(хыд)" р(гси,д) с(х1 дх„=!. (4) Ясно, что эффективность любой оценки д* при каждом д заключена между нулем и единицей, причем чем она ближе к единице при каком- либо д, тем лучше оценка д* при этом значении неизвестного параметра. Несмещенная оценка д' называется эффективной (по Рао — Крамеру), если е(д) = ! при любом д. 180 Гл.
2. Ог!анки неизвесшных парамешров Воспользовавшись неравенством Коши-Буняковского а(хн.... х„) 5(хн..., хь) р(хн д) р(х„; д) с(х! г(х„< Ю С Пз < [ ] ... ] а (хн..,,х„)р(хпд). р(хГнд)г1х~ . Их„] х х [ ] ... ] 5 (хн...,х )р(хнд) р(х„;д)г(х~ дх„] при а(хп , х ) = дГ 1(хн ..., х ) — д, б(хн , х ) =- 2 . " «Е(хдд) р(хп д) имеем ! < [М(д,"„, — д)'] ...
] (~""("~')~р(хнд)" р( „;д)дх,".д „] .:о (5) Заметим теперь, что в силу тождества (2) [~ ~е ' ] р(хм д) р(х„;д) г1х~ с(х„= ["" ' ] р(хдд)г(х, =хК = (д*(х) — д) с(д). р(х,. д) При этом оценка дгг,д(хн.,.,хь) должна иметь вид д1.1(х,...,х.) = — (д" (х )+... +д'(х.Н. ! (6) Обозначая (х) = 5( ).
~(д) = ]с(д) дд В(д) = -]де(д) дд и интегрируя уравнение (6), получаем, что необходимым условием существования эффективной оценки является возможность представления плотности распределения р(х; д) в виде р(х, д) = П(х) е' Г ~ (7) где 6(х) и Я(х) — функции, зависящие только от х, а А(д) н В(д) — функции, зависящие только от д. Тогда неравенство (5) можно переписать в виде 1 < и7 ВдГШ, откуда и следует неравенство Рао-Крамера.
!З 3 а м е ч а н и е 1 к теореме 1. Для превращения используемого при доказательстве теоремы 1 неравенства Коши-Буняковского, в равенство необходимо и достаточно существование таких функций д" (х) аргумента х и с(д) аргумента д что 181 А Статистические оценки и их свойства Аналогичное представление для ряда распределения Р(х;д) должно иметь место и в дискретном случае Семейство плотностей или рядов распределения такого вида носит название экспоненциального. Экспоненциальные семейства играют в математической статистике важную роль.
В частности, как мы показали, только для этих семейств могут суцгествовать эффективные оценки, которые к тому же определяются формулой й,*„, = ! (В(Х, ) + .. ч- В(Х„)) (8) дп (появление множителя !,гд связано с неоднозначностью определения функпий 6(х), А(тэ), В(д) и В(х) в представлении (7)). Однако следует помнить, что не для всякого экспоненциального семейства существует эффективная оценка (в принятом нами смысле), поскольку эффективная оценка по определению должна быть несмещенной, что, вообще говоря, нельзя сказать об оценке (8) в случае произвольного экспоненциального семейства. Впрочем, из тождества (1) вытекает весьма простой способ проверки несмещенности (8) непосредственно по А(д) и В(д), заключающийся в выполнении равенства В'(д) = — д дА'(д).
Замечание 2 к теореме 1 Неравенство Рао — Крамера можно обобщить на случай смещенных оценок: 0б,*„, > — ', (1+ б'(б))'. п! И в этом случае неравенство превращается в равенство только тогда, когда семейство распределений экспоненциально. Пример 1О. Рассмотрим оценку д* неизвестной вероятности успеха д в схеме Бернулли из примера 1. Как показано в примере ?, эта оценка несмещенная. Дисперсия д* имеет вид 0ем = 0 — (Л, ц- .. -~ Л„) = —, (0(Х, + .. -Г Х„)) = — =- ) ! Ох в(! — в) и п' и п Найдем информацию Фишера (напомннм, что в данном случае наблюдаемая величина Х принимает всего два значения О и 1 с вероятностями Р(0;д) = =- 1 — д н Р(1; д) = д соответственно): 7= [;( )~ .
(О!б)+ ~ '( )~, (!1В) = Таким образом, е(гэ) = 1 и, значит, оценка с!* эффективная. П р и м е р 11. Рассмотрим оценку гз* неизвестного среднего нормального закона нз примера 2 Поскольку эта оценка представляет собой выборочное среднее, то в соответствии с результатами, полученными в примере 8, она является несмещенной. Найдем ее эффективность. Для этого прежде всего заметим, что 0К = О) -' (Х, + .. + Х.)1 = 0— = —. гп п п Далее, 1пр(Х,тэ) =- 1и р(Х,д,е ) =- — !пъс2»сг' — — —,—, 3, (Х вЂ” зэ)з 2т 182 Гл.
2. Оценки нвизввстньгх паралзвтров ()пр(Х;д)) =,, [(1пр(Х;д)) ] в в (з)з 118Х д)е У = М [(В Р(ХГд))в) = ( з т ) =-,, =-, е(д') = 1. (и) (в) в И в этом примере оценка д является эффективной. С1 П р и м е р 12. Оценим неизвестную дисперсию д = ОХ нормального закона при известном среднем т. Плотность нормального распределения предста- вима в виде з1*1 л1в1+ в Щ1 где В(х) = (л — гп)а А(д) = — — —, В(д) = — 1п чт2хд, 2д ' т.е. по отношению к неизвестной дисперсии д принадлежит экспоненциальному семейству.
Поэтому эффективная опенка д дисперсии д должна по формуле (8) иметь вид д* =- [В(Х~) ч-... Н- В(Х„)) =- 2 '(Х, — т)з. дп дп С другой стороны, нетрудно видеть, что д А'(д) = -В'(д), откуда следует несмещенность оценки д* ' ~(Х, т)з и и, значит, ее эффективность. Впрочем, эффективность оценки д* легко установить и на основе неравенства Рао-Крамера. Пусть теперь мы оцениваем не дисперсию, а среднее квадратичное отклонение д = ЛХ . И в этом случае имеет место представление (7), только теперь А(д) = —,, В(д) = — 1птг2хдз. 1 2дз Поэтому равенство ддЛ'(д) = — В'(д) не превращается в тождество ни при каком выборе д, и, значит, эффективной (в смысле Рао — Крамера) оценки среднего квадратичного отклонения нормального закона не существует.
Рассмотрим оценку д* = ()' —" [2) — 2 (Х, — тп)з, 2 Г[п~-1) и равную корню квадратному из оценки дисперсии с точностью до постоянного множителя -„Гп12 Г(ттГ2)гГ((п Н- 1)12). Читателю предлагается проверить, что оценка д* несмещенная Кроме того, в следующем параграфе будет показано, что среди всех несмещенных оценок среднего квадратичного отклонения д она имеет минимальную дисперсию (хотя и не является эффективной). Пример 13. Пусть выборка Хп.,.,Хп произведена из генеральной совокупности с равномерным на интервале (О, д) теоретическим распределением. Оценим неизвестный параметр д.















