4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 13
Текст из файла (страница 13)
Тогда функция правдоподобияя 1,'Ол при х! >=- !пах х 6 Л(х; 6)= х !<!<л 0 в противном случае, или Е(х; 9)=е(8-х!.!)/О", где е(х) — функция Хевисайда [сы. (1.5)1. На основании критерия факторизации отсюда имеем, что Т (Х)= ' (а) = Х, т. е. максимальное значение выборки является достаточ- ной статистикой для 9. Аналогично, для общей равномерной модели /7(0м О,) функ- цию правдоподобия можно записать в виде 7. (х; 9) = е (О, — х,„!) е (х„! — 6,)/(9, — 9,)"; следовательно, статистика Т=(Тм Т), где Т,=Хоп %е=Х<„1, достаточная для 8=(бм 0„). Пример 2,0 (равномерная модель (предолхсение)). Рассмотрим модель /7(а(0), Ь(6)), где а(9)«-Ь(9), т/О,— заданные непрерывные функция скалярного параметра 9. Как и в примере 2,8, можно записать 7.
(х; 8) =е(хм — а(9)) е(Ь(9) — х<„;)/(Ь(0) — а(0))". (2.37) ( тедовательио, двумерная статистика Т= (Хпь Х!„) является достаточной для 6. Выясним теперь, нельзя ли найти в данном случае одйомерную, т. е. более экономную, достаточную статистику. Числитель в (2.37) равен 1 тогда и только тогда, когда (х » --а(8), Ь(6) ~х,„;). (2.38) Пусть а(б) 1. Ь(0)1 с возрастанием О. Тогда условие (2.38) эквивалентно условию (9 ==а-'(х,„), 9 ==: ь-!(х,„!)) со [О==тт(х) =поп(а '(х и), ь-!(х!„!))). Таким образом, соотношение (2.37) можно записать в виде /,(х; 8) = е (Т, (х) — 6)/(Ь (8) — а (6))", откУда следУет, что Т,=Т,(Х)=ш)п(а '(Х„,), Ь !(Х,„,)) о„и .
мерная достаточная статистика для О. Аналогично, если а(9) 1, Ь (8) т с возрастанием 8, то пдпомер иая достаточная статистика имеет вид Т. = Т,(Х) =!пах (а-'(Х,п), Ь-'(Х,„,)). Эти два случая исчерпывают ситуации, когда в модели /( (а (6), Ь(0)) существует одномерная достаточная статистика.
Обратим внимание на то, что как Т„так и Т, являются функ- пнями исходной двумерной достаточной статистики Т=(Ха!, Х!„!). Это обстоятельство имеет общий характер, т. е. х!инймальная достаточная статистика есть функция любых других достаточных статистик. В частности, для равномерной модели с иулевь!и сред- ним Й( — 6, 9) одномерная достаточная статистика Т, принимает вид Т. = шах ( — Ха!, Х<,!) = шах (, 'Х,!! (, ) Х<„! '), а для модели Р(9, 0+!) одномерной достаточной статистики не существует. Пример 2.10 (модель Коши, достаточная стапшстика для нее). Для модели Коши Л'(9) функция правдоподобия имеет вид яя Ц ! + [ч — 6) ь' !=! и здесь нельзя найти статистику Т, дающую факторизацию (2.36)„ размерность которой меньше и. 2.
Достаточные статистики и оптимальные оценки. Роль достаточных статистик в теории оценивания раскрывает следующее утверждение. 67 Теорема 2.8 (Рао — Блекуэлла — Колмогорова). Оптимальная оценка, если она существует, является функцией от доспдаточной статистики ". П Пусть Т=Т (Х) — достаточная статистика и Тд = Т, (Х) — цро- иэвольная несмещенная оценка заданной параметрической функ- ции т(0). Рассмотрим функцию Н (д) = Ее (Тд ~ Т = () = ()Т, (х) Е (х1д; 6) г(х.
Эта функция не зависит от 6, так как условная плотность д'. (х1(; 6) от параметра не зависит. Далее, статистика Н(Т (Х)) является также несмещенной оценкой т(0), Действительно, если й(й 6)— плотность распределения статистики Т(Х), то ЕеН (Т(Х)) = ) Н (() й ((; 6) Й = ~ Тд (х) [) Е (х ( (; 6) д ((; 6) Й1 дх = = $Т,(х) Е(х; 0)дх=ЕвТ,(Х)=т(6). Наконец, справедливо неравенство В,Н (Т(Х)) В,Т,(Х), 'УВ, причем равенство имеет место в том н только в том случае, когда Тд=Н(Т). Для доказательства этого заметим, что ОеТд = Ее[Тд — Н(Т)+ Н (Т) — х(0)1а= = Ее [Тд — Н (Т)дда + тчдеН (Т) = гд еН (Т), поскольку математическое ожидание произведения Ее[Тд — Н (Т)ИН (Т) — т (0)) = Ее[(Тд — Н (Т)) Н (Т)[ = = ).[Ее(Т, ~ Т=() — Н(()[Н(()й((; 6) д(=О.
В предыдущем неравенстве знак равенства возможен только ° в случае Т, = Н (Т). Таким образом, для любой несмещенной оценки т(9), не являющейся функцией от достаточной статистики, можно указать несмещенную оценку, которая зависит от доста- точно(д статистики и имеет дисперсию меньшую, чем исходная оценка.
Следовательно, оптимальную оценку надо искать среди функций от достаточной ппатистики. ° При отыскании явного вида оптимальных оценок важную роль играет свойство полноты достаточной статистики. По определению, достаточная статистика Т=Т(Х) называется полной, если длн всякой функции гр(Т(Х)) из того, что Еур(Т) =О, 'УВ, следует гр(() =— О на всем множестве значений статистики Т**. ' Частный случай этого утверждения об эффективных .оценках был отмечен в п. 1. *ч Зго утверждение понимаетея в том смысле, что Ф РЕ (Х дм (х: др(Т (х)) ~ 0)) =О, УЕ. Т 2г9. Если существует полная двстапдочная с функд(ия опд нее является огдгггд лдагпе,иатического ожидания, ЫПстьТ= У ь Т=Т(Х) — полная достаточная статистикаи Н(Т)— произвольная функция от Т. Обозначим ЕеН (Т) = т (0). Из условия полноты следует, что Н(Т) — единственная функция от Т, удовлетворяющая соотношению (2.39), так как если бы была еще какая-нибудь функция Нд(Т), удовлетворяющая (2,39)„ Е,[Н(Т) — Н,(Т)[=О, 'УВ, откуда Нд(()и— м Н(().
П о теореме 2.8 оптимальную оценку т (0) надо искать в классе от функций, зависящих от Т. Но Н (Т) — единственная ф Т, несмещенно оценивающая т(0); следовательно, она и являелся искомой оптимальной оценкой. ° ; ост Итак, пусть в рассматриваемой модели Р существует д аточная статистика Т и требуется оценить з у ствует полная метрическую функцию т(6). Тогда: .*ить задайную па а.*ить з у р () если существует какая-то несмещенная оценка т(6) це уе смещенная оценка, являюи(аяся функцией от Т; т, то су.
можно также сказать, что если нет несмещенных оценок вида Н (Т) (т. е. уравнение (2.39) не имеет решения), пю класс аУ несме. гг(енных оценок т(0) пуст; пю класс т несме. 2 гнк иейо ) оптимальная оценка (когда она существует) все д ф1 ц " т Т, и она однозначно определяется соопдняиение,и (2.39); всег а является 3) оптимальнуто оценку т* можне искать по формуле т* = Н (Т) =- Ее (Тд ~ Т), исходя из любой несмедценной оценки Т, функции т(0). В конкретных задачах прн отыскании оптимальных оценок последний критерий используют редко, так как вычисление условного математического ожидания обычно соп яже ческнми т нос сопряжено с аналити- (2.39 кот ое в рудностямн.
Чаще решают непосредственно уравне ), ор развернутой форме для абсолютно непрерывной нне модели имеет вид $Н(()д((; 0)д(=т(В), деВ гн 9, где й(й 6) — плотность распределения достаточной статистики Т. Для дискретной модели интегрирование в левой части ( . ) вменяется суммированием. Это уравнение в дальнейшем будем называть уравнением несмещенности. Его можно решать различными способамн, например разлагая правую н левую ю чеву10 чисти од;0 р д по степеням 9 (в случае аналитических фун й (6) (; )) и приравнивая соответствукицие коэффициенты. Таким образом, Т также имеет распределение типа степенного ряда.
Пусть, далее, /ь(1) — произвольная функция, заданная на множестве (п1, п1+1... ), и такая, что Еь/р(Т)=0, ч9 ~ В, т. е. 'Я ц (/) Ь, (1) 8' = О, Ч8 ен/д. /=г/ Отсюда следует, что /Г(/)=О для всех 1, для которых Ь,(/)чьО, т. е. /р(1) =О на множестве всех возможных значений Т. Таким образом, Т вЂ” полная достаточная статистика. Пусть теперь требуется оценить параметрическую функцию т(8), представимую в виде сходжцегося на В степенибго ряда: т(0) =,Я а/0/.
Из формулы (2.42) следует, что в данном случае /=г уравнение несмещенностн (2.40) можно записать в виде Я О(1 Ь (1) 8/=) (0) (0) = ~Ч", Ь„(/) 0/,», а/0/ /= / /= / ь — и/ 0ь ~", а/Ь„(й — 1). а/+г г=г приравнивая соответствующие Поскольку зто тождество по 0, коэффициенты, находим / — л/ Н(1)Ь (/)— 1~п1+г, 0 при 1(п1+г. Отсюда получаем, что оптимальная оценка т" для функции т(0) имеет вид г -г/ Ь; (Т) ~, а/Ь„(Т вЂ” 1) ть = ЩТ) = 0 .ри Т=п'+' 43) (2.43 прн Т(п1 +» В частности, если т(0) =0' при некотором »~1, то Ь„(Т вЂ” г)/Ь„(Т) при Т ~ п1 +», (2.44) О при Т(п1+г. Таким образом, для важного класса дискретных распределений типа (2А1) можно строить оптимальные оценки для произвольных параметрических функций, представимых в виде степенибго ряда от 0. Пример 2.13 (пуассоноьская модель, оценивание параметрических функций).
Пусть Х =(Х„..., Х„) — выборка из распределения Ж($) ев П(0).,Требуется оценить вероятности появления отдель- иых значений $, т. е. фУнкцни Яь(9) =е-збьуй1, Й=0„1,.... Здесь го пь(8) = —, »' ( — 1)/-" —., т. е. л! л,л 1/ — Ф)/ ' //л (†/У ' а/= —...,, /=й, 8+1, .... Далее, г" (9) =е, позтому Ь,(/) =-и//11, 1=0, 1, 2, ... Под ав эти значения в формулу (2.43), находим, что оптимальная оценка яь имеет вид т Отсюда следует, что при заданном значении Т отличными от нуля являются значения оценок пь только для Ь=О, 1, ..., Т. По теореме 2.3, оптимальной оценкой некоторой суммы вероятностей пь(0) является сумма соответствующих оценок пь.
В частности, статистика г Х .- —.) ! ~г-ь Сг- '1 — — ) при Т~г ь=г О при Т(г оптимальнаЯ оценка длЯ с(0)=Ргали~») — ~' п„(0) *=г Пример 2.14 (отрицательная биномиальная модель, оцениваем параметра). По выборке Х = (Хь ..., Х,) требуется оценить параметр 9 модели 1/1(г, 8). Здесь )" (0) = (1-0)- = „'У', С'.,+,,8, г а 'г() С"' '-г — /г . =О (г 2 ° °, пОэтОму по формуле (2 44) имеем, что оптимальной оценкой т(8) =0 является статистика Т/(Т+пг — 1) прн Т= 1, 0 при Т=О. Пример 2.1$ (равномерная-1 модель, оцениванав параметра).
По выборке Х=(Х„..., Х„) требуется оценить параметр 9 равномерного распределения Я (О, 0). В примере 2.3 было показано, что Т= Хоп — достаточная статистика для 9. Убедимся в ее полноте. По формуле (1.21) плотность распределения величины Т равна у (1; 0) = /.-'/0 , О . 1 9.