М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 27
Текст из файла (страница 27)
Тогда, разложив опре- делитель в (52) по последнему столбцу, получаем для х,яЛ" А»>о'> (хл) + ... +А„Ч>',(х,) О, (53) где А;,=А„(х>,...,х,,) — алгебраические дополнения соответ- ствующих. эо>ементов определителя (52). Так как по предположе- нию индукции Лл,=д(ф>, ..., >р. >)/д(х>, ..., х, >) ЧЬО, о ,о о .о то найдутся такие значения х>, ..., х, > что А„=-А„(х>, ..., х,' >) 40. В таком слУчае из (53) полУчаем Аопф,(х,)+ ... +А,',>р,.(х,)=-сопэ1, А,',чьО, что приводит к противоречию с линей- ной независимостью функций 1, >1>(х),...,>р,(х).
й >7. ДОСТАТОЧНОСТЬ Н НЕСМЕЩЕННОЕ ОЦЕННВАННЕ 1. Полные достаточные статистики. Рассмотрим статистическую модель (й', Я, (У)). Мы уже встречались с различными примерами числовых функций ч (Р) неизвестного распределения вероятностей выборки Р, которые требуется оценить по результатам наблюдений. Так, в модели независимых повторных испытаний обычно представляют интерес математическое ожиданяе и дисперсия отдельншо наб;ьмення. О параметрических моделях (Ф, Я, (Ря, 9ы(ч)) возникает задача оценнвання различных числовых функций Ч(9) от неизвестного параметра 9. Различают оценки точечные, когда по выборке х вычисляется зиаченгс 1 некоторой статистики Т(х) и это значение 1 предлагается н кзчестве приближения к неизвестному ~((9)(ч(Р)), и оценки пм;»двпланс г, когда по выборке х строится интервал (Т~(х), Т:.(х)), любая точка 1 которого рассматривается как возможное значение неизвестного ф (9) (я (Р) ) .
с делаем замечание о терминологии. Ва::нпзясь зала:сй»очсчиого оценяванпя, приходится рассматривать различные статистики Т(э1 ьак возможные оценки ф(9) (а(Р)). Принято в таком случае, вне зависимости от того, насколько хорошо Т(х) приближает негзэегтпую фупкцию, называть статистику Т(х) оценкой. Определение !. Оценка Т(х) функции ~р(9) (ф(Р)) называется несиещанной, если йй Т(Х) = р(9), 9 =- ~ (М Т(Х) =в(Р), Рая (Р)), где Х вЂ” случайная выборка.
Несмещепные оценки не всегда существуют, но в случае, когда онп имеются, естественной мерой качества оценка служит ее дисперсия 09Т(Х), 9ея6 (1»эТ(Х), Ра(Р)). Будем рассматривать для определенностя параметрический случай. Допустим, что Б(х) — достаточная статнстяка в модели (Я',Ф,(Ря. 9ы6)). Так как, по нашим представлениям, 9(х) содержит всю информацию о 9, содержащуюся в выборке х, то, решая задачу оцениванпя ф(9), по-видимому, целесообразно рассматривать лишь статистики вида 9(3(х)) — функции достаточной статистики В(х). Представляется, что пря этом суженяи класса рассматриваемых оценок мы не должны потерять в качестве: если Т(х) — оценка с определенным значением какого-то критерия качества, то должна найтись оценка вида 9(3(х)) с таким же или лучшим, чем у Т(х), значе.
нием этого критерия. Мы убедимся в справедливости этого утверждения прп решении задачи несмещенного оценивання, когда за критерий качества принята величина дисперсии оценки. Л пока заметим, что многие оценки, встречавшиеся нам в первых двух главах, являются функцнямн минимальной достаточной статистики (см. $ !5, 16). Переход от произвольных статнстяк Т(х) к функциям от достаточной 9(9(х)) облегчает решение задачи оценпвання, если статистика 9(х) существенно сокращает данные, например, когда размерность 3(х) невелика н не зависит от размерности выборки.
В»том случае можно надеяться, что условие несмещенности мяд(9(х))- р(9), 9ее, (1) оассматряваемое как уравнение относительно неизвестной функ- 153 ц;и й'(з), можно решить, а в множестве его решеннй отыскать оценку с мнннмальной днсперсней.
Рассмотрим пример. (1) Пусть »в =1!!л, (х,ямал !х!>О; (=1,,п), Я ЯлП(гл+, семейство Р», 0>О, задается л-мерной плотностью (о(х„)=0" ехр ( — 0 Е х;1, х„~ Я", ! ! так что случайная выборка Х, = (Х!,..., Х,) состоит нз незавнснмых сл. в. с плотностью распределення 0е-", х>О, каждая. Достаточная статистика: 3(х„) =~ х!. Запишем уравненне (1) ! ! д р(0) =0: Мой(у Х!1=~0'(з)у»,„, ( )!Ь=б, 0>О. (2) ! ! о Так как 5(Х„) имеет распределение С(0, я) с плотностью (см. пп. 1,2 $7) У» — — Е!-$е — !ь, 3 > О, Ел з!хл! 1 (л) то уравнение (2) прнннмает внд (3) ) я(з) з'-! е»'сЬ =0-л+' Г (л), 0 > О. о (4) Еслн я(з) — решенне (4), то, нзменнв его произвольным образом на множестве меры Лебега нуль, мы снова получнм решение уравнення (4).
Оказывается, что с точностью до такого рода неоднозначности уравненне (4) имеет единственное решение, которое нетрудно найти. Действительно, заменнв в (3) п на и — 1, за- пншем Ф-ое 0'Ь=1, 0 >О, Вл-! Г(л — 1) о нлн 154 — е'-!е о*гЬ=0 +'Г(л), 0> О. (5) о Г(л — 1) Сравнивая (5) с (4) н замечая, что Г(л)=(л — 1)1, находим решенне уравнения (4): й'(з)=(" — 1)! . Таким образом, несмещенная оценка параметра И, яваччаоачгн функцией достаточной статистики, имеет вид л 8 (х„) = (л — 1)(~!' х;.
Стоит отметить, что О-' является средним значением отдельного наблюдения н известной оценкой 0-' является выборочное л среднее х= Я х;!л, которое есть, кстати, функция достаточной ! ! статистики. Однако попытка оценить 0 с помощью (х)-', как видно, приводит к смещенной оценке. Полагая Ь(з)=й'(з)з"-!, ф(0)=0 «'!!"(л), перепишем уравнение (4) в виде ~Ь()е-*а = р(8), 8)О. (7) о Проверим, что уравнение (7) имеет не более одного решения Ь(з) (с точностью до его изменения на множестве меры нуль).
Функция ф(0), определенная формулой (7), называется преобразованием Лапласа функции Ь(з). Существуют различные способы обращать преобразование Лапласа — находить Ь(з) по ф(0). Мы используем вероятностный подход (смл Феллер 12), т. 2). Дифференцируя (7) Ь раз по О, находим (0) (11) 155 ( — 1)«ф!«> (8) = ) Ь (з) з'е-в' й. (8) о Домножим (8) на О«/Ь! и просуммируем по Ь~Ох: Š— '". : 8«ф!«>(8) = «!'Ь(з) %~ — '' е-о*г(з.
о! ,) 4еи о! «~в« о «<в Мы покажем, что при 0-«+со (Зз)«в, О, если з)х, (10) И 1, есля з(х. откуда будет следовать, что при О-«оо « Е '." '1' О" р!">(8)- $Ь(з)!(з=Н(х), м «<в« о г. е. первообразная Н(х) функции Ь(х) однозначно восстанавливается по преобразованию Лапласа ф(0). Как известно, функция !!(х) восстанавливается по Н(х) с точностью до ее значений на множестве меры Лебега нуль.
Остается проверить соотношение (1О) Левая часть (1О) равна вероятности того, что пуассоповская сл. в. Х с параметром Оз приняла значение, не превосходящее Ох. По неравенству Чебышева Я((Х-Оз(~а) ~а тОз, откуда при х(з я(Х~О.т) =.Р(Х-О .~О( — )) ~з)(О(я — )) О, О- а прп х)з ж(Х < О. ) =: 1 — «О' (Х > О. ) = 1 — Р'(Х вЂ” О- > О (.' — )) = гэ 1 — Оз«(0 (я — з)~) 1, Π— со. Единственность решения уравнения (7) можно выразить в следующей Форме: если Л(з) такова, что ~Л(з)е-«а«(э=0, О > О, о то 1«(з)=0 всюду, за исключением множества меры нуль. Определение 2.
Семейство распределений Яв, О«иб, иа измеримом пространстве Щ,,«Ф) называется полна«м, если для любой измеримой функции Л(у) уравнение й)вЛ (т') =О, Оен 6, (12) где т' — случайный элемент в (ф, .Ф, Я,), имеет только нулевое решение Л(у)=0 с точностью до изменения Л(у) на м««ок«естве Яв-меры пуль прп люоом Оен6. Будем говорить, что уравнение Мед(7) = «р(О), Оен 6, имеет суще«геенно единственное решение, если для любых двух решений н,(у), дс(у) этого уравнения множество (у: Ы«(у) ~йт(у) ) имеет Яв-меру нуль при любом Оеи6. Если семейство распределений Яв полно, то решение уравнения несмещенности Мвд(У) = р(О), О ен а, существенно единственно.
В самом деле, пусть й«(у), й"(у)— два таких решения. Тогда Л(у) д«(у) — й«т(у) является решением уравнения (12), и, следовательно, множество (у: Л(у) = О) имеет Яв-меру нуль при каждом бе=6. ° Как мы внделн в примере (1), семейство распределений ««(О, и) полно на (Р«, Я«). Семейство распределений Р„в том же прн- 156 мере не является полным на ()г", Я„), л)1, так как, скажем, Мо (Хг — Хг) =О, 6яЕ. Определение 3.