М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 29
Текст из файла (страница 29)
В теории вероятностей так определенную 6(Т(х)) называют условным математическим ожиданием 5(х) при условии Т(х), нлн, иначе, при условии разбиения (Й'~), и обозначают д(Т (х)) = Я (5(хКТ (х)) = й16(5(х)1(Ж~)). (30) Индекс 6 в обозначениях (30) имеет чисто формальный смысл: объект, определяемый формулой (30), от 9 ие зависит. Однако если статистика Т(х) не является достаточной, то условное математическое ожидание (30), вообще говоря, зависит от 6 и уже не представляет такого интереса для математической статистики. 3.
Наилучшие несмещенные оценки в непрерывной модели. В случае непрерывной модели (Я", Ж„(Р„, 9~6)) мы рассматриваем лишь такие достаточные статистики Т,(х,) =(Т,(х„),...,Т,(х,)), что отображение й=Т;(х„), 1=1,...,г, можно дополнить некоторыми статистиками У,,(х„) (У|(х,),..., ..., У,,(х,)) до взаимно-однозначного преобразования всего пространства /г" (кроме, быть может, множества Р„-меры нуль), н это преобразование регулярно, так что можно делать обычную замену переменных в интегралах (см. $16). 164 Прн больших 1 д(1) т 1(и+1)/п.
Если Т(х) — достаточная статистика для дискретной модели (Х, М, (Рь, 6еп8)), то для любой статистики 5(х) можно рассмотреть статистику п(Т(х)), определенную формулой (23): Рассматривая различные несмещенные оценки 5(х„) параметрической функции ~р(8), мы будем предполагать, что отображение (1„з) =(Т,(х„), 5(хл)) также можно дополнить до регулярного преобразования всего Яо. Из определения достаточности Т,(х,) вытекает, что условная плотность в Уих„ит,(хо) Ф 1.) = у (М 1х) не зависит от 8.
Т е о р е м а 3. Пусть Т,(хл) — достаточная статистика в непрерывной модели (Яо, Ф„, (Р . 9 е= 6)), 5(х„) — несмещенная оценка п(9) и пара Т,(х,), 5(х,) удовлетворяет сформулированным выше условиям регулярности Полоясим й(1,)= ) ~(з11,)йг, (32) где условная плотность )(г)1,) определена формулой (31). Тогда статистика у(Т,(х )) несмещенно оценивает ~р(9): 0 д(Т,(хл)) <0 (5(Х„)), (33) и равенство достигается лишь при условии совпадения й(Т,(Х„)) и 5(Хх) с Р -вероятностью единица. Если к тому асе статистика Т,(хл) полна, то д(Т,(хл)) — существенно единственная оценка ц(9), являющаяся функцией Т,(х„), и она имеет наименьшую дисперсию в классе несмещенных оценок. Функция у(1,) можег быть найдена по формуле (32) либо «ак существенно единственное решение уравнения 40 о 8(9) =Май(Т,(Х„))= ) ..
) Ы(1,))т(х„1(1,)й1,... Й„8еиет. (34) Доказательство проводится аналогично дискретному случаю с заменой сумм на интегралы. Имеем с учетом (31) Май(Т,(Хо))= ) .. ) ~тВрх,р(1,)й1з ° й1, ) гу(з11,)йз= = ~ ... ~ 4жхльт,(х,р(з, 1,)йзй1,...йг„= г в =- ) гйг ) ... ) Ьхльт<х,з(г, 1,)Й,... й1,= = ~ 4<х„>(з)й= р(8). 166 6 М. В. Козлов, А. В. Прохоров Для дисперсии оценки 5(х„) получаем 0а5(Х„).=- ) (з — %(9)) 7з<х ) (з)дз=- ,) (з — <р (8)) 7за<хиьт <хл< (з' 1') д~ <(1< ' ' ' д< В Ф с = ) ...
) 7, „„,д1,... д1, ~ ( — р(е» 0511,) дз. О Р Преобразуем интеграл по з в (35) к виду ) ((з — у (1,))з + 2 (з — д (1,)) (д (1,) — <р (8) ) + т (Ы(1,) — <р(6)) ] < (а~1,) <(з. (35) Ы(1<) = ) л(У)7т<х„нт,<х,р(У11,)<(У Ф (38) Таким образом, теорема 3 справедлива и для всех статистик указанного вида Ь(У(Х )). Замечание 2. Отметим, что, как н в дискретном случае, статистика у(Т,(х.)), определенная в (32) нлн (38), называется услоень<.и математическим ожиданием соответственно Ях„) или й(У(х„)) при условии статистики Т,(х„).
Обозначение: М (5(х„)1Т,(х„)) нли М (й(У(х„))1Т,(х„)). 9 Используя теорему 3, получаем, что в примере (1) оценка (6) — наилучшая. В примере (Ш) повторной выборки нз рас- 166 Ввиду (32) интеграл от среднего слагаемого в (36) обрашается в нуль. Подставляя (36) в (35), получаем (Уа(8(Х„)) -=(УаУ(Т,(Х„))+Ма(3(Х„) — У(Т (Х„)))~, (37) откуда следует неравенство (33). Наконец, если статистика Т,(х,) — полная, то решение уравнения (34) существенно единственно, так что при любой несмешенной оценке 5(х„) формулы (3!), (32) определяют сушественно одну и ту же функцию у(1,), н тем самым дисперсия оценки д(Т,(Х„)) минимальная.
3 а м е ч а н и е 1. Пусть Т,(х„) — достаточная статистика, а У(х„) — такая статистика, что отображение (1„у) = (Т,(х„), У(х„) ) можно дополнить до регулярного преобразования всего )с". Пусть несмещенная оценка й(У(х„) ) ие обязательно имеет плотность, например принимает лишь дискретные значения. Прокматривая доказательство теоремы 3, легко убедиться в том, что оно сохраняется при замене 5(х») на Ь(У(х,)), если положить пределеиия с плотностью о-'ехр(<г' (х — р) ), х) р, наилучшие линейные несмещенные оценки о и р, полученные в $11, являются наилучшими в классе всех иесмещенных оценок. То же верно для повторной выборки из распределения Н(р, оз): выборочные среднее н дисперсия — наилучшие несмещенные оценки. ° Рассмотрим дополнительные примеры. (ЧП) Нормальная линейная модель в общей форме: Уу' (у) =-(~2иа) "ехр ( — — !!у — ОХ !!з) (39) за' с матрнцей Х полного ранга приводится с помощью невырожденного линейного преобразования переменного у и невырожденного линейного преобразования вектора параметров 0 к канонической форме (см.
п. 5 $ !О, пример (Ч) 9 16): (й' (и) =-(~2и о) ехр ( — — ~~ (и; — ф)' — — ~„ит), (40) 1=! 1 к+1 Оценки наименьших квадратов Оь 1=1, ..., г, о' образуют (г+1)« мерную достаточную статистику в модели (39) (см. пример (Ч) $16). Ее полнота вытекает нз полноты соответствующих оценок в преобразованной модели (40), которые имеют впд ф;(и)=-иь 1=1, ..., г, оз(и)= — ~ из. (41) ! ъч а — г ! гт! Для г=1 полнота статистики (41) доказана в примере (1Ч); для г)! доказательство полностью аналогично счучаю г=1. Таким образом, найденные в $9 линейные несмещенные оценки О, о' для нормальной модели (39) являются оценками с минимально возможной дисперсией в классе всех несмещенных оценок, а не только оценок, линейных по наблюдениям.
(Ч111) Рассмотрим, как в примере (1), повторную выборку из распределения с плотностью 0 ехр( — Ох), х)0. Статистика 5(х„) = =ах как было показано, — полная достаточная. Параметрическая функция ф~(0) =ехр( — О!), где !)Π— любое фиксированное число, допускает несмещенную оценку. Действительно, положим ~1, если х, >1, 1 !'»'! ! О, если х, к, 1, тогда ййаl(„,) =Р (Х, > !) = %т (О), — оо ( О ( оо. 167 ь' Следовательно, наилучшая несмещенная оценка >р>(6) может быть получена в виде (см. замечания 1, 2 к теореме 3) 51в (1(х )> 13 (х„)). (42) Как показано в лемме 2 $5, условная плотность 7х,>з>х„> (х, 1з) (43) совпадает с плотностью У<п, где У>, Ум...,У > независимы и равномерно распределены на (О, з).
Но ~(Уп,~и) У(У,)и...,,У„,)и)- (44) - ((з — и)!з)"-', 0(и(з, так что плотность (43) равна (и-1)з-™+>(з-х>)" з, 0<х><з. (45) По формуле (38) получаем 8 (з) = ~ > (,)>) 7х,>з>х„> (х> ! 3) >(х> —— 0 = ~ 1(,,1(п — 1)» +' (з — х>)" зпх,. (46) й Если з(>, то у(„,) =0 при 0(х>«з и, следовательно, п(з)=0.
При 0(т~з имеем 1(,,,) =1 при 1к х>(» и у(, =0 при 0(х>(~, так что интеграл (46) равняется в этом слу- чае интегралу от плотности (45) по области 1(х> с.з, т. е. равен вероятности (44) при и=5 Таким образом, 0 при»ч~ 1, й(з)= (1 — — )" ' при з)1. 3 Наилучшая несмещенная оценка >р>(0) равна 0 при 3(к„) ч,.1, (1 — 8/5 (х„))" при 5(х„) ) Ф. Наилучшая несмещенная оценка неизвестной функции распреде- ления 1 — >р>(6) =1 — ехр( — 61) в точке Ф равна 1 — и(5(х )). $!в.
ЯнФОРмдция В стдтистикв 1. Байесовскнй подход в статистике. Неопределенность в исходе опыта при его описании статистической моделью (Ж', >Э, (Рв, 6 ни ез)) складывается иэ двух 168 составляющих: неопределенности вероятностного характера, обусловленной случайностью механизма, реализующего х по распределению вероятностей Р . н неопределенности, связанной с незнанием истинного значения О, параметра 8, в соответствии о которым реализуется х. Байесовскпй метод в статистике рассматривает вторую неопределенность также с позиций теории вероятностей.