4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 9
Текст из файла (страница 9)
Общие методы решения подобных задач развиты в теории оцеиивания неизвестных параметров распределений, которой и посвящена настоящая глава. Дальнейший анализ проводится в рамках произвольной параметрической статистической модели У =(Г(х; 6), 8 ен 6), соответствующей схеме повторных независимых наблюдений над некоторой случайной величиной $. При этом на модель У па мере необходимости накладываются условия регулярности, обеспечивающие справедливость соответствующих утверждений и выводов.
Пусть имеется выборка Х=(Хм ..., Х„) из распределения .а (6) ~ У. Таким образам, априорная информация о наблюдаемой случайной величине ч состоит в там, чта ее функция распределения Р(х; 6) является элементам заданнага параметрического семейства функций распределения,У (т. е. имеет известную функциональную форму, ио зависит от неизвестного параметра 8, который может быть любой точкой заданного параметрического множества 6). В общем виде задача оценивания формулируется так: используя статистическую информацию, доставляемую выборкой Х, сделать статистические выводы аб истинном значении 6»неизвестного параметра 6, т.
е. оценить точку 6". Введем следующее общее понятие: етптистикой называется всякая случайная величина, являющаяся функцией лишь от выборки Х. Прн пючечном оценивании ищут статистику Т= Т(Х), значение которой прн заданной реализации х=(х», ..., х„) выборки Х принимают за приближенное значение параметра 8«. В этом случае говорят, что стшпистика Т(Х) еч(вливает 9 нли что статистика Т(Х) есть оценка 8. Обычно (на не всегда!) область значений оценки Т совпадает с 6.
Интуитивно ясно, что для оценивання 6 можно использовать различные оценки, и чтобы выбрать лучшую из ннх, надо иметь критерий сравнения качества оценок. В сваю очередь, и критерии могут быть разными в зависимости от целей, для которых строится оценка, но любой критерий определяется выбором меры близоспш оценки к истинному значению оцениваемого параметра. Кроме того, обычно класс рассматриваемых оценок ограничивают некоторыми требованиями. Таким образом, если определен класс рассматриваемых в данной ситуации (для данной модели) оценок и выбрана мера близости, та, па определению, оценка, минимизирующая меру близости, является оптимальной в этом классе.
Ниже рассмотрен адин нз вариантов этих общих положений, чаще всего применяемый в приложениях. 2. Несмещеиные оценки. Любая оценка Т= Т(Х) является слмчайнай величиной, поэтому общим требованием к построению оценок является требование концентрации (в том илн ином смысле) Зв распределения Т около истинного значения оцениваемого параметра. Чем выше степень этой концентрации, тем лучше соответ= ствующая оценка.
Предположим, что параметр 8 †скалярн, и введем понятие несмещенной оценки. По определению, статистика Т (Х) называется несмещенной оценкой для параметра 9, если выполняется условие ЕаТ(Х) =8~ 'Ф8 еп 6. (2.1) Для оценок, ие удовлетворяющих условию (2.1), можно ввести величину Ь(8)=Е Т(Х) — 6, называемую смещением оценки Т (Х). Таким образам, можно также считать, что несмещенные оценки — это такие оценки, для кото. рых смещение Ь(6)=0„'т'8 ~ 6. Величину Еа(Т вЂ” 6)'=П»Т+ Ь»(6) (2.2) называют средним квадратом ошибки или среднекводротической ошибкой оценки Т.
Для иесмещенных оценок среднеквадратическая ошибка совпадает с дисперсией оценки. Иногда требуется оценить не сам параметр 9, а некоторую функцию от него т(9) (такие функции называют параметрическими). В этом случае статистика Т = Т(Х) является несмещенной оценкой для т(6), если выполняется соотношение ЕаТ=т(6), У9 ен 6. (2.3) Ч та ограничиваются рассмотрением класса несмещенных оценок. Эта исходное требование интуитивно принлекател но: о ас ь: но о ч зна ает что по крайней мере «в среднем» используемая оценка б ет приводит к желаемому результату.
К тому же, как эта уд п оказано далее, для класса несмещенных оценок можно построить кото ой даст аточно простую н практически полезную теорию, в которо" критерием измерения концентрации (точности) оценки являе тся ее дисперсия.
Однако не следует н преувеличивать значение понятая несмещенностн: в некоторых случаях требование несмещенностн мажет оказаться слишком «жестким» н привести к нежелательным результатам. Так, мажет оказаться, что несмещенные оценки (в данной ьюдели и для данной параметрической функции) вообще не существуют, а в другвх случаях хотя и имеются, но практически бесполезны.
Проиллюстрируем эти положения примерами. Пример 2.! (пуаееоновокая модель, оценивиние параметрической функции). Пусть Ж(«) енП(6) и п=1, т. е. производится одно наблюдение Х над пуассоновской случайной величиной. Требуется оценить параметрическую функцию т(8) =!/8. 39 Если Т(Х) — несмещешвая оценка т(9), то условие (2.3) принимает внд »» ,Ек ! У Т(х)е в,, =--,—, Ю~(0, са), нлн »=в Т(х) —,==еэ=- ) -;, 79 ы(0, со). »= О »=а СО Т(х) бк — '~' 6» ~!О ев (О 1) »=! Приравнивая коэффициенты прн одинаковых степенях 9, получаем, что единственной несмещенной оценкой в данном случае является ( 0 при Х=О, статистика Т(Х) =~ Но значения этой статистики ~! прн Х=-"1.
вообще не принадлежат параметрическому множеству 6 = (0,1) данной модели, поэтому такая оценка практически бесполезна. Эти примеры наказывают, что ие всегда надо ограничиваться рассмотрением талька несмещенных оценок. Иногда, как показы- вает следующий пример, оценка с малым смещением и малой среднеквадратической ошибкой предпочтительнее несмещенной оценки с большой дисперсией. Пример 2.3 (ойцпя нормпльнпя модель, оцениеоние дисперсии), Пусть Х=(Х„..., Х„), п~2,— выборка нз»-~ (6„6";).
Оценим функцию т(0)=т(6в Ов)=-Ов. Из (1.14) имеем, что если 5'= 5'(Х) — выборочная дисперсия, то Ев(5') =(п — 1)Ов1п. Отсюда следует, что несмещенная оценкой для 6, 'является статистика к 5к " 5в ! ~!!в (Х Х)в в=! (2.4) Прн этом по теореме 1.10 .ь ~ —,! 5' ) = у' (и — 1). Очевидно, что функция Т(х), удовлетворяющая последнему условшо н ие зависящая от 9, как это требуется в соответствии с определением понятия оценки, не существует, т. е.
в данном случае несмещенных оценок для т(0) вообще нет. Пример 2.2 (отрицптельнпя бина»яипльнпя модель, оценивпние ппрпметрп). Пусть Х($) ~В!'(1„В) н и==1. Требуется оцепить параметр 9. В данном случае условие несмещенностн (2.1) эквивалентно условию Отсюда и из (1.20) имеем П (" ! 5'в) =2(п — 1), или Пв(5 )=,—, (2.5) Ниже (см. 9 2.2, и. 5) будет показано, чта па критерию минимума дисперсии оценка 5' является оптимальной среди всех не- смещенных оценок функции т(0) =В; в модели ьв (бв, В,-), т. е. что ее дисперсия (2.5) меньше дисперсии любой другой несмещенной оценки величины 9„-'. Рассмотрим теперь класс оценок вида Тв = Л5' . Так как Е,Т, =ЛЕ,(5')=ЛО», то в этом классе имеется лишь единственная несмещенная оценка т(6), соответствующая значению Л= 1, т.
е. оценка 5' . Вычислим среднеквадратнческую ошибку пронзвальной оценкиТх! Е,(Т,— 01) =Е,»Л(5 ."— 9:.)+(Л вЂ” 1) 611*=ЛвП,(5")+(Л вЂ” 1) 9,. Отсюда и нз формулы (2.5) получим Ев (Т! — 6!в)в =! — + (Л вЂ” 1)'~ О,' = ф (Л) В,'. Функция ве (Л) достигает лвиниь!уыа при Л' = (п — 1)!(я+1) и кр(Л )=2/(»в+1), откуда, учитывая соотношения (2.5), имеем Ев (Т„.
— Вкв)' = —, 6,' ( —, 6,' = Ев(5" — Ввк)-". 2, 2 Таким образом, на основании критерия минимума среднеквадратиь ! ък ческой ошибки при о~2 смещенная оценка Тх = — у (Х! — Х)в, в=! 2 смещение которой ЕвТх — 6' = — — 0„-' мало прп достаточно больн+1 шом объеме выборки п, лучше оценивает дисперсию Ов модели е (9„, 6»), чем несмещенная оценка 5', определяемая равенством (2.4). Этот пример показывает, что не может быть единственного критерия, по которому следует сравнивать все оценки, как не существует единственной оценки данного параметра, подходящей для всех случаев.
9. Оптимальные оценки. Требование несмещенности в силу сделанных выше замечаний нельзя рассматривать как универсальное, тем не менее во многих встречающихся на практике случаях оно уместно и обоснованно и далее в основном рассматриваются именно несмещенные оценки. Итак, пусть требуется оценить заданную параметрическую функци!о т=т(В) в модели .У =(Е(х; 6), Оев!Э» по статистической информации, доставляемой соответствующей выборкой Х = =(Х„..., Х,).
Предположим, что в данной задаче существуют несмещенные оценки, т. е. статистики Т=Т(Х), удовлетворяющие условию (2.3). Обозначим класс всех несмещениых оценок 4! в данной задаче через оУ',. Таким образом, Танау, тогда н только тогда, когда выполнено условие (2.3). Дополнительно предположим, что дисперсии всех оценок из класса еУ, конечны: ОаТ =Ее(Т вЂ” т(8))»С со, т47 енеу «и !аВ я В. В этом случае точность оценок можно измерять величиной их дисперсии, и мы получаем простой критерий сравнения различных оценок из класса оГ"т.
Пусть 7* и Т вЂ” оценки из класса еУ «. Если Оа7 ~ Рат, чВ ве ет, (2.6) то по критерию минимума дисперсии оценка Тв равномерно (по парюветру 8» не хуже оценки Т; если же в (2.6) имеет место строгое неравенство хотя бы при одном 8, то следует отдать предпочтение Т*, как более точной оценке. Если условие (2,6) выполняется для любой оценки Т вно7;, то Т' называют несмещенной оценкой с равнамерно лшнимальной дисперсией. Такую оценку 7* в дальнейшем для краткости будем называть оллтимальной и иногда обозначать т*, чтобы подчеркнуть, что она относится к функции т(8). Итак, оптимальной является оценка с* вн аУ;, для которой выполняется условие Р =)п(07, пав.
(2.7) вг« Требование равномерной минимальности дисперсии сильное и не всегда имеет место. Может оказаться, что из двух оценок Т„ Те ы ат « дисперсия ОеТ! минимальна (в классе вх;) для одних значейий параметра 9, а дисперсия 0«Т» — для других значений 6. В таких случаях с помощью одного критерия минимума дисперсии зти оценки 'сравнить нельзя. Однако это требование выделяет оптимальную оценку в классе о7 « однозначно, если такая оценка существует, о чем свидетельствует следукнцая теорема. Теорема 2.1.
Пус!пь Т! = Т,(Х), ! = 1, 2, †д аптилитльные оценки для т =т(6). Тгеда Т,= Т, а ьл Рассмотрим новую оценку Т, = (Т, + Тв),!2. Ясно, что Твеноу т н ОаТ» =(0»Тт+ ОаТ»+ 2 сочв (7! Т Д)(4. (2,8) Для любых случайных величин т)т, т)в имеет место неравенство Коши — Буняковского !(сот(т)т, т)а) ! =3~0«),0»)а, причем знак равенства имеет место только если т)х и т)в линейно связаны.