Г.И. Ивченко, Ю.И. Медведев - Математическая статистика (1115270), страница 9
Текст из файла (страница 9)
В то мте время в случае применения статистической теории на практике часто приходится строить приближенные значения для различных неизвестных теоретических характеристик изучаемой модели при любых обьемах выборки, в том числе и ограниченных, н прп этом обосновывать соответствующие рекомендации с точки зрения каких-либа критериев оптимальности. Общие методы решения подобных задач развиты в теории оцеиивания неизвестных параметров распределений, которой и посвящена настоящая глава.
Дальнейший анализ проводится в рамках произвольной параметрической статистической модели У =(Г(х; 6), 8 ен 6), соответствующей схеме повторных независимых наблюдений над некоторой случайной величиной $. При этом на модель У па мере необходимости накладываются условия регулярности, обеспечивающие справедливость соответствующих утверждений и выводов. Пусть имеется выборка Х=(Хм ..., Х„) из распределения .а (6) ~ У. Таким образам, априорная информация о наблюдаемой случайной величине ч состоит в там, чта ее функция распределения Р(х; 6) является элементам заданнага параметрического семейства функций распределения,У (т. е. имеет известную функциональную форму, ио зависит от неизвестного параметра 8, который может быть любой точкой заданного параметрического множества 6).
В общем виде задача оценивания формулируется так: используя статистическую информацию, доставляемую выборкой Х, сделать статистические выводы аб истинном значении 6»неизвестного параметра 6, т. е. оценить точку 6". Введем следующее общее понятие: етптистикой называется всякая случайная величина, являющаяся функцией лишь от выборки Х. Прн пючечном оценивании ищут статистику Т= Т(Х), значение которой прн заданной реализации х=(х», ..., х„) выборки Х принимают за приближенное значение параметра 8«.
В этом случае говорят, что стшпистика Т(Х) еч(вливает 9 нли что статистика Т(Х) есть оценка 8. Обычно (на не всегда!) область значений оценки Т совпадает с 6. Интуитивно ясно, что для оценивання 6 можно использовать различные оценки, и чтобы выбрать лучшую из ннх, надо иметь критерий сравнения качества оценок. В сваю очередь, и критерии могут быть разными в зависимости от целей, для которых строится оценка, но любой критерий определяется выбором меры близоспш оценки к истинному значению оцениваемого параметра. Кроме того, обычно класс рассматриваемых оценок ограничивают некоторыми требованиями.
Таким образом, если определен класс рассматриваемых в данной ситуации (для данной модели) оценок и выбрана мера близости, та, па определению, оценка, минимизирующая меру близости, является оптимальной в этом классе. Ниже рассмотрен адин нз вариантов этих общих положений, чаще всего применяемый в приложениях. 2. Несмещеиные оценки. Любая оценка Т= Т(Х) является слмчайнай величиной, поэтому общим требованием к построению оценок является требование концентрации (в том илн ином смысле) Зв распределения Т около истинного значения оцениваемого параметра. Чем выше степень этой концентрации, тем лучше соответ= ствующая оценка.
Предположим, что параметр 8 †скалярн, и введем понятие несмещенной оценки. По определению, статистика Т (Х) называется несмещенной оценкой для параметра 9, если выполняется условие ЕаТ(Х) =8~ 'Ф8 еп 6. (2.1) Для оценок, ие удовлетворяющих условию (2.1), можно ввести величину Ь(8)=Е Т(Х) — 6, называемую смещением оценки Т (Х). Таким образам, можно также считать, что несмещенные оценки — это такие оценки, для кото. рых смещение Ь(6)=0„'т'8 ~ 6. Величину Еа(Т вЂ” 6)'=П»Т+ Ь»(6) (2.2) называют средним квадратом ошибки или среднекводротической ошибкой оценки Т. Для иесмещенных оценок среднеквадратическая ошибка совпадает с дисперсией оценки. Иногда требуется оценить не сам параметр 9, а некоторую функцию от него т(9) (такие функции называют параметрическими). В этом случае статистика Т = Т(Х) является несмещенной оценкой для т(6), если выполняется соотношение ЕаТ=т(6), У9 ен 6. (2.3) Ч та ограничиваются рассмотрением класса несмещенных оценок.
Эта исходное требование интуитивно принлекател но: о ас ь: но о ч зна ает что по крайней мере «в среднем» используемая оценка б ет приводит к желаемому результату. К тому же, как эта уд п оказано далее, для класса несмещенных оценок можно построить кото ой даст аточно простую н практически полезную теорию, в которо" критерием измерения концентрации (точности) оценки являе тся ее дисперсия. Однако не следует н преувеличивать значение понятая несмещенностн: в некоторых случаях требование несмещенностн мажет оказаться слишком «жестким» н привести к нежелательным результатам.
Так, мажет оказаться, что несмещенные оценки (в данной ьюдели и для данной параметрической функции) вообще не существуют, а в другвх случаях хотя и имеются, но практически бесполезны. Проиллюстрируем эти положения примерами. Пример 2.! (пуаееоновокая модель, оценивиние параметрической функции). Пусть Ж(«) енП(6) и п=1, т. е. производится одно наблюдение Х над пуассоновской случайной величиной. Требуется оценить параметрическую функцию т(8) =!/8.
39 Если Т(Х) — несмещешвая оценка т(9), то условие (2.3) принимает внд »» ,Ек ! У Т(х)е в,, =--,—, Ю~(0, са), нлн »=в Т(х) —,==еэ=- ) -;, 79 ы(0, со). »= О »=а СО Т(х) бк — '~' 6» ~!О ев (О 1) »=! Приравнивая коэффициенты прн одинаковых степенях 9, получаем, что единственной несмещенной оценкой в данном случае является ( 0 при Х=О, статистика Т(Х) =~ Но значения этой статистики ~! прн Х=-"1. вообще не принадлежат параметрическому множеству 6 = (0,1) данной модели, поэтому такая оценка практически бесполезна. Эти примеры наказывают, что ие всегда надо ограничиваться рассмотрением талька несмещенных оценок.
Иногда, как показы- вает следующий пример, оценка с малым смещением и малой среднеквадратической ошибкой предпочтительнее несмещенной оценки с большой дисперсией. Пример 2.3 (ойцпя нормпльнпя модель, оцениеоние дисперсии), Пусть Х=(Х„..., Х„), п~2,— выборка нз»-~ (6„6";). Оценим функцию т(0)=т(6в Ов)=-Ов. Из (1.14) имеем, что если 5'= 5'(Х) — выборочная дисперсия, то Ев(5') =(п — 1)Ов1п. Отсюда следует, что несмещенная оценкой для 6, 'является статистика к 5к " 5в ! ~!!в (Х Х)в в=! (2.4) Прн этом по теореме 1.10 .ь ~ —,! 5' ) = у' (и — 1).
Очевидно, что функция Т(х), удовлетворяющая последнему условшо н ие зависящая от 9, как это требуется в соответствии с определением понятия оценки, не существует, т. е. в данном случае несмещенных оценок для т(0) вообще нет. Пример 2.2 (отрицптельнпя бина»яипльнпя модель, оценивпние ппрпметрп). Пусть Х($) ~В!'(1„В) н и==1. Требуется оцепить параметр 9. В данном случае условие несмещенностн (2.1) эквивалентно условию Отсюда и из (1.20) имеем П (" ! 5'в) =2(п — 1), или Пв(5 )=,—, (2.5) Ниже (см. 9 2.2, и.
5) будет показано, чта па критерию минимума дисперсии оценка 5' является оптимальной среди всех не- смещенных оценок функции т(0) =В; в модели ьв (бв, В,-), т. е. что ее дисперсия (2.5) меньше дисперсии любой другой несмещенной оценки величины 9„-'. Рассмотрим теперь класс оценок вида Тв = Л5' . Так как Е,Т, =ЛЕ,(5')=ЛО», то в этом классе имеется лишь единственная несмещенная оценка т(6), соответствующая значению Л= 1, т. е.
оценка 5' . Вычислим среднеквадратнческую ошибку пронзвальной оценкиТх! Е,(Т,— 01) =Е,»Л(5 ."— 9:.)+(Л вЂ” 1) 611*=ЛвП,(5")+(Л вЂ” 1) 9,. Отсюда и нз формулы (2.5) получим Ев (Т! — 6!в)в =! — + (Л вЂ” 1)'~ О,' = ф (Л) В,'. Функция ве (Л) достигает лвиниь!уыа при Л' = (п — 1)!(я+1) и кр(Л )=2/(»в+1), откуда, учитывая соотношения (2.5), имеем Ев (Т„. — Вкв)' = —, 6,' ( —, 6,' = Ев(5" — Ввк)-". 2, 2 Таким образом, на основании критерия минимума среднеквадратиь ! ък ческой ошибки при о~2 смещенная оценка Тх = — у (Х! — Х)в, в=! 2 смещение которой ЕвТх — 6' = — — 0„-' мало прп достаточно больн+1 шом объеме выборки п, лучше оценивает дисперсию Ов модели е (9„, 6»), чем несмещенная оценка 5', определяемая равенством (2.4). Этот пример показывает, что не может быть единственного критерия, по которому следует сравнивать все оценки, как не существует единственной оценки данного параметра, подходящей для всех случаев.