TV_lektsia_6 (987184), страница 2
Текст из файла (страница 2)
(Основные параметрические семейства распределений, используемые в математической статистике, подробнее рассматриваются в приложении к методичке.)Задача построения точечной оценки параметра θ сводится к нахождениютакой функции от результатов наблюдений ˆ ˆ ( x1,..., xn ) , что случайнаявеличина (или случайная точка) ̂ в некотором смысле близка к неизвестному истинному значению параметра θ, если выборка взята из распределения F(x, θ) с этим значением параметра.Заметим, что любая функция от результатов наблюдений ( x1 ,..., xn )называется статистикой. Таким образом, точечная оценка параметраˆ ˆ ( x1,..., xn ) является некоторой статистикой, обладающей теми илииными свойствами, гарантирующими хорошее качество оценки, или близость ее к неизвестному истинному значению параметра.
Рассмотримподробнее эти свойства, определявшие качество оценки.Несмещенные оценки. Оценка ̂ называется несмещенной оценкой параметра θ, если ее математическое ожидание совпадает со значением параметра M ˆ при любом возможном значении .Состоятельные оценки. Рассмотрим зависимость оценки от объема выборки, обозначая ˆ n ˆ ( x1 ,..., xn )Оценка ˆ называется состоятельной оценкой параметра θ, если приnn она сходится по вероятности к истинному значению параметра,т.е. lim P ˆ n 0 для любого 0 и при всех возможных значеn ниях θ.Оценка ˆ n называется асимптотически несмещенной оценкой параметраθ, если lim M ˆ при всех возможных значениях θ.n nТеорема.
Пусть ˆ n − асимптотически несмещенная оценка параметра θ и,кроме того lim Dˆ 0 . Тогда ˆ − состоятельная опенка.n nnЭффективные оценки. Неравенство Рао−КрамераПредположим, что имеются две несмещенные оценки ̂ , ˆ ' для параметра θ. Естественно считать оценку ̂ более эффективной по сравнению с оценкой ˆ ' , если дисперсия первой оценки меньше дисперсиивторой:Dˆ M (ˆ ) 2 M (ˆ ' ) 2 Dˆ '(*)при всех возможных значениях θ. Если в некотором классе оценок существует такая оценка ̂ , что неравенство (*) выполняется для всех остальных оценок ˆ ' из этого класса, то говорят, что оценка ̂ является эффек-тивной (в данном классе оценок).Известным подходом, позволяющим определять эффективные оценки,является подход, основанный на неравенстве Рао−Крамера.Введем функцию параметра ln f ( x, ) ln f ( x, ) I () M f ( x, )dxкоторая называется информацией Фишера. Тогда при некоторых общихусловиях регулярности для любой несмещенной оценки ˆ n параметра θсправедливо следующее неравенство Рао−Крамера для дисперсии оцен1ки: Dˆ при всех возможных значениях θ.nI ()Эффективностью несмещенной оценки ˆназовем величину22n1e ( ) .
В соответствии с неравенством Рао−Крамера эффекnI () Dˆ nтивность любой оценки удовлетворяет неравенству 0 e() 1 . Несмещенную оценку ˆ назовем эффективной, если для нее e() 1 , или,nдругими словами, ее дисперсия Dˆ достигает нижней границы, указанной в неравенстве Рао−Крамера при всех возможных значениях θ.Методы построения точечных оценокНаиболее часто используемыми для построения оценок являются рассматриваемые ниже метод моментов и метод максимального правдоподобия.Метод моментов.
Пусть x1 , x2 ,..., xn − независимая случайная повторнаявыборка пз распределения с плотностью f(x, θ) зависящей от неизвестного параметра θ. Найдем первый момент (математическое ожидание) дляэтого распределения как функцию от параметра θ1 1 () xf ( x, )dxПосле этого в качестве оценки ̂ возьмем решение относительно θ следующего уравнения:1 () x(**)где x − эмпирическое среднее, или оценка первого момента, найденнаяпо выборке.Другими словами, в качестве оценки параметра берется то его значение,при котором точное или "теоретическое" значение первого момента сов-падает с его эмпирическим значением, найденным по результатам выборки.Аналогичным образом метод моментов применяется и в случае нескольких неизвестных параметров. А именно, если θ − вектор, то (**) будетсистемой, где слева стоят теоретические значения момента, а справа −эмпирические.Метод максимального правдоподобия.
Пусть x1 , x2 ,..., xn − попрежнему независимая повторная случайная выборка объема n из распределения с плотностью f(x, θ). Совместная плотность распределениявсех результатов выборкиL( x1 ,..., xn , ) f ( x1 , ) f ( x2 , ) ... f ( xn , )(***)называется функцией правдоподобия.В качестве оценки максимального правдоподобия ˆ ˆ ( x1,..., xn ) беретсято значение параметра θ, при котором функция правдоподобия (***),рассматриваемая как функция от θ при фиксированных результатах наблюдений x1 , x2 ,..., xn обращается в максимум. Другими словами, оценкамаксимального правдоподобия находится яз условияL( x1 ,..., xn , ˆ ) max L( x1 ,..., xn , )Во многих случаях удобно искать максимум не из самой функции правдоподобия, а из ее логарифма.
Таким образом, предполагая, что функцияf(x, θ) дифференцируема по θ, получаем, что оценка максимальногоправдоподобия ̂ находится из уравнения относительно θ, называемогоуравнением правдоподобияln L( x1 ,..., xn , ) 0Примечание. Уравнение правдоподобия является необходимым, но недостаточным условием максимума. Тем не менее, для многих часто используемых семейств распределений оказывается, что это уравнениеимеет единственное решение, которое и дает искомую оценку максимального правдоподобия.Аналогично в случае многомерного параметра θ необходимо решитьсистему уравнений.Важным свойствам оценок максимального правдоподобия является следующее.
В тех случаях, когда существует эффективная оценка, методмаксимального правдоподобия дат эту оценку. В общем случае при довольно общих условиях метод максимального правдоподобия дает асимптотически несмещенные и асимптотически эффективные оценкипри n ..