Н.И. Чернова - Математическая статистика (1119916), страница 8
Текст из файла (страница 8)
Примером такой «выдающейся» оценки может служить ОМПдля параметра θ равномерного распределения на отрезке [0, θ], не являющаяся асимптотически нормальной. Она так быстро сходится к параметру, как не умеет ни одна АНО. Таким образом, отсутствие свойства АНОне делает эту оценку хуже. Скорее наоборот.Асимптотическая нормальность ОММ. Продолжим рассмотрениеасимптотически нормальных оценок. В примере 14 мы видели, что дляоценки 2X свойство асимптотической нормальности сразу следует изЦПТ. Установим асимптотическую нормальность оценок более сложноговида, какими обычно оказываются оценки метода моментов.Л е м м а 1.
Пусть функция g(y) такова, что 0 6= Dg(X1 ) < ∞. Тогда статистика g(X) является асимптотически нормальной оценкойдля Eg(X1 ) с коэффициентом σ2 (θ) = Dg(X1 ) :√ g(X) − Eg(X1 )n p⇒ N0,1 .Dg(X1 )У п р а ж н е н и е . Вспомнить ЦПТ и доказать лемму 1.Следующая теорема утверждает асимптотическую нормальность оценок видаg(X1 ) + .
. . + g(Xn )∗θ = H g(X) = H.nТакие оценки получаются обычно (найти примеры) при использованииметода моментов, при этом всегда θ = H (Eg(X1 )) .Т е о р е м а 13. Пусть функция g(y) такова, что 0 6= Dg(X1 ) < ∞,функция H(y) дифференцируемав точке a = Eg(X1 ) и её производная00в этой точке H (a) = H (y) y=a отлична от нуля.Тогда оценка θ∗ = H g(X) является асимптотически нормальнойоценкой для параметра θ = H (Eg(X1 )) = H(a) с коэффициентом асимптотической нормальности2σ2 (θ) = H 0 (a) · Dg(X1 ).41§ 2.
Асимптотический подход к сравнению оценокД о к а з а т е л ь с т в о. Согласно ЗБЧ последовательность g(X) стремится к a = Eg(X1 ) по вероятности с ростом n. Функция H(y) − H(a) , y 6= a,y−aG(y) =H 0 (a),y=aпо условию непрерывна в точке a. Поскольку сходимость по вероятности сохраняется под действием непрерывной функции, получим,pчто G(g(X)) −→ G(a) = H 0 (a).√Заметим также, что по лемме 1 величина n g(X) − a слабо сходитсяк нормальному распределению N0, Dg(X1 ) . Пусть ξ — случайная величинаиз этого распределения. Тогда √ √ n H g(X) − H(a) = n g(X) − a · G g(X) ⇒ ξ · H 0 (a).Мы использовали (в который раз?) следующее свойство слабой сходиpмости: если ξn ⇒ ξ и ηn −→ c = const, то ξn ηn ⇒ cξ.
Но распределениеслучайной величины ξ · H 0 (a) как раз и есть N0, (H 0 (a))2 ·Dg(X1 ) . Поэтому2σ2 (θ) = H 0 (a) · Dg(X1 ).П р и м е р 15. Пусть X1 , . . . , Xn — выборка объёма n из равномерного распределения U0,θ с параметром θ > 0. Проверим, являются лиасимптотически нормальными оценкиqk∗θk =(k + 1)X k , k = 1, 2, . .
. ,полученные методом моментов в примере4 (с. 24).pПусть g(y) = (k + 1)y k , H(y) = k y. ТогдаrPqPkk(k+1)Xkg(Xi )∗ik=H.θk =(k + 1)X =nnПри этомθ = H (Eg(X1 )) =rqkE(k + 1)X1k =k(k + 1)θkk+1.Впрочем, иначе быть не могло по определению метода моментов (верно?).Проверим другие условия теоремы 13:a = Eg(X1 ) = (k + 1)θkk+1= θk ,42ГЛАВА III. СРАВНЕНИЕ ОЦЕНОКдисперсияDg(X1 ) = E(k + 1)2 X12k − a2 = (k + 1)2θ2k2k + 1− θ2k =k2θ2k2k + 1конечна и отлична от нуля. Функция H(y) дифференцируема в точке a :H 0 (y) =1 1−ky k ,kH 0 (a) = H 0 (θk ) =1 1−kθ6= 0.kПо теореме 13, оценка θ∗k является АНО для θ с коэффициентом2θ21k2θ2k =.σ2k (θ) = H 0 (a) Dg(X1 ) = 2 θ2−2k ·k2k + 12k + 1θ2Например, для θ∗1 = 2X имеем коэффициент σ21 (θ) = .
Это в точности3совпадает с коэффициентом, полученным нами в примере 14 (с. 37).Осталось понять, как сравнивать асимптотически нормальные оценкии что показывает коэффициент асимптотической нормальности.Асимптотический подход к сравнению оценок. Возьмём две случайные= N0,1 и 10 ξ ⊂= N0,100 . Разброс значений у величины 10 ξвеличины: ξ ⊂гораздо больший:0, 9973 = P(|ξ| < 3) = P(|10 ξ| < 30),и дисперсия (показатель этого рассеяния) соответственно больше.То же самое показывает и коэффициент асимптотической нормальности. Возьмём две АНО с коэффициентами 1 и 100:√√ ∗n(θ1 − θ∗ ) ⇒ N0,1 и n(θ∗2 − θ∗ ) ⇒ N0,100 .√ ∗При больших n разброс значенийвеличиныn(θ2 − θ∗ ) около нуля го√раздо больше, чем у величины n(θ∗1 − θ∗ ), поскольку больше предельнаядисперсия (она же коэффициент асимптотической нормальности).Но чем меньше отклонение оценки от параметра, тем лучше.
Получаеместественный способ сравнения асимптотически нормальных оценок.О п р е д е л е н и е 13. Пусть θ∗1 — АНО с коэффициентом σ21 (θ), θ∗2 —АНО с коэффициентом σ22 (θ). Говорят, что θ∗1 лучше, чем θ∗2 в смыслеасимптотического подхода, если для любого θ ∈ Θσ21 (θ) 6 σ22 (θ),и хотя бы при одном θ это неравенство строгое.П р и м е р 16.
Сравним между собой в асимптотическом смысле оценки в последовательности θ∗1 , θ∗2 , . . . из примера 15. Для θ∗k коэффициент43§ 3. Вопросы и упражненияθ2асимптотической нормальности имеет вид σ2k (θ) =. Коэффициент2k + 1тем меньше, чем больше k, т. е. каждая следующая оценка в этой последовательности лучше предыдущей.Оценка θ∗∞ , являющаяся «последней» оценкой в этой последовательности, могла бы быть лучше всех оценок в этой последовательности в смыслеасимптотического подхода, если бы являлась асимптотически нормальной.Но если читатель решил задачу 7 к главе I или задачу 10 к главе II, он знает, что этой «последней» оценкой является X(n) , а она не асимптотическинормальна.Ещё раз напомним, что оценка θ̂ = X(n) оказывается лучше любойасимптотически нормальной оценки: «скорость» её сходимости к параметру, как показывает (10), равна n−1 в отличие от скорости n−1/2 , котораянаблюдается у любой АНО.§ 3.
Вопросы и упражнения1. Пусть X1 , . . . , Xn — выборка объёма n из равномерного распределения Uθ, θ+5 , где θ ∈ R. Сравнить оценки θ̂0 = X(n) − 5 и θ̂1 = X(1)из примера 11 (с. 29) в среднеквадратическом смысле. Сравнить с этимиоценками оценку метода моментов θ∗ = X − 2,5.2. Для показательного распределения с параметром α rоценка, полученная методом моментов по k -му моменту, имеет вид: α∗k =kk!Xk. Сравнитьоценки α∗k , k = 1, 2, . . . в смысле асимптотического подхода. Доказать,что оценка α∗1 наилучшая.3. Выполнить все упражнения в тексте главы III.4.
Получить утверждение теоремы Гливенко — Кантелли из утверждения и в условиях теоремы Колмогорова аналогично доказательству теоремы 12.5. Является ли оценка X + 1 асимптотически нормальной оценкой дляпараметра λ распределения Пуассона Πλ ?6. Привести пример состоятельной оценки для параметра λ распределения Пуассона, которая не являлась бы АНО.7. Дана выборка из показательного распределения с неизвестным параметром α > 0.
Проверить асимптотическую нормальность оценки параметра α, полученной методом моментов по первому моменту.44ГЛАВА III. СРАВНЕНИЕ ОЦЕНОК8. Дана выборка объема n из распределения Пуассона с параметромλ > 0. Для какого параметра θ = θ(λ) оценка θ∗ = Xe−X является состоятельной оценкой? Проверить, является ли эта оценка асимптотическинормальной оценкой для того же параметра.9. Дана выборка X1 , . . .
, Xn из распределения Пуассона с параметром λ > 0. Построить оценку метода моментов по первому моменту дляпараметра θ = P(X1 = 0). Является ли эта оценка асимптотически нормальной?10. Пусть выборка X1 , . . . , Xn имеет нормальное распределение Na, σ2 .Пусть Fn∗ (y) — эмпирическая функция распределения, a∗ — выборочнаямедиана:(X(m) ,если n = 2m − 1 (нечётно),a∗ =X(m) + X(m+1), если n = 2m (чётно).2a∗Доказать, что— асимптотически нормальная оценка параметра a .У к а з а н и е. Функция распределения порядковой статистики с номером m представляется в видеFX(m) (y) = P(X(m) < y) = P(Sn > m),где Sn = I(X1 < y) + .
. . + I(Xn < y) — сумма независимых и одинаковораспределённых случайных величин. Представить в таком виде функцию√n−1распределения величины n(X(m) − a) при соответствующих m =,m=nnили m = + 1 и найти её предел по ЦПТ.22211. Пусть X1 , . . . , Xn — выборка объёма n из равномерного распредеθления U0, θ , где θ > 0. Доказать, что X(n) ∈ Kb , где b = b(θ) = −.n+1n+1Доказать, чтоX(n) ∈ K0 . Сравнить эти оценки в среднеквадратичnном смысле.Г Л А В А IVЭФФЕКТИВНЫЕ ОЦЕНКИВ классе одинаково смещённых оценок эффективной мы назвали оценкус наименьшим среднеквадратическим отклонением.
Но попарное сравнениеоценок — далеко не лучший способ отыскания эффективной оценки. Сегодня мы познакомимся с утверждением, позволяющим во многих случаяхдоказать эффективность оценки (если, конечно, она на самом деле эффективна). Это утверждение называется неравенством Рао — Краме́ра и говорито том, что в любом классе Kb(θ) существует нижняя граница для среднеквадратического отклонения любой оценки. Таким образом, если найдётсяоценка, отклонение которой в точности равно этой нижней границе (самоемаленькое), то данная оценка — эффективна, поскольку у всех остальныхоценок отклонение меньшим быть не может. К сожалению, данное неравенство верно лишь для так называемых «регулярных» семейств распределений, к которым не относится, например, большинство равномерных.§ 1. Регулярность семейства распределенийПусть X1 , .
. . , Xn — выборка объёма n из параметрического семейства распределений Fθ , где θ ∈ Θ, а область Θ ⊂ R представляет собойконечный или бесконечный интервал. Пусть, как в главе II,(плотность fθ (y), если распределение абсолютно непрерывно,fθ (y) =Pθ (X1 = y),если распределение дискретно.Введём понятие носителя семейства распределений {Fθ , θ ∈ Θ}.О п р е д е л е н и е 14. Носителем параметрического семейства распределений Fθ будем называть любое множество C ⊆ R такое, что при всех= Fθ .θ ∈ Θ выполняется равенство P(X1 ∈ C) = 1 для X1 ⊂З а м е ч а н и е 9. Мы ввели понятие носителя семейства мер в R, отличное от общепринятого (найти общепринятое!). Так, носитель в смысле данного нами определения не единствен, но все эти носители отличаются на множество нулевой вероятности.46ГЛАВА IV.
ЭФФЕКТИВНЫЕ ОЦЕНКИСледующие два условия принято называть условиями регулярности.(R) Существует такой носительC семейства распределений Fθ , чтоpпри каждом y ∈ C функция fθ (y) непрерывно дифференцируема по θвсюду в области Θ.2∂ln fθ (X1 ) существует, поло(RR) Информация Фишера I(θ) = E∂θжительна и непрерывна по θ во всех точках θ ∈ Θ.П р и м е р 17 (р е г у л я р н о е с е м е й с т в о). Рассмотрим показательное распределение Eα с параметром α > 0. Плотность этого распределения имеет вид((√pαe−αy , если y > 0,αe−αy/2 , если y > 0,fα (y) =fα (y) =0,если y 6 0,0,если y 6 0.В качестве множества C можно взять полупрямую (0, +∞), поскольку P(X1 > 0) = 1.