Н.И. Чернова - Математическая статистика (1119916), страница 10
Текст из файла (страница 10)
Пусть X1 , . . . , Xn — выборка объёма n из нормального распределения Na, σ2 , где оба параметра a и σ2 неизвестны. Проверить, является ли R -эффективной оценкой для σ2 несмещённаявыбороч222ная дисперсия S0 , используя равенство: D (n − 1)S0 /σ = 2(n − 1). Эторавенство читатель сможет доказать несколькими главами позднее, когдапознакомится с χ2-распределением.
При некотором терпении его можнодоказать и непосредственным вычислением.П р и м е р 24. Пусть X1 , . . . , Xn — выборка объёма n из показательного распределения E1/α с параметром 1/α, где α > 0. Проверим, является ли несмещённая (почему?) оценка α∗ = X эффективной оценкой дляпараметра α.Найдём информацию Фишера относительно параметра α2∂I(α) = Eαln fα (X1 ) .∂α54ГЛАВА IV. ЭФФЕКТИВНЫЕ ОЦЕНКИПлотность данного показательного распределения имеет вид(1 −ye α , если y > 0,fα (y) = α0,если y 6 0.Тогда fα (X1 ) =1αe−X1 /α п. н., ln fα (X1 ) = − ln α −X1α,∂1X1ln fα (X1 ) = − + 21 = 2 (X1 − α)∂ααααи информация Фишера равнаI(α) =E(X1 − α)2α4=DX1α4=α2α4=1α2.Найдём дисперсию оценки X и сравним с правой частью в неравенствеРао — Крамера для несмещённых оценок:DX =1α21DX1 ==.nnnI(α)Следовательно, оценка α∗ = X R -эффективна и поэтому является эффективной оценкой для параметра α.У п р а ж н е н и е .
Получить эту оценку методом моментов и методоммаксимального правдоподобия. Она действительно несмещённая? А ещёкакими свойствами обладает?У п р а ж н е н и е . Проверить, что для несмещённой оценки α∗∗ = X1равенство в неравенстве Рао — Крамера не достигается. Объяснить, почему, исходя только из этого, нельзя сделать вывод о её неэффективностив классе K0 . Сделать этот вывод на основании того, что оценки α∗ = Xи α∗∗ = X1 принадлежат классу оценок с одинаковым смещением, и однаиз них эффективна. Сформулировать теорему о единственности эффективной оценки в классе оценок с фиксированным смещением.Отсутствие равенства в неравенстве Рао — Крамера вовсе не означает,что оценка не является эффективной.
Для некоторых семейств распределений это неравенство не точно́ в том смысле, что самая маленькая издисперсий несмещённых оценок всё же оказывается строго большей, чемправая часть неравенства. Приведём пример оценки, которая является эффективной (в этом мы убедимся много позже), но не R -эффективной, т. е.для неё не достигается равенство в неравенстве Рао — Крамера.П р и м е р 25.
Пусть X1 , . . . , Xn — выборка объёма n из показательного распределения Eα с параметром α, где α > 0. Возьмём чуть поправ-55§ 3. Проверка эффективности оценокленную оценку метода моментовα∗ =n−1n−11=·.nX1 + . . . + XnXУбедимся, что это несмещённая оценка. Согласно свойству устойчивости по суммированию для гамма-распределения, сумма X1 + . . . + Xnнезависимых случайных величин с распределением E = Γα,1 имеет распределение Γα,n с плотностью распределения n αy n−1 e−αy , y > 0,(n−1)!γα,n (y) =0,y 6 0.Вычислим математическое ожиданиеE α∗ = E= αn−1X1 + .
. . + Xn(n − 1)(n − 1)!∞Z= (n − 1)αn1y n−1 e−αy dy =y (n − 1)!0∞Zα(αy)n−2 e−αy d(αy) =(n − 2)!· (n − 2)! = α.0Итак, оценка α∗ принадлежит классу K0 . Информацию Фишера отно1сительно параметра α мы вычислили в примере 17 (с. 46): I(α) = 2 .αНайдём второй момент и дисперсию оценки α∗ :∞Z21αn(n − 1)∗ 22E(α ) = E P 2 = (n − 1)y n−1 e−αy dy =2(= α2y (n − 1)!Xi )(n − 1)2∞Z0(αy)n−3 e−αy d(αy) = α2(n − 1)!(n − 1)n−1 2· (n − 3)! =α ,(n − 2)!n−20тогдаD α∗ = E(α∗ )2 − (E α∗ )2 =n−1 2α2α − α2 =.n−2n−2Подставив дисперсию и информацию Фишера в неравенство Рао — Крамера, получим, что при любом n есть строгое неравенствоD α∗ =α2n−2>α2n=1.nI(α)В главе XI мы докажем эффективность оценки α∗ .56ГЛАВА IV. ЭФФЕКТИВНЫЕ ОЦЕНКИ§ 4. Вопросы и упражнения1. Проверить эффективность оценок максимального правдоподобиядля неизвестных параметров следующих семейств распределений: Bp ,Πλ , Na, σ2 при известном a, Bm,p при известном m.2.
Выполнить все упражнения, содержащиеся в тексте главы IV.3. Пусть X1 , . . . , Xn — выборка из параметрического семейства распределений Fθ , где θ ∈ Θ. Доказать, что если оценка θ∗ являетсяR -эффективной оценкой для θ в классе оценок со смещением b(θ) = θ/n ,то она состоятельна.4. Пусть X1 , . . . , Xn — выборка из распределения Пуассона с параметром λ . В качестве оценки параметра θ = e−λ рассматривается статистикаθ∗ = I{X = 0} . Вычислить смещение этой оценки и проверить, являетсяли она R -эффективной.5.
Выполнены ли условия регулярности для семейства распределенийFθ с плотностью распределения 4(θ − y)3 /θ4 на отрезке [0, θ] ?6. Семейство распределений {Fθ ; θ ∈ Θ} называется экспоненциаль~ θ) допускает представлениеным, если функция правдоподобия f (X;~~ θ) = eA(θ)T (X)+B(θ) h(X).~f (X;Проверить, являются ли экспоненциальными семейства распределений:Na, σ2 при известном σ2 , Na, σ2 при известном a, Γα, λ при известном λ,Γα, λ при известном α, Πλ .7. Пусть X1 , . .
. , Xn — выборка из экспоненциального семейства, причём функции A(θ) и B(θ) непрерывно дифференцируемы. Доказать, что~ из определения экспоненциального семейства додля оценки θ∗ = T (X)стигается равенство в неравенстве Рао — Крамера.ГЛАВА VИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ~ = (X1 , . . . , Xn ) из распределенияПусть, как обычно, имеется выборка XFθ с неизвестным параметром θ ∈ Θ ⊆ R. До сих пор мы занимались «точечным оцениванием» неизвестного параметра — находили оценку (длякаждой реализации выборки — число), способную в некотором смысле заменить параметр.
Существует другой подход к оцениванию, при котороммы указываем интервал, накрывающий параметр с заданной наперед вероятностью. Такой подход называется интервальным оцениванием. Сразузаметим: чем больше уверенность в том, что параметр лежит в интервале, тем шире интервал. Поэтому бессмысленно искать диапазон, внутрикоторого θ содержится гарантированно,— это вся область Θ.§ 1. Доверительные интервалы~ = (X1 , . . . , Xn ) — выборка объёма n из распределения FθПусть Xс параметром θ ∈ Θ ⊆ R.О п р е д е л е н и е 15. Пусть 0 < ε < 1. Интервал со случайными кон~ ε), θ+ (X,~ ε) называется доверительным интерцами (θ− , θ+ ) = θ− (X,валом для параметра θ уровня доверия 1 − ε, если для любого θ ∈ ΘP θ− < θ < θ+ > 1 − ε.О п р е д е л е н и е 16.
Пусть 0 < ε < 1. Интервал со случайными кон~ ε), θ+ (X,~ ε) называется асимптотическим доцами (θ− , θ+ ) = θ− (X,верительным интервалом для параметра θ (асимптотического) уровня доверия 1 − ε, если для любого θ ∈ Θlim inf P θ− < θ < θ+ > 1 − ε.n→∞На самом деле в определении 16 речь идёт, конечно, не об одном интервале, но о последовательности интервалов, зависящих от n.58ГЛАВА V. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕЗ а м е ч а н и е 11.
Случайны здесьграницы интервала (θ− , θ+ ), поэтому читают формулу P θ− < θ < θ+ как «интервал (θ− , θ+ ) накрываетпараметр θ », а не как « θ лежит в интервале. . . ».З а м е ч а н и е 12. Неравенство « > 1 − ε » обычно соответствует дискретным распределениям, когда нельзя обязаться добиться равенства: на= B1/2 при любом x равенство P(ξ < x) = 0,25 невозпример, для ξ ⊂можно, а неравенство имеет смысл:P(ξ < x) > 0,25дляx > 0.Если вероятность доверительному интервалу накрыть параметр равна1 − ε (или стремится к 1 − ε ), интервал называют точным (или асимптотически точным) доверительным интервалом.Прежде чем рассматривать какие-то регулярные способы построенияточных и асимптотических доверительных интервалов, разберем два примера, предлагающих очень похожие способы, и затем попробуем извлечьиз этих примеров некоторую общую философию построения точныхи асимптотически точных доверительных интервалов.П р и м е р 26.
Пусть X1 , . . . , Xn — выборка объёма n из нормального распределения Na, σ2 , где a ∈ R — неизвестный параметр, а значениеσ > 0 известно. Требуется при произвольном n построить точный доверительный интервал для параметра a уровня доверия 1 − ε.Знаем, что нормальное распределение устойчиво по суммированию.Л е м м а 3.
Пусть случайные величины ξi , где i = 1, 2, имеют нормальные распределения Nai , σ2 и независимы. Тогда случайная величинаiη = bξ1 + cξ2 + d имеет нормальное распределение с параметрамиE η = b a1 + c a2 + d,D η = b2 σ21 + c2 σ22 .У п р а ж н е н и е . Доказать лемму 3.Поэтому распределение суммы элементов выборки при любом её объ= Nna, nσ2 , а центрированнаяёме n нормально: nX = X1 + . . . + Xn ⊂и нормированная величинаη=√ X −anX − na√= nσσ nимеет стандартное нормальное распределение.По заданному ε ∈ (0, 1) найдём число c > 0 такое, чтоP(−c < η < c) = 1 − ε.59§ 1.
Доверительные интервалыεстандартного нормальногоЧисло c является квантилью уровня 1 −2распределения (рис. 7):εP(−c < η < c) = Φ0, 1 (c)−Φ0,1 (−c) = 2Φ0, 1 (c)−1 = 1− ε, Φ0, 1 (c) = 1− .2Напомним определение.О п р е д е л е н и е 17. Пусть распределение F с функцией распределения F абсолютно непрерывно. Число τδ называется квантилью уровняδ распределения F, если F (τδ ) = δ. Если функция F строго монотонна,квантиль определяется единственным образом.1−εε/2ε/2−cycРис. 7. Квантили стандартного нормального распределенияПо заданному ε в таблице значений функции Φ0, 1 (x) найдём квантилиc = τ1−ε/2 или −c = τε/2 . Разрешив затем неравенство −c < η < cотносительно a, получим точный доверительный интервал:√ X −a1 − ε = P(−c < η < c) = P −c < n<c =σcσcσ= P X−√ <a<X+√ .nnМожно подставить c = τ1−ε/2 :σ τ1−ε/2P X− √<a<X+nσ τ1−ε/2√n= 1 − ε.Итак, искомый точный доверительный интервал уровня доверия 1 − εимеет видσ τ1−ε/2σ τ1−ε/2X− √, X+ √.(14)nnУ п р а ж н е н и е .
Имеет смысл ответить на несколько вопросов.1. Зачем мы брали симметричные квантили? Почему не брать границыдля η вида P(τε/3 < η < τ1−2ε/3 ) = 1 − ε ? Изобразить эти квантили на60ГЛАВА V. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕграфике плотности. Как изменилось расстояние между квантилями? Какизменится длина доверительного интервала?2. Какой из двух доверительных интервалов одного уровня доверияи разной длины следует предпочесть?3. Какова середина полученного в примере 26 доверительного интервала? Какова его длина? Что происходит с границами доверительного интервала при n → ∞ ? Как быстро это с ними происходит?П р и м е р 27. Пусть X1 , .