Н.И. Чернова - Лекции по матстату (1115348), страница 7
Текст из файла (страница 7)
42,решение 2).Пример 18. Пусть X1 , . . . , Xn — выборка объема n из нормального распределения Na,σ2 , где a ∈ R,σ > 0. Проверим, является ли оценка a∗ = X ∈ K0 эффективной.28Найдем информацию Фишера относительно параметра a (считая, что имеется один неизвестный параметр — a).1(X1 − a)2f(a,σ2 ) (X1 ) = √exp −2σ 22πσ 2(X1 − a)2ln f(a,σ2 ) (X1 ) = −ln (2πσ 2 )1/2 −2σ 2∂(X1 − a)ln f(a,σ2 ) (X1 ) =∂aσ22E(a,σ2 ) (X1 − a)2D(a,σ2 ) X11∂22ln f(a,σ ) (X1 ) === 2.I(a) = E(a,σ )∂aσ4σ4σИтак, I(a) = 1/σ 2 .
Найдем дисперсию оценки X. По теореме о свойствах Sn /n из прошлого семестра,которую невредно вспомнить,D(a,σ2 ) X!=1D(a,σ2 ) X1n=σ2.nЗамечание 14. Тем, кто не желает обременять память воспоминаниями, предлагается воспользоваться свойствами дисперсии суммы независимых (и одинаково распределенных) случайных величин идоказать равенство1DX ≡ DX1nДалее, сравнивая левую и правую части в неравенстве Рао-Крамера, получаем равенство:D(a,σ2 ) X=σ2n=1.nI(a)То есть оценка a∗ = X эффективна (обладает наименьшей дисперсией среди несмещенных оценок).Пример 19. Пусть X1 , . . .
, Xn — выборка объема n из нормального распределения N0,σ2 , где σ > 0.n1X 2∗Проверим, является ли оценка σ 2 =X = X 2 ∈ K0 эффективной.n i=1 iУпражнение. Получить эту оценку методом моментов и методом максимального правдоподобия.Найдем информацию Фишера относительно параметра σ 2 .1X12fσ2 (X1 ) = √exp − 22σ2πσ 21X2ln fσ2 (X1 ) = −ln (2π)1/2 − ln σ 2 − 1222σ2∂1Xln fσ2 (X1 ) = − 2 + 14∂σ 22σ2σ2 22∂X111122I(σ 2 ) = Eσ2lnf(X)=E−=Eσ2 (X12 − σ 2 )2 =Dσ2 X12 .1σσ2428∂σ2σ2σ4σ4σ 8Осталось найтиDσ2 X12 = Eσ2 X14 − (Eσ2 X12 )2 = Eσ2 X14 − σ 4 .Найдем четвертый момент X1 . Для тех, кто помнит некоторые формулы вероятности:Eξ 2k = (2k − 1)!! = (2k − 1)(2k − 3) · .
. . · 3 · 1 при ξ ⊂= N0,1 ,29|=⇒X1 = ξ · σ ⊂= N0,σ2EX14 = Eξ 4 · σ 4 = 3σ 4 .Для тех, кто не помнит — краткое пособие по интегрированию:Eσ2 X14=Z∞−∞= 2σ 4Z∞y2− 22σ1y √edy = 2σ 42πσ40t211 −2t4 √ edt = −2σ 4 √2π2π1= 2σ 4 √ · 32πZ∞2t3 de− t2Z∞2− t2t2 edt = 3σ 4−∞0∞ Z∞ − t2t2 21−dt3 == −2σ 4 √ t3 e 2 − e2π0000Z∞y2Z∞ 4y1 − 2σ2 y √ ed=σσ2π2− t21√ t2 e2πdt = 3σ 4 · Dξ = 3σ 4 · 1,где ξ ⊂= N0,1 .Итак, Dσ2 X12 = Eσ2 X14 − σ 4 = 2σ 4 .I(σ 2 ) =111Dσ2 X12 =2σ 4 =.4σ 84σ 82σ 4∗Найдем дисперсию оценки σ 2 = X 2 .nDσ 2 X 2 =X112σ 42222XDD.X==σσi1n2nn1Сравнивая левую и правую части в неравенстве Рао-Крамера, получаем равенство:Dσ 2 X 2=2σ 4n=1.nI(σ 2 )∗Таким образом, оценка σ 2 = X 2 эффективна.Пусть X1 , .
. . , Xn — выборка объема n из нормального распределения Na,σ2 , гдеn1X∗a известно, σ > 0. Проверить, является ли оценка σ 2 =(Xi − a)2 = (X − a)2 эффективной.n i=1Принадлежит ли эта оценка классу K0 ? Какими методами получена? Является ли состоятельной и асимптотически нормальной?Упражнение.Пример 20. Пусть X1 , . . . , Xn — выборка объема n из распределения Бернулли B17p (а почему быи нет?), где p ∈ (0, 1/17).
Проверим, является ли оценка p∗ = X/17 ∈ K0 (оценка для параметра p!)эффективной.2∂Найдем информацию Фишера I(p) = Epln fp (X1 )относительно параметра p. Нам знаком∂pтолько «табличный» вид «плотности» распределения Бернулли с вероятностью успеха 17p:17p,если y = 1,fp (y) = Pp (X1 = y) =1 − 17p, если y = 0.Заметим, что то же самое можно записать иначе:fp (y) = (17p)y (1 − 17p)1−y ,y = 0, 1.Теперь уже удобно и логарифмировать, и дифференцировать.fp (X1 ) = (17p)X1 (1 − 17p)1−X1ln fp (X1 ) = X1 ln 17 + X1 ln p + (1 − X1 )ln (1 − 17p)∂X11 − X1X1 − 17pln fp (X1 ) =− 17=∂pp1 − 17pp(1 − 17p)2∂Ep (X1 − 17p)2Dp X 117p(1 − 17p)17I(p) = Epln fp (X1 ) = 2= 2= 2=.222∂pp (1 − 17p)p (1 − 17p)p (1 − 17p)p(1 − 17p)30Итак, I(p) = 17/p(1 − 17p).
Найдем дисперсию оценки X/17.DpXDp X117p(1 − 17p)p(1 − 17p)== 2 Dp X 1 ==.1717217 n172 n17nПодставив дисперсию и информацию Фишера в неравенстве Рао-Крамера, получаем равенство:DpX17=p(1 − 17p)17n=1.nI(p)То есть оценка p∗ = X/17 эффективна (обладает наименьшей дисперсией среди несмещенных оценок).Упражнение. Получить эту оценку методом моментов и методом максимального правдоподобия.Она действительно несмещенная? А еще какими свойствами обладает?4.5Наилучшие линейные несмещенные оценкиВ плане подготовки к курсу «Эконометрия» полезно заметить следующее: в практической статистикечасто рассматривают оценки, являющиесялинейными (и по возможности несмещенными) функциями отPnвыборки, то есть оценки вида θ∗ = i=1 ai Xi .
В классе таких оценок наилучшая в смысле среднеквадратического подхода оценка обычно находится и без неравенстваРао-КрамераPP(что особенно полезно длянерегулярных семейств) — достаточно минимизировать a2i при заданной ai . Такую оценку принятоназывать «наилучшей линейной несмещенной оценкой», или по английски — BLUE (“best linear unbiasedestimate").Так, скажем, для распределения U0,θ оценка θ0∗ = 2X является BLUE, так как ее дисперсияPn (найти!∗иливспомнитьпример10)небольше(доказать!)дисперсиилюбойоценкивидаθ=i=1 ai Xi , гдеPna=2(почемуэтогарантируетнесмещенность?).i=1 iСправедливости ради следует добавить (см. пример 10), что оценка θ0∗ = 2X, хоть и является BLUE,не может конкурировать в среднеквадратичном смысле с нелинейной оценкой θ̂ = n+1n X(n) (которая является эффективной в классе несмещенных оценок, но это — страшная тайна).4.6 Вопросы и упражнения1.
Проверить эффективность ОМП для следующих распределений:а) Bp+1 , −1 < p < 0, б)Π2λ , в) E1/α , г) Na,1 , д) Bm,p (биномиальное), 0 < p < 1, при известном m.2. Выполнить все упражнения, содержащиеся в тексте главы 4.315Д ОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ~ = (X1 , . . . , Xn ) из распределения Fθ с неизвестным параметПусть, как обычно, имеется выборка Xром θ ∈ Θ ⊆ R. До сих пор мы занимались «точечным оцениванием» неизвестного параметра — находиличисло («оценку»), способную (из каких-то разумных соображений) заменить параметр.Существует другой подход к оцениванию, при котором мы указываем интервал, в котором с заданнойнаперед вероятностью лежит параметр.
Такой подход называется «интервальным оцениванием». Сразузаметим, (хотя бы из философских соображений): чем больше уверенность в том, что параметр лежитв интервале, тем шире интервал. Так что мечтать найти диапазон, в котором θ лежит с вероятностью 1,бессмысленно — это вся область Θ.5.1Интервальное оценивание~ ε), θ+ (X,~ ε) называется точОпределение 13. Пусть 0 < ε < 1. Интервал (θ− , θ+ ) = θ− (X,ным доверительным интервалом для параметра θ уровня доверия 1 − ε, если для любого θ ∈ ΘPθ θ− < θ < θ+= Pθ (θ− , θ+ ) 3 θ> 1 − ε.~ ε), θ+ (X,~ ε) называется асимОпределение 14.
Пусть 0 < ε < 1. Интервал (θ− , θ+ ) = θ− (X,птотическим доверительным интервалом для параметра θ (асимптотического) уровня доверия1 − ε, если для любого θ ∈ Θlimn→∞ Pθ θ− < θ < θ+= limn→∞ Pθ (θ− , θ+ ) 3 θ> 1 − ε.Замечание 15. Случайны здесь границы интервала (θ− , θ+ ), поэтому читают формулу Pθ (θ− < θ < θ+ )как «интервал (θ− , θ+ ) накрывает параметр θ», а не как «θ лежит в интервале...».
Впрочем, это лишь фразеология (но точно отражающая суть дела).Замечание 16. Знак «> 1−ε» обычно соответствует дискретным распределениям, когда нельзя обязаться добиться равенства: например, для ξ ∈ B1/2 при любом x равенство P(ξ < x) = 0,25 места неимеет, тогда какP(ξ < x) > 0,25⇐⇒x > 0.Прежде чем рассматривать какие-то регулярные способы построения точных и асимптотических ДИ(доверительных интервалов), разберем два примера, предлагающих (очень похожие) способы.Пример 21. Пусть X1 , . . .
, Xn — выборка объема n из нормального распределения Na,σ2 , где a ∈ R,и σ > 0 известно. Требуется построить точный ДИ для параметра a уровня доверия 1 − ε.Вспомним, что нормальное распределение устойчиво по суммированию: (доказать бы!)Свойство 2. Пусть ξ1 ⊂=N,ξ ⊂=N— независимые с.в. Тогдаa1 , σ12 2a2 , σ22cξ1 + dξ2 + g ⊂=N.ca1 + da2 + g, c2 σ12 + d2 σ22ПоэтомуnXXi ⊂= Nna,nσ2 ,1nXXi − na ⊂= N0,nσ2 ,1Pn1Xi − na √ X − a√= n⊂= N0,1 .σnσ√ X −an⊂= N0,1 . По ε ∈ (0, 1) найдем число c > 0, такое что P(−c < η < c) = 1 − ε.σЧисло c — квантиль уровня 1−ε/2 стандартного нормального распределения: (из области воспоминаний)P(−c < η < c) = Φ0,1 (c)−Φ0,1 (−c) = Φ0,1 (c)−(1−Φ0,1 (c)) = 2Φ0,1 (c)−1 = 1−ε |=⇒ Φ0,1 (c) = 1− 2ε .Обозначим η =32Напоминание:Определение 15. Пусть распределение F с функцией распределения F абсолютно непрерывно.
Число τδ называется квантилью уровня δ распределения F, если F (τδ ) = δ.Итак, c = τ1−ε/2 , или −c = τε/2 (квантили стандартного нормального распределения).6ε/2ε/21−ε@@R@c = τ1−ε/2−c = τε/2yРис. 5: Плотность стандартного нормального распределения и квантили.Разрешив неравенство −c < η < c относительно a, получим ДИ√ X −acσcσ1 − ε = P(−c < η < c) = Pa −c < n< c = Pa X − √ < a < X + √.σnn(10)Можно подставить c = τ1−ε/2 :τ1−ε/2 στ1−ε/2 σPa X − √<a<X+ √= 1 − ε.nnτ1−ε/2 στ1−ε/2 σИтак, искомый ДИ уровня доверия 1 − ε имеет вид X − √,X + √.nnВопросы, наводящие на размышления.1.