1625915145-5b3debabab98d9e994cc3a1bc8da0f5b (843876), страница 11
Текст из файла (страница 11)
ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕЗ а м е ч а н и е 11. Случайныздесь )границы интервала (θ− , θ+ ), по( −этому читают формулу P θ < θ < θ+ как «интервал (θ− , θ+ ) накрывает параметр θ », а не как « θ лежит в интервале. . . ».З а м е ч а н и е 12. Неравенство « ⩾ 1 − ε » обычно соответствует дискретным распределениям, когда нельзя обязаться добиться равенства: на= B1/2 при любом x равенство P(ξ < x) = 0,25 невозпример, для ξ ⊂можно, а неравенство имеет смысл:P(ξ < x) ⩾ 0,25дляx > 0.Если вероятность доверительному интервалу накрыть параметр равна1 − ε (или стремится к 1 − ε ), интервал называют точным (или асимптотически точным) доверительным интервалом.Прежде чем рассматривать какие-то регулярные способы построенияточных и асимптотических доверительных интервалов, разберем два примера, предлагающих очень похожие способы, и затем попробуем извлечьиз этих примеров некоторую общую философию построения точныхи асимптотически точных доверительных интервалов.П р и м е р 26.
Пусть X1 , . . . , Xn — выборка объёма n из нормального распределения Na, σ2 , где a ∈ R — неизвестный параметр, а значениеσ > 0 известно. Требуется при произвольном n построить точный доверительный интервал для параметра a уровня доверия 1 − ε.Знаем, что нормальное распределение устойчиво по суммированию.Л е м м а 3.
Пусть случайные величины ξi , где i = 1, 2, имеют нормальные распределения Nai , σ2 и независимы. Тогда случайная величинаiη = bξ1 + cξ2 + d имеет нормальное распределение с параметрамиE η = b a1 + c a2 + d,D η = b2 σ21 + c2 σ22 .У п р а ж н е н и е . Доказать лемму 3.Поэтому распределение суммы элементов выборки при любом её объ= Nna, nσ2 , а центрированнаяёме n нормально: nX = X1 + . .
. + Xn ⊂и нормированная величинаη=√ X −anX − na√= nσσ nимеет стандартное нормальное распределение.По заданному ε ∈ (0, 1) найдём число c > 0 такое, чтоP(−c < η < c) = 1 − ε.59§ 1. Доверительные интервалыεЧисло c является квантилью уровня 1 −стандартного нормального2распределения (рис. 7):εP(−c < η < c) = Φ0, 1 (c)−Φ0,1 (−c) = 2Φ0, 1 (c)−1 = 1− ε, Φ0, 1 (c) = 1− .2Напомним определение.О п р е д е л е н и е 17. Пусть распределение F с функцией распределения F абсолютно непрерывно.
Число τδ называется квантилью уровняδ распределения F, если F (τδ ) = δ. Если функция F строго монотонна,квантиль определяется единственным образом.1−εε/2ε/2−cycРис. 7. Квантили стандартного нормального распределенияПо заданному ε в таблице значений функции Φ0, 1 (x) найдём квантилиc = τ1−ε/2 или −c = τε/2 .
Разрешив затем неравенство −c < η < cотносительно a, получим точный доверительный интервал:()√ X −a1 − ε = P(−c < η < c) = P −c < n<c =σ()cσcσ= P X−√ <a<X+√ .nnМожно подставить c = τ1−ε/2 :(σ τ1−ε/2P X− √<a<X+nσ τ1−ε/2√n)= 1 − ε.Итак, искомый точный доверительный интервал уровня доверия 1 − εимеет вид)(σ τ1−ε/2σ τ1−ε/2, X+ √.(14)X− √nnУ п р а ж н е н и е . Имеет смысл ответить на несколько вопросов.1. Зачем мы брали симметричные квантили? Почему не брать границыдля η вида P(τε/3 < η < τ1−2ε/3 ) = 1 − ε ? Изобразить эти квантили на60ГЛАВА V.
ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕграфике плотности. Как изменилось расстояние между квантилями? Какизменится длина доверительного интервала?2. Какой из двух доверительных интервалов одного уровня доверияи разной длины следует предпочесть?3. Какова середина полученного в примере 26 доверительного интервала? Какова его длина? Что происходит с границами доверительногоинтервала при n → ∞ ? Как быстро это с ними происходит?П р и м е р 27. Пусть X1 , . .
. , Xn — выборка объёма n из показательного распределения Eα , где α > 0. Требуется построить асимптотический (асимптотически точный) доверительный интервал для параметраα уровня доверия 1 − ε.Вспомним ЦПТ:∑)√ X − 1/α√ (Xi − n EX1= N0, 1 .√= n= n αX − 1 ⇒ η ⊂1/αn DX1Возьмём c = τ1−ε/2 — квантиль стандартного нормального распределения. По определению слабой сходимости, при n → ∞))(√ (P −c < n αX − 1 < c → P(−c < η < c) = 1 − ε.)√ (Разрешив относительно α неравенство −τ1−ε/2 < n αX − 1 < τ1−ε/2 ,получим асимптотический доверительный интервал:()τ1−ε/2τ1−ε/211P− √<α<+ √→ 1 − ε при n → ∞.XnXXnX§ 2.
Принципы построения доверительных интерваловОбщий принцип построения точных доверительных интервалов. Чтобы построить точный доверительный интервал, необходимо реализоватьследующие шаги.⃗ θ), распределение которой G не зависит от1. Найти функцию G(X,⃗ θ) была обратима по θ при любомпараметра θ.
Необходимо, чтобы G(X,⃗фиксированном X.2. Найти числа g1 и g2 — квантили распределения G, для которых⃗ θ) < g2 ).1 − ε = P(g1 < G(X,⃗ θ) < g2 относительно θ, получить3. Разрешив неравенство g1 < G(X,точный доверительный интервал.61§ 2. Принципы построения доверительных интерваловЗ а м е ч а н и е 13. Часто в качестве g1 и g2 берут квантили распределения G уровней ε/2 и 1 − ε/2. Но, вообще говоря, квантили следуетвыбирать так, чтобы получить самый короткий доверительный интервал.П р и м е р 28.
Попробуем, пользуясь приведённой выше схемой, построить точный доверительный интервал для параметра θ > 0 равномерного на отрезке [θ, 2θ] распределения.Мы знаем, что если Xi имеют распределение Uθ, 2θ , то Yi =имеют распределение U0, 1 . Тогда величинаY(n) = max{Y1 , . . . , Yn } =max {X1 , . . . , Xn }θ−1=X(n)θXiθ−1⃗ θ)− 1 = G(X,распределена так же, как максимум из n независимых равномерно распределённых на отрезке [0, 1] случайных величин, т. е. имеет не зависящую от параметра θ функцию распределения0, если y < 0F Y(n) (y) = P(η < y) = y n , если y ∈ [0, 1]1, если y > 1.Для любых положительных g1 и g2()()X(n)X(n)⃗ θ) < g2 = PP g1 < G(X,<θ<.g2 + 1g1 + 1(15)Длина доверительного интервала 15 равнаX(n) ·g2 − g1(g1 + 1)(g2 + 1)и уменьшается с ростом g1 и g2 и с их сближением.
Выберем квантилиg1 и g2 так, чтобы длина интервала стала наименьшей.Плотность распределения Y(n) на отрезке [0, 1] равна ny n−1 и монотонно возрастает. Поэтому самые большие значения g1 и g2 при самоммаленьком расстоянии между ними и при фиксированной площади 1 − εпод графиком плотности возможны при g2 = 1, а g1 таком, что1 − ε = P(g1 < Y(n) < 1) = F Y(n) (1) − F Y(n) (g1 ) = 1 − g1n ,√т. е. при g1 = n ε. Подставим найденные квантили в (15):()(√)XX(n)(n)√1 − ε = P n ε < Y(n) < 1 = P<θ<.n21+ε62ГЛАВА V.
ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕУ п р а ж н е н и е . Можно ли, пользуясь схемой примера 26, построитьточный доверительный интервал для параметра σ при известном значении a, если разрешить неравенство√ X −a<c−c < nσотносительно σ ? Чем плох интервал бесконечной длины? А получился лиинтервал бесконечной длины?Можно построить точный доверительный интервал для параметра σпри известном значении a (сделайте это !) по функции√⃗ σ2 , a) = n |X − a| .G(X,σНо при неизвестном a по этой функции нельзя построить точный доверительный интервал для параметра σ : границы интервала не могут зависетьот неизвестного параметра a.
В следующей главе мы займёмся поискомподходящих для решения этой задачи функций.Общий принцип построения асимптотических доверительных интервалов. Необходимо проделать следующее.⃗ θ), слабо сходящуюся к распределению G,1. Найти функцию G(X,⃗ θ) была обране зависящему от параметра θ. Необходимо, чтобы G(X,⃗тима по θ при любом фиксированном X.2. Найти числа g1 и g2 — квантили распределения G, для которых⃗ θ) < g2 ) → P(g1 < η < g2 ) = 1 − ε, где η ⊂= G.P(g1 < G(X,⃗ θ) < g2 относительно θ, получить3. Разрешив неравенство g1 < G(X,асимптотически точный доверительный интервал.Следующий пример (как и пример 27) показывает, что ЦПТ дает универсальный вид функции G для построения асимптотических доверительных интервалов.П р и м е р 29.
Пусть X1 , . . . , Xn — выборка объёма n из распределения Пуассона Πλ , где λ > 0. Требуется построить асимптотическийдоверительный интервал для параметра λ уровня доверия 1 − ε.Согласно ЦПТ√ X −λ. + Xn − nEX1⃗ λ) = X1 + . .√G(X,= n √ ⇒ η,nDX1λгде случайная величина η имеет стандартное нормальное распределение.Пусть c = τ1−ε/2 — квантиль уровня 1 − ε/2 стандартного нормального§ 2. Принципы построения доверительных интервалов63распределения. По определению слабой сходимости, при n → ∞()√ X −λP −c < n √ < c → P(−c < η < c) = 1 − ε.λНо разрешить неравенство под знаком вероятности относительно λ непросто: мешает корень в знаменателе.
Попробуем√ Не ис√ от него избавиться.портится ли сходимость, если мына X, т. е.√√ заменим λ, например,⃗умножим функцию G(X, λ) на λ и поделим на X ?Воспользуемся (в который раз?) следующим свойством слабой сходиpмости: если ξn −→ 1 и ηn ⇒ η, то ξn · ηn ⇒ η. Оценка λ∗ = X состоятельна, поэтому√λXТогда√λX·p−→ 1 при n → ∞.√ X −λ√ X −λ= N0, 1 .n √ = n √⇒η⊂λXПоэтому при c = τ1−ε/2()√ X −λP −c < n √< c → P(−c < η < c) = 1 − ε.XРазрешив неравенство под знаком вероятности относительно λ, получим(√ )√c XXP X− √ <λ<X+ √→ 1 − ε при n → ∞.nnИтак, искомый асимптотический доверительный интервал уровня доверия 1 − ε имеет вид√√ )(τ1−ε/2 Xτ1−ε/2 X√√X−, X+.nnДля построения асимптотических доверительных интервалов можноиспользовать асимптотически нормальные оценки (это тоже ЦПТ).Т е о р е м а 16.
Пусть θ∗ — АНО для параметра θ с коэффициентомσ2 (θ), и функция σ(θ) непрерывна в области Θ. Тогда интервал()τ1−ε/2 σ(θ∗ )τ1−ε/2 σ(θ∗ )∗∗√√θ −, θ +nnявляется асимптотическим доверительным интервалом для параметра θ уровня доверия 1 − ε.64ГЛАВА V. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕД о к а з а т е л ь с т в о. По определению АНО√ θ∗ − θ= N0, 1 .n⇒η⊂σ(θ)Оценка θ∗ асимптотически нормальна и, следовательно, состоятельна.Применяя к ней непрерывную функцию σ(θ), получаемσ(θ)pσ(θ∗ ) −→ σ(θ),σ(θ∗ )⃗ θ) возьмёмВ качестве функции G(X,√ ∗√⃗ θ) = n θ − θ = σ(θ) · nG(X,∗∗σ(θ )σ( θ )p−→ 1.θ∗ − θσ(θ)= N0, 1 .⇒η⊂Пусть c = τ1−ε/2 — квантиль стандартного нормального распределения.Разрешив неравенство√ θ∗ − θ−c < n∗ <cσ(θ )относительно θ, получим асимптотический доверительный интервал)(∗)∗)cσ(θcσ(θ.θ∗ − √ , θ∗ + √nn√Полезно отметить, что длина этого интервала ведёт себя как 1/ n, потому что именно с такой скоростью асимптотически нормальная оценкасближается с параметром.§ 3.
Вопросы и упражнения1. Что больше: квантиль стандартного нормального распределенияуровня 0,05 или уровня 0,1? Почему? Нарисовать их на графике плотности этого распределения.2. Пусть X1 , . . . , Xn — выборка из равномерного распределения на отрезке [0, θ]. Построить точные доверительные интервалы для параметраθ, используя статистики X1 и X(n) .3. Пусть X1 , . . .