Н.И. Чернова - Математическая статистика (1119916), страница 11
Текст из файла (страница 11)
. . , Xn — выборка объёма n из показательного распределения Eα , где α > 0. Требуется построить асимптотический(асимптотически точный) доверительный интервал для параметра α уровня доверия 1 − ε.Вспомним ЦПТ:P√ X − 1/α√Xi − n EX1= N0, 1 .p= n= n αX − 1 ⇒ η ⊂1/αn DX1Возьмём c = τ1−ε/2 — квантиль стандартного нормального распределения.По определению слабой сходимости, при n → ∞√P −c < n αX − 1 < c → P(−c < η < c) = 1 − ε.√Разрешив относительно α неравенство −τ1−ε/2 < n αX − 1 < τ1−ε/2 ,получим асимптотический доверительный интервал:τ1−ε/2τ1−ε/211P− √<α<+ √→ 1 − ε при n → ∞.XnXXnX§ 2.
Принципы построения доверительных интерваловОбщий принцип построения точных доверительных интервалов. Чтобы построить точный доверительный интервал, необходимо реализоватьследующие шаги.~ θ), распределение которой G не зависит от1. Найти функцию G(X,~ θ) была обратима по θ при любомпараметра θ. Необходимо, чтобы G(X,~фиксированном X.2. Найти числа g1 и g2 — квантили распределения G, для которых~ θ) < g2 ).1 − ε = P(g1 < G(X,~ θ) < g2 относительно θ, получить3. Разрешив неравенство g1 < G(X,точный доверительный интервал.61§ 2.
Принципы построения доверительных интерваловЗ а м е ч а н и е 13. Часто в качестве g1 и g2 берут квантили распределения G уровней ε/2 и 1 − ε/2. Но, вообще говоря, квантили следуетвыбирать так, чтобы получить самый короткий доверительный интервал.П р и м е р 28. Попробуем, пользуясь приведённой выше схемой, построить точный доверительный интервал для параметра θ > 0 равномерного на отрезке [θ, 2θ] распределения.XМы знаем, что если Xi имеют распределение Uθ, 2θ , то Yi = i − 1θимеют распределение U0, 1 . Тогда величинаY(n) = max{Y1 , . . . , Yn } =max {X1 , . . .
, Xn }θ−1=X(n)θ~ θ)− 1 = G(X,распределена так же, как максимум из n независимых равномерно распределённых на отрезке [0, 1] случайных величин, т. е. имеет не зависящуюот параметра θ функцию распределения0, если y < 0F Y(n) (y) = P(η < y) = y n , если y ∈ [0, 1]1, если y > 1.Для любых положительных g1 и g2X(n)X(n)~ θ) < g2 = PP g1 < G(X,<θ<.g2 + 1g1 + 1(15)Длина доверительного интервала 15 равнаX(n) ·g2 − g1(g1 + 1)(g2 + 1)и уменьшается с ростом g1 и g2 и с их сближением. Выберем квантилиg1 и g2 так, чтобы длина интервала стала наименьшей.Плотность распределения Y(n) на отрезке [0, 1] равна ny n−1 и монотонно возрастает.
Поэтому самые большие значения g1 и g2 при самоммаленьком расстоянии между ними и при фиксированной площади 1 − εпод графиком плотности возможны при g2 = 1, а g1 таком, что1 − ε = P(g1 < Y(n) < 1) = F Y(n) (1) − F Y(n) (g1 ) = 1 − g1n ,√т. е. при g1 = n ε. Подставим найденные квантили в (15):√XX(n)(n)√1 − ε = P n ε < Y(n) < 1 = P<θ<.n21+εУ п р а ж н е н и е . Можно ли, пользуясь схемой примера 26, построитьточный доверительный интервал для параметра σ при известном значе-62ГЛАВА V. ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕнии a, если разрешить неравенство√ X −a−c < n<cσотносительно σ ? Чем плох интервал бесконечной длины? А получился лиинтервал бесконечной длины?Можно построить точный доверительный интервал для параметра σпри известном значении a (сделайте это !) по функции√~ σ2 , a) = n |X − a| .G(X,σНо при неизвестном a по этой функции нельзя построить точный доверительный интервал для параметра σ : границы интервала не могут зависетьот неизвестного параметра a.
В следующей главе мы займёмся поискомподходящих для решения этой задачи функций.Общий принцип построения асимптотических доверительных интервалов. Необходимо проделать следующее.~ θ), слабо сходящуюся к распределению G,1. Найти функцию G(X,~ θ) была обратине зависящему от параметра θ. Необходимо, чтобы G(X,~ма по θ при любом фиксированном X.2. Найти числа g1 и g2 — квантили распределения G, для которых~ θ) < g2 ) → P(g1 < η < g2 ) = 1 − ε, где η ⊂= G.P(g1 < G(X,~ θ) < g2 относительно θ, получить3.
Разрешив неравенство g1 < G(X,асимптотически точный доверительный интервал.Следующий пример (как и пример 27) показывает, что ЦПТ дает универсальный вид функции G для построения асимптотических доверительных интервалов.П р и м е р 29. Пусть X1 , . . . , Xn — выборка объёма n из распределения Пуассона Πλ , где λ > 0.
Требуется построить асимптотическийдоверительный интервал для параметра λ уровня доверия 1 − ε.Согласно ЦПТ√ X −λ. + Xn − nEX1~ λ) = X1 + . .pG(X,= n √ ⇒ η,nDX1λгде случайная величина η имеет стандартное нормальное распределение.Пусть c = τ1−ε/2 — квантиль уровня 1 − ε/2 стандартного нормального§ 2. Принципы построения доверительных интервалов63распределения. По определению слабой сходимости, при n → ∞√ X −λP −c < n √ < c → P(−c < η < c) = 1 − ε.λНо разрешить неравенство под знаком вероятности относительно λ непросто: мешает корень в знаменателе. Попробуем√ Не ис√ от него избавиться.портится ли сходимость, если мына X, т.
е.√√ заменим λ, например,~умножим функцию G(X, λ) на λ и поделим на X ?Воспользуемся (в который раз?) следующим свойством слабой сходимоpсти: если ξn −→ 1 и ηn ⇒ η, то ξn · ηn ⇒ η. Оценка λ∗ = X состоятельна,поэтомуrλXp−→ 1 при n → ∞.ТогдаrλX·√ X −λ√ X −λ= N0, 1 .⇒η⊂n √ = n √λXПоэтому при c = τ1−ε/2√ X −λ< c → P(−c < η < c) = 1 − ε.P −c < n √XРазрешив неравенство под знаком вероятности относительно λ, получим√√ c XXP X− √ <λ<X+ √→ 1 − ε при n → ∞.nnИтак, искомый асимптотический доверительный интервал уровня доверия1 − ε имеет вид√√ τ1−ε/2 Xτ1−ε/2 X√√X−, X+.nnДля построения асимптотических доверительных интервалов можно использовать асимптотически нормальные оценки (это тоже ЦПТ).Т е о р е м а 16. Пусть θ∗ — АНО для параметра θ с коэффициентомσ2 (θ), и функция σ(θ) непрерывна в области Θ. Тогда интервал∗)∗)τσ(θτσ(θ1−ε/2√√θ∗ −, θ∗ + 1−ε/2nnявляется асимптотическим доверительным интервалом для параметраθ уровня доверия 1 − ε.64ГЛАВА V.
ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕД о к а з а т е л ь с т в о. По определению АНО√ θ∗ − θ= N0, 1 .n⇒η⊂σ(θ)Оценка θ∗ асимптотически нормальна и, следовательно, состоятельна.Применяя к ней непрерывную функцию σ(θ), получаемσ(θ)pσ(θ∗ ) −→ σ(θ),σ(θ∗ )~ θ) возьмёмВ качестве функции G(X,√√ ∗~ θ) = n θ − θ = σ(θ) · nG(X,∗∗σ(θ )σ(θ )p−→ 1.θ∗ − θσ(θ)= N0, 1 .⇒η⊂Пусть c = τ1−ε/2 — квантиль стандартного нормального распределения.Разрешив неравенство√ θ∗ − θ−c < n∗ <cσ(θ )относительно θ, получим асимптотический доверительный интервал∗)∗)cσ(θcσ(θθ∗ − √ , θ∗ + √.nn√Полезно отметить, что длина этого интервала ведёт себя как 1/ n, потому что именно с такой скоростью асимптотически нормальная оценкасближается с параметром.§ 3. Вопросы и упражнения1. Что больше: квантиль стандартного нормального распределенияуровня 0,05 или уровня 0,1? Почему? Нарисовать их на графике плотности этого распределения.2. Пусть X1 , .
. . , Xn — выборка из равномерного распределения на отрезке [0, θ]. Построить точные доверительные интервалы для параметраθ, используя статистики X1 и X(n) .3. Пусть X1 , . . . , Xn — выборка из показательного распределения с параметром α. Построить точные доверительные интервалы для параметраα, используя статистики X1 и X(1) .Г Л А В А VIРАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМВ предыдущей главе мы построили в числе других точный доверительный интервал для параметра a нормального распределения при известномσ2 . Остался нерешённым вопрос: как построить точные доверительные интервалы для σ при известном и при неизвестном a, а также для a принеизвестном σ? Мы уже видели, что для решения этих задач требуетсяотыскать такие функции от выборки и неизвестных параметров, распределения которых не зависят от этих параметров.
При этом сами искомыефункции не должны зависеть ни от каких лишних параметров. Особыйинтерес к нормальному распределению связан, разумеется, с центральнойпредельной теоремой: почти всё в этом мире нормально (или близко к тому). В этой главе мы изучим новые распределения, связанные с нормальным, их свойства и свойства выборок из нормального распределения.§ 1. Основные статистические распределенияГамма-распределение. С гамма-распределением мы познакомилисьв курсе теории вероятностей.
Нам понадобится свойство устойчивостипо суммированию этого распределения.Л е м м а 4. Пусть X1 , . . . , Xn независимы, и ξi имеет гамма-распределение Γα, λi , i = 1, . . . , n. Тогда их сумма Sn = ξ1 + . . . + ξn имеетгамма-распределение с параметрами α и λ1 + .
. . + λn .Оказывается, что квадрат случайной величины со стандартным нормальным распределением имеет гамма-распределение.Л е м м а 5. Если ξ имеет стандартное нормальное распределение,то ξ2 имеет гамма-распределение Γ1/2, 1/2 .Д о к а з а т е л ь с т в о.
Найдём производную функции распределениявеличины ξ2 и убедимся, что она является плотностью распределения.При y 6 0Fξ2 (y) = P(ξ2 < y) = 0, поэтому fξ2 (y) = 0.66ГЛАВА VI. РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМПри y > 0√√√√Fξ2 (y) = P(ξ2 < y) = P(− y < ξ < y) = Fξ ( y) − Fξ (− y).Тогда0√√√√fξ2 (y) = Fξ2 (y) = Fξ0 ( y) · ( y)0 − Fξ0 (− y) · (− y)0 =√√√ 1fξ ( y)1= fξ ( y) + fξ (− y) · √ = √= √2 yy2πye−y/2 .Но функция fξ2 (y), равная 0 при y 6 0 и равнаяfξ2 (y) = √1(1/2)1/2 1/2−1 −y/2yee−y/2 =Γ(1/2)2πyпри y > 0, является плотностью гамма-распределения Γ1/2, 1/2 .Распределение χ2 Пирсона. Из лемм 4 и 5 следует утверждение.Л е м м а 6. Если ξ1 , . . .
, ξk независимы и имеют стандартное нормальное распределение, то случайная величинаχ2 = ξ21 + . . . + ξ2kимеет гамма-распределение Γ1/2, k/2 .В статистике это распределение играет совершенно особую роль и имеетсобственное название.О п р е д е л е н и е 18. Распределение суммы k квадратов независимыхслучайных величин со стандартным нормальным распределением называется распределением χ2 (хи-квадрат) с k степенями свободы и обозначается Hk .Согласно лемме 6, распределение Hk совпадает с Γ1/2, k/2 .
Поэтомуплотность распределения Hk равнаk− 1 −y/212ye, если y > 0;f (y) = 2 k/2 Γ(k/2)0,если y 6 0.Заметим ещё, что H2 = Γ1/2, 1 = E1/2 — показательное распределение с параметром α = 1/2.Плотности распределений Hk при k = 1, 2, 4, 8 показаны на рис. 8.У п р а ж н е н и е . Доказать, что при k > 2 максимум плотности распределения Hk достигается в точке y = k − 2.Рассмотрим свойства χ2-распределения. Устойчивость его относительно суммирования следует из устойчивости гамма-распределения.§ 1. Основные статистические распределения67H1H20,5H402H86Рис. 8.