Н.И. Чернова - Математическая статистика (1115306), страница 9
Текст из файла (страница 9)
Начнем с нормального распределения как с наиболее важного и частовстречающегося.Пример 23. Пусть X1 , . . . , Xn — выборка объема n из нормального распределения Na,σ2 , где a ∈ IR — неизвестный параметр, а σ > 0 известно. Требуется построитьточный ДИ для параметра a уровня доверия 1 − ε.Вспомним, что нормальное распределение устойчиво по суммированию: доказать бы!Свойство 6.Пусть ξ1 имеет нормальное распределение Na1 ,σ2 , ξ2 имеет нор1мальное распределение Na2 ,σ2 , и эти случайные величины независимы. Тогда2η = bξ1 + cξ2 + d имеет нормальное распределение с параметрамиD η = b2 σ21 + c2 σ22 .E η = b a1 + c a2 + d,ПоэтомуnXXi имеет распределение Nna,nσ2 ,1nXXi − na имеет1PnXi − na √1√nσ=распределение N0,nσ2 ,nX−aимеет распределение N0,1 .σ√ X−anимеет стандартное нормальное распределение.
Поσзаданному ε ∈ (0, 1) найдем число c > 0 такое, что P (−c < η < c) = 1 − ε.Итак, величина η =41Число c — квантиль уровня 1 − ε/2 стандартного нормального распределения:P (−c < η < c) = Φ0,1 (c) − Φ0,1 (−c) == Φ0,1 (c) − (1 − Φ0,1 (c)) = 2Φ0,1 (c) − 1 = 1 − ε,или Φ0,1 (c) = 1 − 2ε .Напоминание:Определение 15. Пусть распределение F с функцией распределения F абсолютно непрерывно. Число τδ называется квантилью уровня δ распределения F, еслиF(τδ ) = δ. Если функция F монотонна, квантиль определяется единственным образом.Итак, c = τ1−ε/2 , или −c = τε/2 (квантили стандартного нормального распределения).1−εε/2ε/2y−ccРис.
7: Плотность стандартного нормального распределения и квантили.Разрешив неравенство −c < η < c относительно a, получим точный доверительныйинтервал!1 − ε = Pa (−c < η < c) = Pa√ X−a−c < n<cσ=cσcσ. (13)= Pa X − √ < a < X + √nnМожно подставить c = τ1−ε/2 :Pa X −τ1−ε/2 στ1−ε/2 σ√<a<X+ √nn= 1 − ε.Итак, искомый точный доверительный интервал уровня доверия 1 − ε имеет видτ1−ε/2 στ1−ε/2 σ, X+ √.X− √nnВопросы, на которые стоит себе ответить.1.Зачем мы брали симметричные квантили? Почему не брать границы для ηвида P (τε/3 < η < τ1−2ε/3 ) = 1 − ε? Изобразить эти квантили на графике плотности.Как изменилось расстояние между квантилями? Как изменится длина ДИ?2.
Какой из двух ДИ одного уровня доверия и разной длины следует предпочесть?3. Какова середина полученного в примере 23 ДИ? Какова его длина? Что происходитс границами ДИ при n → ∞?42Пример 24. Пусть X1 , . . . , Xn — выборка объема n из показательного распределения Eα , где α > 0. Требуется построить асимптотический (асимптотически точный)ДИ для параметра α уровня доверия 1 − ε.Вспомним ЦПТ:nP1Xi − n Eα X1√ X − 1/α √ √= n= n αX − 1 ⇒ η,1/αn Dα X1где случайная величина η имеет стандартное нормальное распределение.
По определению слабой сходимости, при n → ∞Pα −c <√n αX − 1 < c → Pα (−c < η < c) = 1 − εпри c = τ1−ε/2 .То естьPα −τ1−ε/2 <√ n αX − 1 < τ1−ε/2 == Pατ1−ε/2τ1−ε/211− √<α< + √XnXXnX!→1−εпри n → ∞.Итак, искомый асимптотический ДИ уровня доверия 1 − ε имеет видτ1−ε/2 1τ1−ε/21− √,+ √XnX XnX!.Сформулируем общий принцип построения точных ДИ:1. Найти функцию G(X, θ), распределение которой G не зависит от параметра θ.Необходимо, чтобы G(X, θ) была обратима по θ при любом фиксированном X.2. Пусть числа g1 и g2 — квантили распределения G такие, что1 − ε = Pθ (g1 < G(X, θ) < g2 ).3. Разрешив неравенство g1 < G(X, θ) < g2 относительно θ (если это возможно), получим точный ДИ.Совершенно аналогично выглядит общий принцип построения асимптотических ДИ:1.
Найти функцию G(X, θ), слабо сходящуюся к распределению G, не зависящему от параметра θ. Необходимо, чтобы G(X, θ) была обратима по θ прилюбом фиксированном X.2. Пусть g1 и g2 — квантили распределения G такие, чтоPθ (g1 < G(X, θ) < g2 ) → Pθ (g1 < η < g2 ) = 1 − ε.3. Разрешив неравенство g1 < G(X, θ) < g2 относительно θ, получим асимптотический ДИ.43Замечание 13. Часто в качестве g1 и g2 берут квантили уровня ε/2 и 1 − ε/2распределения G. Но, вообще говоря, квантили следует выбирать так, чтобы получитьнаиболее короткий ДИ.Пример 25. Попробуем, пользуясь приведенной выше схемой, построить точныйдоверительный интервал для параметра θ > 0 равномерного на [θ, 2θ] распределения.Xi− 1 имеют распреМы знаем, что если Xi имеют распределение Uθ,2θ , то Yi =θделение U0,1 .
Тогда величинаY(n) = max{Y1 , . . . , Yn } =X(n)max {X1 , . . . , Xn }−1=− 1 = G(X, θ)θθраспределена так же, как максимум из n независимых равномерно распределенныхна [0, 1] случайных величин, то есть имеет не зависящую от параметра θ функциюраспределенияy<00,FY(n) (y) = Pθ (η < y) =yn ,1,y ∈ [0, 1]y > 1.Для любых положительных g1 и g2Pθ (g1 < G(X, θ) < g2 ) = PθX(n)− 1 < g2 =θX(n)X(n). (14)<θ<= Pθg2 + 1g1 + 1g1 <Длина доверительного интервала равна X(n) ·(g2 −g1 )/ (g1 +1)(g2 +1) и уменьшаетсяс ростом g1 и g2 и с их сближением.Плотность распределения Y(n) на отрезке [0, 1] равна nyn−1 и монотонно возрастает.
Поэтому самые большие значения квантилей g1 и g2 при самом маленькомрасстоянии между ними и при фиксированной площади под графиком плотности достигается выбором g2 = 1, а g1 такого, чтобы 1 − ε = Pθ (g1 < Y(n) < 1).Pθ (g1 < Y(n) < 1) = FY(n) (1) − FY(n) (g1 ) = 1 − gn1 = 1 − ε, т. е. g1 =√nε.Подставим найденные квантили в (14):1 − ε = Pθ√nε < Y(n) < 1 = PθX(n)X(n)√ .<θ<21+ nεУпражнение. Можно ли, пользуясь схемой примера 23, построить точный ДИдля σ при известном a, если разрешить неравенство −c < η < c в (13) относительно σ? Можно предположить, например, что X−a > 0. Чем плох интервал бесконечнойдлины? А получился ли у Вас интервал бесконечной длины?√ X−aИз упражнения видно, что функция G вида nне годится для построенияσточного ДИ для σ при известном a, а тем более при неизвестном a.
В следующейглаве мы займемся поиском подходящих функций. Следующий пример (как и пример 24) показывает, что ЦПТ дает универсальный вид функции G для построенияасимптотических ДИ.44Пример 26. Пусть X1 , . . . , Xn — выборка объема n из распределения Пуассона Пλ , где λ > 0. Требуется построить асимптотический ДИ для параметра λ уровнядоверия 1 − ε.Вспомним ЦПТ:nP1Xi − nEλ X1√ X−λ√= n √ ⇒ η,nDλ X1λгде η имеет стандартное нормальное распределение. По определению слабой сходимости, при n → ∞!Pλ√ X−λ−c < n √ < cλ→ Pλ (−c < η < c) = 1 − ε при c = τ1−ε/2 .Но разрешить неравенство под знаком вероятности относительно λ не просто — получается квадратное неравенство√ из-за корня в знаменателе.
Не испортится ли сходимость,√если мы заменим λ на X?pПо свойствам слабой сходимости, если ξn −→ 1 и ηn ⇒ η, то ξn ηn ⇒ η. Оценкаλ∗ = X состоятельна, поэтомуλ p−→ 1.XТогдаsλ √ X−λ √ X−λ⇒ η.· n √ = n √XλXПоэтому иPλ −τ1−ε/2√ X−λ< τ1−ε/2< n √X!→ Pλ (−τ1−ε/2 < η < τ1−ε/2 ) = 1 − ε.Разрешая неравенство под знаком вероятности относительно λ, получим√√ τ1−ε/2 Xτ1−ε/2 X → 1 − ε при n → ∞.√√Pλ X −<λ<X+nnИтак, искомый асимптотический ДИ уровня доверия 1 − ε имеет вид√√ τ1−ε/2 Xτ1−ε/2 XX −.√√, X+nnВместо ЦПТ для построения асимптотических ДИ можно использовать асимптотически нормальные оценки (что по сути — та же ЦПТ): если θ∗ — АНО дляпараметра θ с коэффициентом σ2 (θ), тоG(X, θ) =√ θ∗ − θn⇒ η,σ(θ)где η имеет стандартное нормальное распределение.Замечание 14.
Если σ(θ) в знаменателе мешает, то, как в примере 26, ее можнозаменить состоятельной оценкой σ(θ∗ ). Достаточно, чтобы функция σ(θ) была непрерывной во всей области Θ. Требуется лишь ответить себе: почему θ∗ — состоятельнаяоценка для θ?456. Распределения, связанные с нормальнымВ предыдущей главе мы построили (в числе других) точный доверительный интервал для параметра a нормального распределения при известном σ2 . Для этого мырассмотрели функцию от выборки и неизвестного параметра a√ X−an,σимеющую при любом a стандартное нормальное распределение.G(X, a) =Остались нерешенными следующие проблемы:2) построить точный ДИ для σ при известном a,3) построить точный ДИ для a при неизвестном σ,4) построить точный ДИ для σ при неизвестном a.Как мы уже видели, для решения этих задач требуется отыскать функции от выборки и параметров, распределение которых было бы известно.
При этом в задаче (3)искомая функция не должна зависеть от неизвестного σ, а в задаче (4) — от a.Такой особый интерес к нормальному распределению связан, разумеется, с центральной предельной теоремой — по большому счету все в этом мире нормально (илиблизко к тому).Займемся поэтому распределениями, связанными с нормальным распределением, ихсвойствами и свойствами выборок из нормального распределения.6.1. Гамма-распределение и его свойстваС определением гамма-распределения мы познакомились в курсе теории вероятностей. вспомнить! Нам понадобится свойство устойчивости по суммированию этогораспределения, которое до сих пор было доказано только в частном случае — когданезависимые слагаемые имеют одно и то же показательное распределение Eα = Гα,1 .Свойство 7. Пусть ξ1 , .
. . , ξn независимы, и ξi имеет гамма-распределение Гα,λi ,i = 1, . . . , n. ТогдаnXξi имеет распределение Гα,Pn1 λi .Sn =i=1Доказательство свойства устойчивости по суммированию (свойства 7).Воспользуемся свойствами характеристических функций. Характеристическая функциягамма-распределения Гα,λ вычислена нами в курсе теории вероятностей и равнаitξϕξ (t) = E eit= 1−α−λ.Характеристическая функция суммы независимых случайных величин есть произведение характеристических функций слагаемых:ϕSn (t) =nYϕξi (t) =i=1n Yi=1it1−α−λi— х.ф. распределения Гα,Pn1 λi .46it= 1−α− Pn λi1Свойство 8.
Если ξ имеет стандартное нормальное распределение, то ξ2 имеетгамма-распределение Г1/2,1/2 .Доказательство. Найдем производную функции распределения величины ξ2 и убедимся, что она является плотностью распределения. При y 6 0Fξ2 (y) = P (ξ2 < y) = 0, поэтому и плотность fξ2 (y) = 0.При y > 0√√√√Fξ2 (y) = P (ξ2 < y) = P (− y < ξ < y) = Fξ ( y) − Fξ (− y).Тогда√√√√= Fξ0 ( y) · ( y) 0 − Fξ0 (− y) · (− y) 0 =√fξ ( y)√√ 11=√e−y/2 .= fξ ( y) + fξ (− y) · √ = √2 yy2πy0fξ2 (y) = Fξ2 (y)Но функция fξ2 (y), равная 0 при y 6 0, и равнаяfξ2 (y) = √1(1/2)1/2 1/2−1 −y/2yee−y/2 =Γ (1/2)2πyпри y > 0, является плотностью гамма-распределения Г1/2,1/2 .6.2. Распределение «хи-квадрат» и его свойстваИз свойства 7 и свойства 8 непосредственно следует утверждение:Следствие 2. Если ξ1 , .
. . , ξk независимы и имеют стандартное нормальноераспределение, то случайная величинаχ2k = ξ21 + . . . + ξ2kимеет гамма-распределение Γ1/2,k/2 .Определение 16. Распределение суммы k квадратов независимых стандартных нормальных случайных величин называют распределением «хи-квадрат» с k степенями свободы и обозначают Hk . Согласно следствию 2, распределение Hk совпадает с Г1/2,k/2 .На графике ниже изображены плотности распределения Hk = Г1/2,k/2 при k равном 1, 2, 4 и 8.Упражнение. Доказать, что при k > 2 максимум плотности распределения Hkдостигается в точке k − 2.47H1Вид плотности χ2 -распределения в зависимости от числа степеней свободыH2 = E1/20,5H402H86Мы часто будем обозначать через χ2k случайную величину с распределением Hk .Рассмотрим свойства χ2 -распределения:1.Устойчивость по суммированию. Пусть случайная величина χ2k имеет распределение Hk , случайная величина χ2m имеет распределение Hm , причем эти случайныевеличины независимы.