2002. Теория вероятности и математическая статистика. Лектор - В.Г.Ушаков (1120051), страница 13
Текст из файла (страница 13)
Интервальное оценивание1°°. Доверительные интервалы. Будем рассматривать случай одномерного параметра.Под термином интервал в дальнейшем подразумевается некоторой множество, не обязательно интервал в геометрическом смысле.Определение 1. Доверительным интервалом с коэффициентом доверия 0 ≤ α ≤ 1 называется совокупность двух статистик (T1(X), T2(X)) таких, что1) ∀θ ⇒ T1(X) ≤ T2(X) почти всюду,2) ∀θ ⇒ Pθ (T1(X) ≤ θ ≤ T2(X)) ≥ α (иногда = или >).При таком определении точность оценивания есть длина интервала, а надёжность — вероятность попадания параметра в этот интервал.
Возникает дилемма: что делать больше —точность или надёжность: при увеличении надёжности страдает точность и наоборот. Действительно, надёжность можно сделать равной единице, положив интервал (– ∞, + ∞), точностьможно сделать минимальной, положив α = 0. В нашем случае фиксируется надёжность иищется наиболее узкий интервал.2°°. Метод центральной статистики. Рассмотрим случай выборки X1, …, Xn, когдафункция распределения F(X, θ ) непрерывна по X.Определение 2. Функция G(X, θ ) называется центральной статистикой, если1) G(X, θ ) непрерывна и строго монотонна по θ при любом фиксированном X и2) Pθ (G(X, θ ) < t ) = F(t) — непрерывна — ∀θ (не зависит от θ ).Формально определённая величина не является статистикой, так как зависит от неизвестного параметра θ, однако термин «центральная статистика» употребляется именно к определённым выше объектам.
При помощи центральной статистики доверительный интервалстроится по следующему плану:1. Фиксируются α1, α2 ∈ R такие, что Pθ (α1 ≤ G1(X, θ ) ≤ α2) = α ∀θ ⇔ F(α2) – F(α1) = α.621αα1α202. Пусть G(X, θ ) возрастает. Из условийG (X ,θ ) ≤ α 2 ,G (X ,θ ) ≥ α1находятся статистикиT2 ( X ) : G (X , T2 (X )) = α 2 ,⇔ T1 ( X ) ≤ θ ≤ T2 (X ),TX:GX,TX,α()(())=111откуда Pθ (T1(X) ≤ θ ≤ T2(X)) ≥ α ∀θ.α2θПример. X1, …, Xn ~ U([0,θ ]), θ > 0, 0 < α < 1,G (X ,θ ) =max X iiθ.1) Очевидно, G(X, θ ) для любого фиксированного X непрерывная и монотонно убывающая функция.X2) X i ~ U([0,θ ]) ⇒ i ~ U([0,1]) .θ0,Xn max X i X1 max X i n= max ,!,< t = t , ⇒ F (t ) = Pθ θθ θ θ 1,t < 0,0 ≤ t ≤ 1,t > 1.Построим доверительный интервал по указанному алгоритму:1.
Выбираем α1 и α2 такие, что Pθ (α1 ≤ G1(X, θ ) ≤ α2) = α ⇔ F(α2) – F(α1) = α, то есть63max X i≤ α 2 , θ > 0,θ max X imax X i max X imax X i = α ⇒ T1 (X ) =Pθ , T2 (X ) =.≤θ ≤α1 α2α1 α2α 2n − α1n = α , α1 ≤2. Имеем α 2n − α1n = α , 0 ≤ α1 < α2 ≤ 1, при этом требуется, чтобы разность T1(X) – T2(X)11 была минимальной. Разность max X i − минимальна, если α1 α 2 11 − минимально. α1 α 2 α2α1Из условия α 2n − α1n = α ⇒ α 2 = n α1n + α ≤ 1 ⇒ 0 ≤ α1 ≤ n 1 − α , откуда следует, что достаточнонайти11 −minn0≤α1 ≤ n 1−α αnα1 + α 1,который достигается при α1 = n 1 − α .
При этом α2 = 1. Таким образом, доверительным интервалом наивысшей точности являетсяmax X i max X i , n 1 − α .Определение 3. Центральным доверительным интервалом с коэффициентом доверия0 ≤ α ≤ 1 называется совокупность двух статистик (T1(X), T2(X)) таких, что1−α,21−αPθ (T2 (X ) < θ ) =.2Pθ (T1 (X ) > θ ) =3°°. Метод использования точечной оценки. Пусть T(X) — точечная оценка θ. Обозначим H(t,θ ) = Pθ (T(X) < t ). H(t,θ ) — непрерывная и строго монотонная функция θ при любомфиксированном t. В этом случае1−α1−αPθ (T (X ) > α1 (θ )) = 2 ,1 − H (α1 (θ ) + 0,θ ) = 2 ,⇔1−α1−αPθ (T (X ) < α 2 (θ )) = H (α 2 (θ ),θ ) =,.22Лемма. Если H(t,θ ) возрастает по θ, то α1(θ ) и α2(θ ) убывают.
Если же H(t,θ ) убываетпо θ, то α1(θ ) и α2(θ ) возрастают.64Доказательство. Пусть H(t,θ ) возрастает. Предположим, что θ1 < θ2 ⇒ α2(θ1 ) ≤ α2(θ2) ирассмотрим α2(θ ), учитывая, что H(t,θ ) как и всякая функция распределения, неубывает попервому аргументу:1−α1−α.= H (α 2 (θ1 ),θ1 ) < H (α 2 (θ1 ),θ 2 ) ≤ H (α 2 (θ 2 ),θ 2 ) =22Полученное противоречие завершает доказательство.Из леммы следует, что для любого θ1−α,2 ⇒ P ϕ (T (X )) ≤ θ ≤ ϕ (T (X )) = α .21θ *')'(*')'(1−αα 2 (θ ) > T (X ) ⇔ θ < ϕ 2 (T (X )) ⇒ Pθ (θ < ϕ 2 (T (X ))) =,T2 ( X ) T1 ( X )2α1 (θ ) < T (X ) ⇔ θ > ϕ1 (T (X )) ⇒ Pθ (θ > ϕ1 (T (X ))) =Пример. X1, …, Xn ~ Pois(θ ), θ > 0,n∑Xi =1T (X ) =i~ Pois(nθ ) , точечная оценка θ1 nk(nθ ) , k = 0, 1, …, n, …X i = X ⇒ Pθ X = = e −nθ∑n i=1nk!kH (t ,θ ) = Pθ (X < t ) =mτ (θ ) = ∑ ek =0− nθ(nθ )kk!m⇒ τ ′(θ ) = ∑ (− n )e −nθk =0∑ e − nθk!kk : <tn(nθ )kk!(nθ )k ,m+ ∑e− nθk =1n(nθ )(nθ ) < 0 ,= − ne −nθm!(k − 1)!следовательно, функция H(t,θ ) убывает.
Из условий1−α1 − H (α1 (θ ) + 0,θ ) = 2 ,1−α H (α 2 (θ ),θ ) =2получаем уравнения для α1(θ ) и α2(θ ):k1−α− nθ (nθ ),=e ∑2k!k <nα 2 (θ )k1−α−nθ (nθ ),e=∑ k ≥nα1 (θ )2k!а из условийα1 (θ ) < T (X ),θ < ϕ1 (T (X )),⇔α 2 (θ ) > T ( X )θ > ϕ 2 (T (X ))получаемα1 (ϕ1 (T (X ))) = T (X ),α 2 (ϕ 2 (T (X ))) = T ( X ),откуда получаем окончательные уравнения для α1 и α2:65k −1mkk1−α1−α− nϕ 2 (T ( X )) (nϕ 2 (T ( X )))− nϕ 2 (T ( X )) (nϕ 2 (T ( X )))e,=e,=∑ ∑k!2k!2k <nα 2 (ϕ 2 (T ( X )))k <nT ( X )⇔kk1−α1−α−nϕ1 (T ( X )) (nϕ1 (T ( X )))−nϕ1 (T ( X )) (nϕ1 (T ( X )))ee.==∑∑ k ≥nα1 (ϕ1 (T ( X ))) k ≥nT ( X )k!2k!24°°. Асимптотические доверительные интервалы строятся исходя из слабой сходимости последовательности случайных величинT (X ) − α n (θ )⇒ ξ ~ N (0,1) .β n (θ )§9.
Проверка гипотез1°°. Гипотезы. Пусть X1, …, Xn — выборка с распределением F(X,θ ), где θ ∈ Θ ⊂ R. Вэтом случае любое подмножество Θ0 ⊂ Θ соответствует гипотезе:Θ0 → H 0 : θ ∈ Θ 0 − основная гипотеза,Θ1 → H1 : θ ∈ Θ1 − альтернативаΘ 0 ∩ Θ1 = ∅ .Гипотеза Θ0 называется простой, если она состоит из одной точки: Θ0 = {θ0}, и сложной впротивном случае.Пусть ϕ (X) = ϕ (X1, …, Xn): 0 ≤ ϕ (X) ≤ 1 — критическая функция, при этом по определению ϕ (X) — это вероятность отвергнуть основную гипотезу при выборке X1, …, Xn.Ошибка первого рода заключается в том, что основная гипотеза H0 отвергается, в товремя как она верна, ошибка второго рода — H0 принимается, в то время как она неверна.Исходя из определения критической функции (критерия), вероятностью ошибки первого рода является математическое ожидание Eθ ϕ (X) = α (θ ), θ ∈ Θ0.
Функцией мощности называется β (θ ) = Eθ ϕ (X), θ ∈ Θ1 — вероятность принятия правильного решения в случае справедливости альтернативной гипотезы. Из определения следует, что вероятность ошибки второго рода равна 1 – β (θ ).Если критерий не принимает иных значений, кроме 0 и 1, то он называется нерандомизированным, если же критерий хотя бы в одной точке принимает значение, лежащее строгомежду нулём и единицей, то он называется рандомизированным. Размером критерия называется наибольшая вероятность ошибки первого рода:max α (θ ) = α .θ ∈Θ0еслиБудем выбирать критерии так, чтобы при фиксированном α достичь max β (θ ).Критерий ϕ (X) называется равномерно наиболее мощным критерием размерности α,1.
max Eθ ϕ (X ) = α иθ ∈Θ02. для любого критерия ϕ∗ размерности α и для любого θ ∈ Θ1 ⇒ Eθ ϕ (X) ≥ Eθ ϕ∗(X).2°°. Лемма Неймана-Пирсона.Лемма [Ю. Нейман, Э. С. Пирсон]. Пусть выборка X1, …, Xn имеет функцию распределения F(X, θ ), где θ ∈ Θ ⊂ R и функцию правдоподобия L(X, θ ). Введём класс Ф критических функций: относительно двух простых гипотез H0: θ = θ0, H1: θ = θ1 ≠ θ0, 0 < α < 1, где α— заданный размер критерия, Kα — некоторое значение:66 L ( X ,θ 1 )1, L(X ,θ ) > Kα ,0Φ = ϕ : ϕ (X ) = L(X ,θ1 )0,< Kα . L(X ,θ 0 )Отметим, что класс включает в себя все функции, удовлетворяющие указанным условиям иL(X ,θ1 )принимающие при= Kα любые значения.
Отметим также, что для разных значенийL(X ,θ 0 )Kα соответствующие классы Ф будут, вообще говоря, разными. Тогда:1. ∀0 < α < 1 ⇒ ∃ϕ ∈ Φ : Eθ0ϕ (X ) = α (Существует критерий любого размера).2. Если ϕ ∈ Ф и Eθ 0 ϕ (X ) = α , то ϕ —наиболее мощный критерий.3. Если ϕ — наиболее мощный критерий размера α, то ϕ ∈ Ф (Необходимость).Доказательство. 1. Введём функцию L(X ,θ1 )α (c ) = Pθ 0 > c . L ( X ,θ 0 )α (c) монотонно невозрастает, непрерывна справа и α (c ) c→1 , α (c ) c→ 0 . Возмож→−∞→+∞ны два случая:a) Существует такое c = Kα : α (Kα ) = α.1α0Тогда положим L(X ,θ1 )1, L(X ,θ ) > Kα ,0ϕ (X ) = L(X ,θ1 )0,≤ Kα . L(X ,θ 0 )Очевидно, ϕ (X) ∈ Ф и L ( X ,θ 1 )Eθ0ϕ (X ) = 1 ⋅ Pθ0 > Kα = α . L ( X ,θ 0 )b) Существует Kα такое, что α (Kα ) < α < α (Kα – 0).1α067В этом случае положим 1,ϕ (X ) = γ α , 0,L ( X ,θ1 )> Kα ,L ( X ,θ 0 )L ( X ,θ1 )= Kα ,L ( X ,θ 0 )L(X ,θ1 )< Kα ,L ( X ,θ 0 )гдеγα =α − α (Kα ).α (Kα − 0 ) − α (Kα )Очевидно, 0 < γα < 1 и L ( X ,θ1 ) L ( X ,θ1 )Eθ0ϕ (X ) = 1 ⋅ Pθ0 > Kα + γ α Pθ 0 = Kα = L ( X ,θ 0 ) L ( X ,θ 0 )α − α (Kα )= α (Kα ) +⋅ (α (Kα − 0) − α (Kα )) = α .α (Kα − 0) − α (Kα )Попутно доказано (случай b)), что существует функция из класса ϕ, постоянная на границе(γα не зависит от X).2.
и 3. Пусть ϕ ∈ Ф — критерий размера α. Пусть ϕ∗ — какой-либо другой критерийразмера α. Покажем, что ϕ∗ ∈ Ф. Для этого рассмотрим функцию(ϕ (X) – ϕ∗(X))(L(X, θ1) – Kα L(X, θ0))и интеграл от неё∫ (ϕ (X )− ϕ (X ))(L(X ,θ ) − K L(X ,θ ))µ (dx ) .∗α10RnРазобьём множество, на котором подынтегральная функция равна нулю на две части:A = {x : L(x,θ1) = Kα L(x,θ0)},B = {x : ϕ (x) = ϕ∗(x)}.Имеем∫ (ϕ (X ) − ϕ (X ))(L(X ,θ ) − K L(X ,θ ))µ (dx ) ≥ 0 .∗1α0Rn \ AРассмотрим значения x : L(x,θ1) – Kα L(x,θ0) > 0.
При этом ϕ = 1, ϕ∗ ≤ 1 ⇒ ϕ – ϕ∗ ≥ 0 и подынтегральная функция неотрицательна. При x : L(x,θ1) – Kα L(x,θ0) < 0, очевидно, ϕ = 0, ϕ∗ ≥ 0 ⇒ϕ – ϕ∗ ≤ 0 и подынтегральная функция снова неотрицательна. При этом∫ (ϕ (X ) − ϕ (X ))(L(X ,θ ) − K L(X ,θ ))µ (dx ) > 0 ,∗n1α0R \ A\ Bследовательно, возможно ϕ (X) = ϕ∗(X) почти всюду, возможно их различия сосредоточенына границе. Поскольку класс Ф допускает любые значения на границе, ϕ∗ ∈ Ф.Пусть теперь ϕ∗ ∉ Ф (>).
Тогда68(> )∫ (ϕ (X ) − ϕ (X ))(L(X ,θ ) − K L(X ,θ ))µ (dx ) ≥ 0 ⇔∗α10Rn(> )∫ (ϕ (X ) − ϕ (X ))L(X ,θ )µ (dx ) − K ∫ (ϕ (X )− ϕ (X ))L(X ,θ )µ (dx ) ≥ 0 ⇒∗∗α1Rn0Rn*''''')'''''(=Eθ 0ϕ ( X )−Eθ 0 ϕ ∗ ( X )=0*')'( *')'(=α(> )=α(> )∫ ϕ (X )L(X ,θ )µ (dx ) ≥ ∫ ϕ (X )L(X ,θ )µ (dx ) ⇔ β (θ ) ≥ β (θ )∗1Rn11∗1Rn*''')'''( *''')'''(= β (θ1 )=Eθ1ϕ ( X )= β ∗ (θ1 )=Eθ1ϕ ∗ ( X )и из того, что ϕ∗ ∉ Ф следует, что ϕ∗ не является наиболее мощным.Лемма доказана.Пример. X1, …, Xn ~ Pois(θ ), требуется построить критерий размера α для проверкиследующих гипотез: H0: θ = θ0 ; H1: θ = θ1 < θ0.
Построим его, исходя из леммы НейманаПирсона: 1,ϕ (X ) = γ α , 0,L ( X ,θ1 )> Kα ,L ( X ,θ 0 )L ( X ,θ1 )= Kα , Eθ0ϕ (X ) = α .L ( X ,θ 0 )L(X ,θ1 )< Kα ,L ( X ,θ 0 )Функция правдоподобия в данном случае принимает видnL(X ,θ ) = e −nθXi∑i 1θ =.X 1!$ X n !Таким образом, требуется решить неравенствоn∑ XinL(X ,θ1 )− n (θ1 −θ 0 ) θ 1 i =1 =e> Kα ⇔ − n(θ1 − θ 0 ) + ∑ X i (ln θ1 − ln θ 0 ) > Kα ⇔L ( X ,θ 0 )i =1θ0 n∑ X i (lnθ1 − lnθ 0 ) > Kα ⇔i =1n∑Xi =1i< Kα .Итак, критерием является функцияn1,X i > Kα ,∑i =1n n nϕ (X ) = γ α , ∑ X i = Kα , Eθ 0ϕ (X ) = Pθ0 ∑ X i < Kα + γ α Pθ 0 ∑ X i = Kα = α .i =1 i=1 i=1n 0,X i < Kα ,∑i =1Остаётся определить γα.