Ульянов (старое издание) (1115357), страница 14
Текст из файла (страница 14)
+ Xn ) ∼ N (θ, n1 ), тогда Φ( n(t − θ)) - функция распределения T (Y ), причем это функция распределения стандартного нормальногозакона.√Φ( n(T (Y ) − θ)) = εθ1∗ = T (Y ) − √1n · Φ−1 (ε)θ1∗ = T (Y ) − √1n · Φ−1 (1 − ε)Заметим, что в силу¡свойств симметрии Φ(ε) + Φ(1¢ − ε) ≡ 0 ⇒ θ2∗ =T (Y ) + Φ−1 (ε) ⇒ T (Y ) − Φ−1 (ε), T (Y ) + Φ−1 (ε) - искомый доверительный интервал, где ε = 1+γ2 .22Лекция 822.0.2 Метод, основанный на центральной статистикеY = (X1 , . . . , Xn ) L(X)Пусть V (Y, θ) - некая случайная величина1. Распределение сл. вел. V (Y, θ) не зависит от θ2.
При каждом y функция V (y, θ) как функция от θ является строго монотоннойX ∼ N (θ, 1)⇓X − θ ∼ N (0, 1)Определение 22.1. Статистика V (Y, θ), удовлетворяющая 1 и 2, называется центральной.Предположим, что распределение сл. вел. V (Y, θ) абсолютно непрерывно.Определим по заданному γ значения v1 и v2 .P (V1 < V (Y, θ) < γ)(22.1)⇒ v1 и v2 обязательно существуют ( т. к. для абс. непрерывной сл. вел.вероятности принимают все от 0 до 1)(для дискретных велич. нестрогое равенство ≥)Пусть T1 (y) и T2 (y) - это решения уравнения :V (y, θ) = vi , i = 1, 2В качестве неизвестного - θ.Для определенности предположим, что V (y, θ) стого возрастающая.
Тогда равенство (1) эквивалентно:P (T1 (Y ) < θ < T2 (Y )) = γ(22.2)⇒ (T1 (Y ), T2 (Y )) - доверительный интервал для θ с коэффициентом доверия γ ( по определению )НО!(проблемы)11022 Лекция 81.Найти центральную статистику2.Можно предложить такое уравнение, что найти T1 , T2 будет непростов прикладных задачах эти проблемы не возникаютПример 22.1. Пусть (X1 , . . . , Xn ) повторная выборка из распределенияL(x) ∼ N (µ, θ2 ), где µ - известно, θ - неизвестно.Попытаемся построитьцентральную статистику.PnV (Y, θ2 ) = θ12 i=1 (Xi − µ)2 = { проверим условия, определяющие ценPnтральную статистику } = i=1 ( Xiθ−µ )2 = { каждая Xi имеет такое жераспределение, как X, т. е.
N (θ, 1) } = E( Xiθ−µ ) = 0D( Xiθ−µ ) = 1 , т. е. Xiθ−µ ∼ N (0, 1) , т. е. имеем сумму квадратов стандартных нормальных случайных величин.Определение 22.2. χ2n - сл. величина, имеющая хи-квадрат распределений с n степенями свободы - это Z12 + . . . + Zn2 , где Zi - независимые,одинаково распределенные N (0, 1)Плотность χ2n имеет вид(gn (z) =1z n/2−1 e−z/2 ,2n/2 Γ (n/2),z>00,,z≤0;R +∞, где Γ (z) = 0 y z−1 e−y dyPn12i=1 (Xi − µ) строго убыв. функция от θ ⇒ оба условия выполненыθ22V (y, θ ) = vi , i = 1, 2vi находим из равенства (1)⇒ вместоPn (2) получаемPnP ( v12 i=1 (Xi − µ)2 , θ2 < v11 i=1 (Xi − µ)2 ) = γ⇒ это и ест доверительный интервал с коэффициентом доверия γvi брали из равенства (1), которое в нашем случае переписывается (см.Рисунок 1)Zv2(1) →gn (z)dz = γ(22.3)v1Функция плотности gn (z) имеет вид графика (монотонно возрастает.
после максимума убывает для n > 2)v1 и v2 находятся для условия равенства площади под графиком, ограниченной v1 и v2 , γ ⇒ не единственность v1 и v2⇒ требуют центральный доверительный интервал, т. е. площадь на концах одинаковая : 1−γ2Но требования строить довер. интервал и кратчайший довер. интервалвходят в противоречие. Для нахождения кратчайшего доверительногоинтервала (T2 (Y ), T1 (Y )) ⇔ v11 − v12 → минимизируем при условии выполнения (3)Методом Лагранжа находим условный экстремум функции.22 Лекция 8111Рис.
22.1.НО! gn (z) не допускает точного выражения для v1 и v2 , поэтому на практике для различных значений γ и для различных значений n существуюттаблицы, указывающие соответствующие значения для v1 и v2 .22.0.3 Метод, основанный на центральной предельной теоремеQnПусть pn (y, θ) = i=1 p(x1 , θ), где p(z, θ) - плотность сл. вел. X, (x1 , . .
. , xn )- выборка из L(X) с плотностьюθ).Pn p(z,∂∂Рассмотрим ∂θln pn (Y, θ) = i=1 ∂θln p(Xi , θ), где (X1 , . . . , Xn - повторная выборка, т.е. X1 , . . . , Xn - н.с.р. X ⇒ т.к. X1 , . . . , Xn н.с.р., то ln p(Xi , θ)тоже н.с.р.pnПри условии регулярности было показано, что E ∂ ln= 0,∂θ2∂ ln pn∂ ln pn 2∂D ∂θ = E( ∂ theta ) = { т.к. E = 0} = −E ∂θ2 ln pnЦ.П.Т.: Пусть Z1 , . . . , Zn - н.с.р.
сл.в. : EZ1 = a, DZ1 = σ 2 ,R d 1 − u2√ e 2 du√ n −na < d) →тогда ∀c, d(c ≤ d) P (c < Z1 +...+Zcσ n2πПоложим Zn (θ) =∂ ln pn (Y,θ)∂θ∂ ln pn (Y,θ) 2E()∂θПо ЦПТ ∀c ≤ d : P (c < Zn (θ) < d) → Φ(d) − Φ(c), где Φ(d) − Φ(c) =R d 1 − u2e 2 du, функция распределения ст. норм. законаc 2πПредположим, надо построить доверительный интервал с параметром θдля γ. Рассмотрим Zn (θ). Предположим, что γ - коэф. надежности. Пустьcγ находится из условия:P (|Z| < cγ ) = γ, где Z ∼ N (0, 1).По ЦПТ P (|Zn (θ)| < cγ ) → Φ(cγ ) − Φ(c−γ ) = P (|Z| < cγ )Следовательно, если неравенство Zn (θ)| < cγ допускает решение относительно γ в виде интервала (T1 (Y ), T2 (Y )), то это и есть доверительныйинтервал для θ.11222 Лекция 8Т.е.
мы заменили задачу P (|Zn (θ)| < cγ ) = γ задачей P (|Z| < cγ ) = γПример 22.2. Пусть X1 , . . . , Xn - выборка из Пуассоновского распределения, т.е. L(X) ∼ Π(θ), т.е.kP (X = k) = θk! e−θ k = 0, 1, . . .QnXipn (Y, θ) = e−θn i=1 θXi ! = e−θn θnX̄ Qn 1 Xi !i=1⇒nX̄n∂ ln pn (Y, θ)= −n += (X̄ − θ)∂θθθ∂ 2 ln pn (Y,θ)= − nθX̄2∂θ 22∂ ln pn (Y,θ)E= E(− nθX̄2 )∂θ 2=nθ(22.4)⇓pZn (θ) = nθ (X̄ − θ)cγ найдено по N (0, 1) из условия P (|Z| < cγ ) = γ|Zn (θ)| < cγ допускает решение относительно θ. Из (4) вытекает, что X̄есть эффективная оценка для θ (Рао-Крамер).Из (4) вытекает, что X̄ есть оценка максимального правдоподобия для θ.А ОМП после преобразования ∼ N (0, 1) - асимптотически нормальная.
Вчастности получено, что ОМП X̄ является асимптотически нормальной.23Лекция 9rZn (Θ) =n· (X − Θ) ⇒d ZΘP (|z|n < Cγ ) = γНаходим Θ из :|Zn (Θ)| < CγsX+Cγ2− Cγ ·2n|Zn (Θ) = cγCγ2XCγ+ 2 <Θ<X++ B(γ, n)n4n2n{z}B(γ, n)(отсюда находим два единственных решения (левее X и правее X))23.1 Проверка статистических гипотезОпределение 23.1. Статистической гипотезой называется любое предположение о распределении случайной величины X вида :F ∈ F0 ⊂ FПример 23.1.Xt+1 =Pt+1 − ptPtГипотеза о распределении :F ∈ F1 = {N (0, Θ2 ), Θ2 > 0}11423 Лекция 923.1.1 Гипотезы об однородности выбораОпределение 23.2.(X1i , X2i , ..., Xni ), i = 1, knДля любого фиксированного i данные в моменты времени 1, 2, ..., n дляi-ого пациента X,который лечится старым методом.(Y1i , Y2i , ..., Yni ), i = 1, mДля любого фиксированного i данные в моменты времени 1, 2, ..., n дляi-ого пациента X,который лечится новым методом.Вопрос : Можно ли считать , что выборки для kn взяты из одного итого же вида распределения ?23.1.2 Гипотеза о независимостиВопрос: Что случится с инфляцией, если уровень безработицы повысится?((X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ))Гипотеза: Являются ли компоненты вектора (X, Y ) независимыми ?Пусть F (z, t) - функция распределения (X, Y ), F (z, t) ∈ F - все вероятностные распределения на R2 , F0 - все все вероятностные распределенияна R2 с независимыми компонентами.Определение 23.3.
Если F0 из определения гипотезы состоит в точности из одного распределения, то гипотеза называется простой, в противном случае сложной.Далее рассматриваем только простые гипотезы.Определение 23.4. Гипотезу о том , что F ⊂ F0 назовем основной(нулевой) гипотезой H0H0 : F ∈ F0 (F0 = F0 )Определение 23.5. Правила, согласно которым гипотеза H0 принимается или отвергается, называется статистическим критерием илипросто критерием.23.1 Проверка статистических гипотез115Замечание 23.1. Часто будем говорить: H0 верна F0 = N (0, 1), если данные не противоречат гипотезе H0 .X1XH0F = { ∪(0, 1) , ∪(1, 2) }[: F0 = F0 = (0, 1)Правило: Если X1 ∈ [0, 1], то H0 , иначе отвергаем.X1XF = { ∪(0, 1) , ∪(2, 1) }Если X1 ≤ a , то H0 → какое бы S0 мы не взяли полачаем ошибку.Замечание 23.2.
Ошибка 1-го рода при проверке гипотез: отвергнуть H0 ,когда она верна.Ошибка 2-го рода при проверке гипотез: принять H0 , когда она не верна.Замечание 23.3. 2-ой пример показывает также, что если объем выборкификсирован, то нельзя указать такой критерий, при котором вероятностьошибoк 1-го и 2-го рода меньше любых наперед заданных значений одновременно.α = P (X1 > a|H0 )β = P (X1 ≤ a|H0 )Определение 23.6. Множество S ⊂ X называется критическим , еслив случае попадания выборки (X1 , X2 , .., Xn ) ∈ S в множество S согласнокритерию следует отвергать H0 .Критерии такого типа называются S-критериями.Рассмотрим параметрические модели:(X1 , X2 , .., Xn )XF ∈ F(θ)θ∈ΘПусть Θ0 таково, чтоH0 : F ∈ F0 = {F(θ) , θ ∈ Θ0 }H1 : F ∈ F1 = {F(θ) , θ ∈ Θ1 }\[Θ0 Θ1 = O , Θ0 Θ1 ⊂ ΘПусть pn (y, θ) - функция правдоподобия, соответствующая выборке(X1 , X2 , ..., Xn ) , y = (x1 , ..., xn ).
Рассмотрим абсолютно-непрерывныйслучай.11623 Лекция 9Определение 23.7. Функция мощности S - критерия определяется:ZW (S , θ) =pn (y , θ)dy = P (Y ∈ S , θ)SПусть F0 = Fθ0 , F1 = Fθ1 . Тогда вероятность ошибки 1-го родаα = P (Y ∈ S, θ0 ) = W (S), θ0 ,W (S, θ1 ) = P (Y ∈ S, θ1 ) = 1 − β.24Лекция 10Пусть Θ = θ0 , θ1 , и y = (X1 , ..., Xn ) берется из распределения L(X)F (z, θ), θ ∈ Θ. Основная гипотеза H0 : θ = θ0 ,а конкурирующая гипотеза H1 : θ = θ1 .Функцией мощности является функцияZW (S, θ) =pn (y, θ)dy = Σy∈S pn (y, θ).SПервое равенство выполняется, когда L(X) абсолютно непрерывно, а второе равенство- когда распределение L(X) дискретно.
Если в качестве параметра взять θ0 , то функция мощности совпадает с уровнем значимости:W (S, θ0 ) = P (y ∈ S | H0 ) = α.P (y ∈ S | H0 )- вероятность попасть в область S, когда отвергается H0 ,когда она верна.W (S, θ1 ) = P (y ∈ S | H1 ) = 1 − β.Здесь отвергается H0 , когда она не верна.Определение 24.1. Критерий с областью S ∗ называется оптимальным (наиболее мощным) среди всех критериев с заданным уровнем значимости α (совокупность таких критериев обозначим через Kα ), еслиW (S ∗ , θ0 ) = α,то11824 Лекция 10W (S ∗ , θ1 ) = sup W (S, θ)(1).S ∗ ∈Kα(sup берется по всем критериям с областью S и с уровнем значимостиα).Вопрос: всегда ли можно найти оптимальный S- критерий?Ответ: не всегда.Рандоминизированным ϕ - критерий.X = (x1 , ..., xn ) - совокупность всех значений выборки.