В.В. Ульянов, В.Г. Ушаков, Н.Р. Байрамов, Т.А. Нагапетян - Решения задач по математической статистике (1115338), страница 5
Текст из файла (страница 5)
При построении критерия значение θ1 используется неявно: важно лишь,что θ1 < θ0 . Значит, построенный критерий – равномерно наиболее мощный.Задача № 33. Пусть X1 , . . . , Xn независимы и имеют нормальное распределениеN (θ, 1). Построить кратчайший доверительный интервал для θ с коэффициентом до√верия α, основанный на центральной статистике n(X−θ).Решение.Pn√ i=1 Xi −nθ√G(X, θ) = n X − θ =∼ N (0, 1).nτ1τ2 P τ1 < G(X, θ) < τ2 = P X − √ < θ < X − √ .nnДоверительный интервал имеет вид (θ1 , θ2 ), гдеτ1θ1 = X − √ ,nτ2θ2 = X − √ .nτ2 −τ1Длину его θ2 −θ1 = √ нужно минимизировать при условииnα = P τ1 < G(X, θ) < τ2 = Φ(τ2 ) − Φ(τ1 ),где Φ(x) – функция распределения стандартного нормального закона.Применив метод множителей Лагранжа, получим τ2 = −τ1 = τ 1+α , где τ 1+α – кван22тиль порядка 1+αфункцииΦ(x).2Итак, кратчайший доверительный интервал, основанный на центральной статистиτ 1+ατ 1+α ке G(X, θ), имеет вид X − √2 , X + √2 .nnЗадача №34.
Пусть X1 , . . . , Xn независимы и имеют равномерное распределение наотрезке [0; θ]. Построить наиболее мощный критерий размера α для проверки гипотезыH0 : θ = θ0 при альтернативе H1 : θ = θ1 > θ0 . Найти мощность критерия.27Решение. Воспользуемся леммой Неймана-Пирсона:nQ1( nIθ1 {06Xi 6θ1 }∞,I{X(n) 6θ1 }L1θ0i=1 n X(n) > θ0= Q==nθ0L0θ1I{X(n) 6θ0 }, X(n) ≤ θ01θ1I{06X6θ}0iθ0i=1(1, X(n) > θ0 ,Критическая функция ϕ(X) =εα , X(n) ≤ θ0 .α = E θ0 ϕ(X) = 1 · Pθ0 (X(n) > θ0 ) + εα · Pθ0 (X(n) ≤ θ0 ) = 1 · 0 + εα · 1, откуда α = εα .Мощность критерияW (ϕ, θ1 ) = E θ1 ϕ(X) = 1 · Pθ1 X(n) > θ0 + α · Pθ1 X(n) ≤ θ0 == 1 − Pθ1 X(n) ≤ θ0 + α · Pθ1 X(n) ≤ θ0 =n θ nY0= 1 − (1−α) ·Pθ1 Xk ≤ θ0 = 1 − (1−α).θ1k=1Задача №35. Пусть X1 , .
. . , Xn независимы и имеют пуассоновское распределениеΠ(θ). Построить центральный доверительный интервал с коэффициентом доверия α,используя точечную оценку T (X) = X.Решение.Xi ∼ Π(θ),nX ∼ Π(nθ),(nθ)kkPθ X == Pθ xX = k = exp(−nθ).nk!Функция распределения T (X)FT (X) (t; θ) =[nt]Pexp(−nθ)k=00,(nθ)n, t ≥ 0,k!t < 0;монотонна по θ при θ ≥ 0, поскольку(nθ)[nt]∂FT (X) (t; θ) = −n exp(−nθ)< 0.∂θ[nt]!Границы доверительного интервала (θ1 , θ2 ) однозначно задаются уравнениямиFT (X) (t; θ1 ) =1+α,2FT (X) (t; θ2 ) =1−α2при t = T (X).28Глава 3Проверка гипотезОпределения и теоремы1.
Введение.Проверка гипотез — это формальная процедура проверки правильности некоторого утверждения об одном или нескольких поараметрах распределения. Используяинформацию, полученную из выборки, гипотезу либо отклоняют, либо принимают.В каждой проверке гипотезы участвуют 4 составляющие:(1) Нулевая гипотеза H0 — утверждение об одном или нескольких поараметрахраспределения. Предполагается, что она верна.(2) Альтернативная гипотеза H1 — противоположное утверждение. Альтернативная гипотеза верна, если неверна нулевая гипотеза.(3) Статистический критерий (или просто критерий) — правило, согласно которому гипотеза H0 принимается или отвергается.(4) Критическая область RR — множество чисел, выбранное таким образом, чтов случае попадания значения выборки в это множество нулевая гипотеза отвергается.
Одно или более критических значений отделяют критическую областьот остальных значений выборки.При проверке гипотез учитывают две вероятности ошибок, показанных в таблице 1и описанных ниже.(1) Ошибка первого рода – H0 отвергается, в то время как она верна. Вероятностьошибки I рода обычно обозначают α: P(ошибка I рода) = α. Типичные значенияα: 0.05, 0.01, 0.001.(2) Ошибка второго рода — H0 принимается, в то время как она неверна. Вероятность ошибки II рода зависит от реального значения параметров распределенияи обозначается обычно через β (или β(θ)): P(ошибка II рода) = β.
Мощностькритерия равна 1 − β.H0 принимаетсяH0 отвергаетсяH0 вернаВерное решение Ошибка I рода: αH0 неверна Ошибка II рода: β Верное решениеТаблица 1: Ошибки проверки гипотезЗамечания.(a) α — это уровень значимости критерия. Выборка значима, если ее значениележит в критической области.(b) Значения α и β имеют обратную зависимость: при увеличении α β уменьшаетсяи наоборот.(c) Для одновременного уменьшения α и β, следует увеличить объем выборки.Таблицы.В таблицах 2 и 3 представлены некоторые гипотезы и критерии для их проверки.Пример. Производитель сухих завтраков заявляет, что масса содержимого каждойупаковки — 24 унции. Для проверки этого утверждения группа покупателей выбрала29Нулевая гипотеза,свойства распределенияµ = µ0 ,большое n или нормальность,σ 2 — известноµ = µ0 ,нормальность,σ 2 — неизвестноσ = σ02 ,нормальностьАльтернативнаягипотезаµ > µ0µ < µ0µ 6= µ0µ > µ0µ < µ0µ 6= µ0σ 2 > σ02σ 2 < σ02σ 2 6= σ02p = p0 ,биномиальный эксперимент,большое np > p0p < p0p 6= p0СтатистикаZ=X−µ0σ/√nT =X−µ0S/√nχ2 =(n−1)S 2σ02Z=√p̂−p0p0 (1−p0 )/nКритическаяобластьZ ≥ zαZ ≤ −zα|Z| ≥ zα/2T ≥ tα, n−1T ≤ −tα, n−1|T | ≥ tα/2, n−1χ2 ≥ χ2α, n−1χ2 ≤ χ21−α, n−1χ2 ≤ χ21−α/2, n−1 ,или χ2 ≥ χ2α/2, n−1Z ≥ zαZ ≤ −zα|Z| ≥ zα/2Таблица 2: Проверка гипотез: одна выборкаслучайным образом 17 упаковок сухих завтраков и взвесила их содержимое.
Среднеезанчение: x̄ = 23.55, выборочная дисперсия s = 1.5. Свидетельствует ли это о о том,что производитель вводит покупателей в заблуждение? Использовать коэффициентзначимости α = 0.05.Решение.(1) Задача заключается в оценке математического ожидания распределения µ. Распределение масс содержимого упаковок предполагается нормальным, дисперсиянеизвестна. Альтернативная гипотеза: µ < µ0 = 24.(2) Четыре составные части проверки гипотезы таковы:H0 : µ = 24 = µ0H1 : µ < 24X − µ0TS : T =S/√nRR : T ≤ −tα, n−1 = −t0.05, 16 = −1.745923.55 − 24(3) T == −1.23691.5 √17(4) Вывод: Значение статистики x̄ не лежит в критической области (то есть p =0.1170 > 0.05). Поэтому нет оснований предполагать, что математическое ожидание выборки меньше 24.Пример.
Производитель деталей автомобиля заявляет, что новый продукт, приустановке его на фильтр двигателя, уменьшает расход газа. Были измерены расстояния, пройденные автомобилями на единицу расхода газа, с испольхованием этогомеханизма и без него. Среднее значение разностей (до–после): d¯ = −1.2, sD = 3.5.Свидетельствует ли это о том, что новый механизм действительно уменьшает расходгаза? α = 0.01.Решение.(1) Задача заключается в оценке математического ожидания µD = µ1 − µ2 распределения разности двух случайных величин.
Распределение значений предполагается нормальным, случайные величины зависимы. Альтернативная гипотеза:µD < ∆0 = 0.(2) Четыре составные части проверки гипотезы таковы:30Свойства распределенияНулеваяАльтернативная СтатистикаКритическаягипотезагипотезаобластьn1 , n2 – большие, независимость, σ12 , σ22 — известны, илинормальность, независимость, σ12 , σ22 — известныµ1 − µ2 = ∆0 µ1 − µ2 > ∆0Z ≥ zα(X 1 −X 2 )−∆0rZ=22Z ≤ −zαµ1 − µ2 < ∆0σ1σ+ n2n12µ1 − µ2 6= ∆0|Z| ≥ zα/2нормальность, независимость, σ12 = σ22 — неизвестны(X −X )−∆µ1 − µ2 = ∆0 µ1 − µ2 > ∆0T ≥ tα, n1 +n2 −2T = 1q 12 1 0Sp n + nµ1 − µ2 < ∆0T≤ −tα, n1 +n2 −21222µ1 − µ2 6= ∆0|T | ≥ tα/2, n1 +n2 −2(n −1)S1 +(n2 −1)S2Sp = 1 n1 +n2 −2нормальность, независимость, σ12 , σ22 — неизвестны, σ12(X −X )−∆µ1 − µ2 = ∆0 µ1 − µ2 > ∆0T 0 = 1r S22 S2 0µ1 − µ2 < ∆0Sp n1 + n212µ1 − µ2 6= ∆0 22 2ν≈SS1+ n2n122S12/n1n1 −1нормальность, n пар, зависимостьµD = ∆ 0µD > ∆0µD < ∆0T =µD 6= ∆0нормальность, независимостьσ12 = σ22σ12 > σ22σ12 < σ22F =22σ1 6= σ2D−∆0SD/√n+S22/n26= σ22T 0 ≥ tα, νT 0 ≤ −tα, ν|T 0 | ≥ tα/2, ν2n2 −1T ≥ tα, n−1T ≤ −tα, n−1|T | ≥ tα/2, n−1F ≥ Fα, n1 −1,n2 −1F ≤ F1−α, n1 −1,n2 −1F ≤ F1−α/2, n1 −1,n2 −1 ,или F ≥ Fα/2, n1 −1,n2 −1биномиальный эксперимент (испытания Бернулли), n1 ,n2 — большие,независимостьp1 − p2 = 0p1 − p2 > 0Z ≥ zαZ = r p̂1 −p̂2 11p̂q̂ n + np1 − p2 < 0Z ≤ zα12p1 − p2 6= 0|Z|≥ zα/22p̂ = Xn11 +X,q̂=1−p̂+n2S12S22биномиальный эксперимент, n1 ,n2 — большие, независимость1 −p̂2 )−∆0p1 − p2 = ∆0 p1 − p2 > ∆0Z ≥ zαZ = r p̂ (p̂(1−p̂1 )p̂2 (1−p̂2 )1+p1 − p2 < ∆0Z ≤ zαn1n2p1 − p2 6= ∆0|Z| ≥ zα/2Таблица 3: Проверка гипотез: две выборкиH 0 : µD = ∆ 0 = 0H 1 : µD < 0D̄ − ∆0TS : T =Sd/√nRR : T ≤ −tα, n−1 = −t0.01, 9 = −2.8214−1.2 − 0(3) T == −1.08423.5 √1031(4) Вывод: Значение статистики x̄ не лежит в критической области (то есть p =0.1532 > 0.01).
Поэтому нет оснований предполагать, что новый продукт уменьшает расход топлива.2. Лемма Немана-Пирсона.Пусть нулевая гипотеза H0 : θ = θ0 , альтернатива H1 : θ = θ1 , L(θ) — функция правдоподобия, вычисленная в точке θ. Для заданного α критическая область наиболеемощного критерия задается неравенствомL(θ0 )< k.L(θ1 )3. Проверка гипотез путем сравнения функций правдоподобия.Пусть нулевая гипотеза H0 : θ ∈ Ω0 , альтернатива H1 : θ ∈ Ω1 , Ω0 ∩Ω1 = ∅ и Ω0 ∪Ω1 =Ω.
Через L(Ω̂0 ) обозначим функцию правдоподобия, где все неизвестные параметрызаменены максимальными своими значениями, удовлетворяющими условию θ ∈ Ω0 ,L(Ω̂) — то же для θ ∈ Ω. Определимλ=L(Ω̂0 )L(Ω̂).Для проверки гипотезы рассматриваем λ как тестовую статистику; критическая область определяется из λ ≤ k (для 0 < k < 1).При выполнении некоторых условий и для больших n, −2 ln λ имеет приближеннораспределение χ2 с количеством степеней свободы, равным числу параметров илифункций от параметров.4. Критерий χ2 Пирсона.Пусть ni — число наблюдений i-й категории (i = 1, 2, . .