В.В. Ульянов, В.Г. Ушаков, Н.Р. Байрамов, Т.А. Нагапетян - Решения задач по математической статистике (1115338), страница 4
Текст из файла (страница 4)
В таблице 1 собраны частоиспользуемые для построения до верительных интервалов критические значения.3. Вычисление объема выборки.Для построения доверительного интервала заданной длины следует определить необходимый объем выборки, используя априорные параметры оценки и ограниченияна погрешность оценки. Для доверительного интервала с уровнем доверия 1 − αположим E = погрешность оценки (половина длины доверительного интервала).В таблице 2 представлены часто используемые формулы для вычисления объемавыборки.Пример. Исследователю нужно оценить вероятность успеха p в биномиальном эксперименте.
Каков должен быть размер выборки (то есть сколько экспериментов нужно провести), чтобы оценить это величину с точностью 0.05 и уровнем доверия 0.99,т. е. найти n такое, что P |p − p̂| ≤ 0.05 ≥ 0.99.Решение.(1) Поскольку не задана никакая априорная оценка p, положим p = 0, 5.
Ограничение на погрешность оценки E = 0.05, 1 − α = 0.99.2z0.05· pq(2.5758)(0.5)(0.5)(2) Из таблицы 2, n === 663.47.E20.052(3) Эта формула дает оценку размера выборки для наихудшего случая (поскольку неизвестна априорная оценка параметра p). Размер выборки должен бытьне меньше, чем 664.21αРаспределение0.100.050.010.0010.0001t-распределениеtα/2,101.81252.22813.16934.58696.2111tα/2,1001.66021.98402.62593.39054.0533tα/2,10001.64641.96232.58083.30033.9063Нормальное распределениеzα/21.64491.96002.57583.29053.89062распределение χχ21−α/2,103.94033.24702.15591.26500.7660χ2α/2,1018.307020.483225.188231.419837.3107χ21−α/2,10077.929574.221967.327665.895754.11292χα/2,100124.3421 129.5612 140.1695 153.1670 164.65912χ1−α/2,1000927.5944 914.2572 888.5635 859.3615 835.34932χα/2,10001074.6790 1089.5310 1118.9480 1153.7380 1183.49200.900.950.990.9990.99991−αТаблица 1: Критические значенияПараметр Оценка Размер выборки zα · σ 2/2µx̄n=Epp̂n=(zα/2 )2 · pqE2µ1 − µ2x̄1 − x̄2 n1 = n2 =(zα/2 )2 (σ12 + σ22 )2E2p1 − p2p̂1 − p̂2(zα/2 )2 (p1 q1 + p2 q2 )E2n1 = n2 =Таблица 2: Вычисление объема выборки4.
Часто встречающиеся доверительные интервалы.В таблице 3 представлен общий вид доверительных интервалов для одной выборки, в таблице 4 — для двух выборок. Для каждого параметра распределения даныформулы для вычисления доверительных интервалов с уровнем доверия 1 − α.Пример. Компания, разрабатывающая программное обеспечения, провела исследование среднего размера word processing файла. Для n = 23 произвольно выбранныхфайлов, x̄ = 4822 kb и s = 127.
Определить доверительный интерва с уровнем доверия 0.95 для среднего размера word processing файлов.Решение.(1) Предполагается, что распределение размеров файлов — нормальное. Доверительный интервал для µ основан на t-распределении. Используем соответствующую формулу из таблицы 3.(2) 1 − α = 0.95; α = 0.05; α/2 = 0.025; tα/2,n−1 = t0.025,22 = 2.0739.2.0739 · 127√(3) k == 54.92.2322Параметр Предположение о распреде- Доверительный интервал с коленииэффициентом доверия 1 − αn — большое, σ 2 — известно,σµx̄ ± zα/2 · √илиnнормальное, σ 2 — известноsµнормальное, σ 2 — неизвестно x̄ ± tα/2,n−1 · √n!22(n − 1)s (n − 1)s,σ2нормальноеχ2α/2,n−1 χ21−α/2,n−1rp̂(1 − p̂)pбиномиальное, n — большое p̂ ± zα/2 ·nТаблица 3: Часто встречающиеся доверительные интервалы: одна выборка(4) Доверительный интервал с коэффициентом доверия 0.99 для µ — (x̄ − k, x̄ + k) =(4767, 4877).Параметр Предположение о распределенииµ1 − µ2µ1 − µ2µ1 − µ2µ1 − µ2σ12σ22p1 − p2независимость, σ12 , σ22 —известны;нормальное распределение илибольшое nнормальность, независимость,σ12 = σ22 — неизвестнынормальность, независимость,σ12 6= σ22 — неизвестныДоверительный интервал с коэффициентом доверия 1 − α(x̄1 − x̄2 ) ± zα/2 ·σ12n1+σ22n2(x̄1 − x̄2 ) ± tα/2, n1 +n2 −2 · sps2p =q1n1+1n2(n1 −1)s21 +(n2 −1)s22n1 +n2 −2q 2s(x̄1 − x̄2 ) ± tα/2, ν · n11 +2 2s1s22+ n2n1ν ≈ 2 2 2 2s1/s2/n1n2+n1 −1n2 −1нормальность, n пар, зависимость d¯ ± tα/2, n−1 · 2s11нормальность, независимость·s2 F αбиномиальное распределение,n1 , n2 — большие, независимостьqs22n2sd√ns2, s12 · F α 11− 2 , n1 −1, n2 −1222 , n1 −1, n2 −1q1)2)(p̂1 − p̂2 ) ± zα/2 · p̂1 (1−p̂+ p̂2 (1−p̂n1n2Таблица 4: Часто встречающиеся доверительные интервалы: две выборки5.
Другие оценки.1) Доверительные интервалы для медиан.Построить приближенный доверительный интервал с уровнем доверия 1 − α длямедианы µ̃, при больших n (основанный на порядковой статистике Wilcoxon’а).23(1) Построить порядковую статистику {w(1) , w(2) , . . . , w(N ) } для N = n2 =x +xсредних i 2 j , для 1 ≤ i < j ≤ n.α(2) Определить критическое значениеzα/2 такое, что P(Z ≥ zα/2 ) = /2.zα Nn(n−1)2zα N22(3) Вычислить константы k1 = N2 − √/3nи k2 = N2 + √/3n.(4) Доверительный интервал с уровнем доверия 1 − α для медианы µ̃ имеет вид(w(k1 ) , w(k2 ) ) (см. таблицу 5).α = 0.05 α = 0.01n k1k2 k1k27 1208 2269 43210 639 14411121314158111417211617181920263035414647 255 464 674 984 129410611813014415182227315362728293105118131144159Таблица 5: Доверительные интервалы для медианы2) Разность медиан.Для построения доверительного интервала с уровнем доверия 1 − α для разностимедиан µ˜1 − µ˜2 cледующий алгоритм, основанный на процедуре Mann-WhitneyWilcoxon’а.
Предположим, размеры выборок досктаточно велики, и выборки незамисимы.(1) Построить порядковую статистику {w(1) , w(2) , . . . , w(N ) } для N = n1 n2 разностей xi − yj , для 1 ≤ i ≤ n1 , 1 ≤ j ≤ n2 .(2) Определить критическое значение zα/2 такое, что P(Z ≥ zα/2 ) = α/2.(3) Вычислить константы!rn1 n2 (n1 + n2 + 1)n1 n2+ 0.5 − zα/2иk1 =212!rn1 n2n1 n2 (n1 + n2 + 1)k2 =+ 0.5 + zα/2.212(4) Приближенный доверительный интервал с уровнем доверия 1 − α для µ˜1 − µ˜2есть (w(k1 ) , w(k2 ) ).6.
Корректирующий множитель для конечных распределений.Пусть производится выборка без возвращения размера n из (конечного) распределения размера N . Если n — большая или существенная часть распределения, то интуитивно понятно, что точечная оценка, основанная на этой выборке, должна бытьточнее, чем если бы распределение было бесконечным. В таких случаях, поэтому,24стандартное отклонение выборочного среднего и стандартное отклонение вероятности успеха в испытаниях Бернулли умножается на корректирующий множительдля конечных распределений:rN −nN −1При посторении доверительного интервала для достижения большей точностиоценки на эту функцию от n и N умножается критическое расстояние.
Если размервыборки составляет менее 5% от всего распределения, корректирующий множительдля конечных распределений, как правило, не используется.Доверительные интервалы, построенные с учетом корректирующего множителя:(1) Пусть производится выборка без возвращения размера n из распределения размера N . Если предполагается нормальное распределение, граничные точки длядоверительного интервала для среднего значения распределения µ выбираютсяследующим образом:rN −nsx̄ ± zα/2 · √ ·.N −1n(2) В случае биномиального распределения, граничные точки для доверительногоинтервала для вероятности успеха в единичном эксперименте p выбираются следующим образом:rrp̂(1 − p̂)N −np̂ ± zα/2 ··.nN −125ЗадачиЗадача №31. Пусть X1 , .
. . , Xn независимы и имеют равномерное распределение наотрезке [0; θ]. Построить кратчайший доверительный интервал для θ с коэффициентомmax Xi1≤i≤n.доверия α, основанный на центральной статистике G(X, θ) =θРешение. Разрешив неравенство g1 < G(X, θ) < g2 относительно θ, получим доверительный интервал (θ1 , θ2 ):X(n)X(n)X(n)X(n)X(n)< g2 ⇐⇒<θ<: θ1 =, θ2 =.θg2g1g2g111−нужно минимизировать при заданном уровне доверияДлину его X(n) ×g1 g2g1 <XXX(n)(n)(n)α = P(θ1 < θ < θ2 ) = P g1 << g2 = P< g2 − P< g1 = g2n − g1n ,θθθ0 ≤ g1 < g2 ≤ 1.Поскольку длина интервала должна быть минимальной, иные значения g1 и g2 рассматривать не имеет смысла.11Минимум выражения X(n) ×при условии g2n − g1n = α, 0 ≤ g1 < g2 ≤ 1−gg12√достигаетя на g2 = 1, g1 = n 1 − α.Итак, кратчайший доверительный интервал, основанный на центральной статистиX(n)ке G(X, θ), имеет вид X(n) , √.n1−αЗадача №32.
Пусть X1 , . . . , Xn независимы и имеют биномиальное распределениеBi(1, θ), 0<θ<1. Построить равномерено наиболее мощный критерий размера α дляпроверки гипотезы H0 : θ = θ0 при альтернативе H1 : θ < θ0 . Найти функцию мощности.Решение. Построим наиболее мощный критерий для проверки H0 при простойальтернативе H1 : θ = θ1 , θ1 < θ0 , используя лемму Неймана–Пирсона:nPXii=1θL1= 1L0nPn−(1−θ1 )nPXii=1nPn−Xii=1Xi (1−θ0 )=1−θ11−θ0nθ11−θ1θ01−θ0n!PXii=1≥ cα ⇐⇒ T (X) =nXXi ≤ c0α .i=1i=1θ0Cуществует c0α для которого выполняется следующее неравенство:α00 =0c0α −1cα −1XXCni θ0i (1−θ0 )n−i < α ≤i=00Cni θ0i (1−θ0 )n−i =α .i=0При α = α0 критическая функцмя имеет вид:(1, T (X) ≤ c0αϕ(X) =.0, T (X) > c0αВ случае α < α0 , критерий является рандомизированным и изα = E θ0 ϕ(X) = Pθ0 T (X)<c0α + εα Pθ0 T (X)=c0α=⇒26εα =α−α00α0 −α00получаем01, T (X) < cα ,ϕ(X) = εα , T (X) = c0α ,0, T (X) > c0 ;αгдеεα =α−Pc0α −1n−ii ii=0 Cn θ0 (1−θ0 ).0cCn θ0α (1−θ0 )n−c0αc0αФункция мощности00W (θ) = E θ ϕ(X) = Pθ T (X)<c0α +εα Pθ T (X)=c0α = Pθ T (X)<c0α +εα θcα (1−θ)n−cα =c0α −1=XCni θi (1−θ)n−i+ α−c0α −1XCni θ0i (1−θ0 )n−ii=0i=0 θc0α (1−θ)n−c0αc0θ0α (1−θ0 )n−c0α.Построенный критерий – наиболее мощный, если гипотеза H1 – простая (то естьH1 : θ=θ1 ).