В.В. Ульянов, В.Г. Ушаков, Н.Р. Байрамов, Т.А. Нагапетян - Решения задач по математической статистике (1115338), страница 6
Текст из файла (страница 6)
. , k) и n = n−1+n−2+. . .+nk .H0 : p1 = p10 , p2 = p20 ,. . . ,pk = pk0H1 : pi 6= pi0 хотя бы для одного ikkX(наблюдаемое − ожидаемое)2 X (ni − npi0 )22TS : χ ==ожидаемоеnpi0i=1i=12Если верна нулевая гипотеза, χ имеет приближенно распределени хи-квадратс k − 1 степенями свободы. Это приближение удовлетворительно при npi0 ≥ 5для всех i.RR : χ2 ≥ χ2α, k−15. Критерий независимости χ2 . Таблицы независимости.Рассматриваются 2 признака A и B, принимающие значения {ai }Ii=1 и {bj }Jj=1 соответственно. Прверяется предположение о независимости этих признаков.
Таблицанезависимости размера I × J имеет видb1 b2a1 n11 n12a2 n21 n22.. ..... ..aI nI1 nI2Всего n·1 n·2. . . bJ· · · n1J· · · n2J.... ..· · · nIJ· · · n·JВсегоn1·n2·...nI·nPPгде nk· = Jj=1 nkj и n·k = Ii=1 nik . Если имеет место независимость признаков, вероятность получить определенный набор значений признаков при известных {n·k , nk· }32естьQIi QJjni· !n·j !.QI QJn! i j nij !Пусть таблица независимости содержит I строк и J столбцов, nij — количествоэкземпляров со значениями признаков {ai , bj }, и êij — оценка ожидаемого числатаких экземпляров. Тестовая статистика естьP n11 , . . .
, nIJ | n1· , . . . , n·J =I XJX (наблюдаемое − ожидаемое)2 X(nij − êij )2χ ==,ожидаемоеêijпо всемi=1 j=12ячейкамгдеni· n·j(всего в i-й строке)(всего в j-м столбце)=.всего экземпляровnЕсли верна нулевая гипотеза, χ2 имеет приближенно распределени хи-квадрат с(I − 1)(J − 1) степенями свободы. Это приближение удовлетворительно при êij ≥ 5для всех i и j.êij =6. Таблицы независимости размера 2 × 2.Таблица независимости размера 2×2 — часто встречаюшийся частный случай таблицнезависимости. Каждый из n элементов обладает (взаимоисключающими) свойствами 1 или 2 и I или II.III1 a A−a2 b B−bВсего r n − rВсегоABnЕсли r, A и B фиксированы, вероятность заданной конфигурации A BA!B!r!(n − r)!a bf (a | r, A, B) ==.nn!a!b!(A−a)!(B−b)!rПри заданных a, A и B можно определить критическое значение r так, чтобывероятность f (a | r, A, B) принимала нужное нам значение.
Тогда число элементов,обладающих свойствами 1 и I определяется как разность b = r − a.Пример. Для сравнения вероятностей успеха двух распределений составлена таблица независимости размера 2 × 2:Выборка из распределения 1Выборка из распределения 2ВсегоУспех Неуспех Всего72933610515Есть ли основания предполагать, что вероятности успеха в распределениях различны? Уровень значимости α = 0.05.Решение.(1) Для данных значений a, A и B при неизвестном r таблица независимости выглядит следующим образом:Успех Неуспех ВсегоВыборка из распределения 1729Выборка из распределения 2b6−b6Всегоr15 − r1533(2) Для 7 ≤ r ≤ 13 условная вероятность f (a | r, A, B) равна:r78910111213f (a | r, A, B) 0.0056 0.034 0.11 0.24 0.40 0.47 0.34(3) Из этой таблицы получим, что наибольшее значение r, для которого вероятностьнаблюдать заданное значение a менее, чем α = 0.05, есть r = 8.
В этом случаевероятность наблюдать a равна 0.034.(4) Следовательно, критическое значение b = r − a = 8 − 7 = 1. Если в полученныхданных b ≤ 1, нулевая гипотеза H0 : p1 = p2 отвергается. В нашем случае b = 3.(5) Вывод: Значение тестовой статистики не лежит в критической области. Нет оснований предполагать, что вероятности успеха в распределениях различны.7.
Критические значения для проверки возмущений.Для проверки на возмущения можно рассматривать max (xi − x̄) — макисмальноеi=1,2,...отклонение наблюдаемых значений от их среднего, которое средует нормализоватьс учетом стандартного отклонения или его оценки. Другой способ — используя отношения элементов вариационного ряда.(a) Чтобы определить, является ли наименьший элемент вариационного ряда возмущением, вычислимx(2) − x(1)r10 =.x(n) − x(1)Аналогично, чтобы определить, является ли наибольший элемент вариационногоряда возмущением, вычислимx(n) − x(n−1)r10 =.x(n) − x(1)(b) Чтобы определить, является ли наименьший элемент вариационного ряда возмущением, не используя x(n) вычислимx(2) − x(1)r11 =.x(n−1) − x(1)Аналогично, чтобы определить, является ли наибольший элемент вариационногоряда возмущением, не используя x(1) вычислимx(n) − x(n−1)r11 =.x(n) − x(2)Таблицы 4 и 5 содержат критические значения для r10 и r11 .34Таблица 4: Критические значения для r10 (P[r10 > R] = α)n α = 0.00530.99440.92650.82160.74070.68080.63490.59810111213140.5680.4750.4250.3930.3720.010.9880.8890.7800.6980.6370.5900.5550.020.9760.8460.7290.6440.5860.5430.5100.050.9410.7450.6420.5600.5070.4680.4370.100.8860.6790.5570.4820.4340.3990.3700.500.5000.3240.2500.2100.1840.1660.1520.900.1140.0650.0480.0380.0320.0290.0260.950.0590.0330.0230.0180.0160.0140.0130.5270.4380.3910.3620.3410.4830.3990.3560.3290.3090.4120.3380.3000.2770.2600.1420.1110.0960.0880.0820.1420.1110.0960.0880.0820.0250.0190.0170.0150.0140.0120.0100.0080.0080.007Таблица 5: Критические значения для r11 (P[r11 > R] = α)n α = 0.00540.99550.93760.83970.78280.72590.67710152025300.6390.5220.4640.4260.3990.010.9910.9160.8050.7400.6830.6350.020.9810.8760.7630.6890.6310.5870.050.9550.8070.6890.6100.5540.5120.100.9100.7280.6090.5300.4790.4410.500.5540.3690.2880.2410.2100.1890.900.1310.0780.0560.0450.0370.0330.950.0690.0390.0280.0220.0190.0160.5970.4860.4300.3940.3690.5510.4450.3920.3590.3360.4770.3810.3340.2940.2830.4090.3230.2820.2550.2360.1730.1290.1100.0980.0900.0300.0230.0190.0270.0160.0140.0110.0100.0090.00835ЗадачиЗадача №36.
Пусть X1 , . . . , Xn независимы и имеют гамма-распределение Γ(θ, 1).Построить равномерено наиболее мощный критерий размера α для проверки гипотезыH0 : θ=θ0 при альтернативе H1 : θ>θ0 . Найти функцию мощности.Решение. Построим наиболее мощный критерий для проверки H0 при простойальтернативе H1 : θ=θ1 , θ1 >θ0 , воспользовавшись леммой Неймана-Пирсона:nQθ1 exp(−θ1 Xi ) nnnnoXXL1 (X, θ)θ1i=1= Qexpθ−θ=X>c⇐⇒T(X)=Xi ≤ c0α .01iαnL0 (X, θ)θ0i=1i=1θ0 exp(−θ0 Xi )i=1c0αнайдем из условияα = Pθ0 (T (X) ≤c0α )= Pθ0 2θ0nXXi ≤2θ0 c0αi=1где Fm (a) =Ra=2θ0 XiP∼ Γ 12 , 1 = χ22= F2n (2θ0 c0α ),2θ0 ni=1 Xi ∼ χ22nkm (x) dx, а km (x) – плотность распределения случайной величины χ2m .−∞χ2α,2n, где χ2α,2n – квантиль порядка α функции F2n (y).2θ(02 1, T (X) ≤ χα,2n 2θ0 ,Критическая функция ϕ(X) =2 0, T (X) > χα,2n 2θ1 .Отсюда 2θ0 c0α = χ2α,2n =⇒ c0α =Функция мощности будет представляться в следующем виде:θ002W (θ) = E θ ϕ(X) = P T (X) ≤ cα = Pθ 2θT (X) ≤ 2θcα = F2nχ.θ0 α,2nПостроенный критерий – наиболее мощный, если гипотеза H1 – простая, то есть H1 :θ=θ1 .
При построении критерия значение θ1 используется неявно, важно лишь, чтоθ1 >θ0 . Значит, построенный критерий – равномерно наиболее мощный.Задача №37. Пусть X1 , . . . , Xn независимы и имеют гамма-распределение Γ(θ, 2).Построить кратчайший доверительный интервал для θ с коэффициентом доверия α,nPоснованный на центральной статистике G(X, θ) = θ ·Xii=1Решение.
Прежде всего заметим, чтоn1 1X=⇒ 2θ2θXi ∼ Γ , 2Xi ∼ Γ , 2n = χ24n .22i=1Написав определение доверительного интервала с уровнем доверия α и воспользовавшись описанными выше соотношениями получим следующую цепочку равенств: gg2 1α = P g1 < 2G(X, θ) < g2 = P<θ<= F4n (g2 ) − F4n (g1 ),2nX2nXгде F4n (y) – функция распределения χ24n .Для построения наименьшего интервала необходимо минимизировать g2 − g1 приусловии F4n (g2 ) − F4n (g1 ) = α.Запишем функцию Лагранжа:F (λ) = g2 − g1 − λ(F4n (g2 ) − F4n (g1 ) − α).36Продифференцируем ее по переменным g1 , g2 и λ и приравняем полученные выраженияк нулю. В результате получим систему уравнений(F4n (g2 ) − F4n (g1 ) = α,(∗)00F4n (g2 ) = F4n (g2 ).Кратчайший доверительный интервал для θ с коэффициентом доверия α, основанный gg2 1на центральной статистике G(X, θ), имеет вид,, где g1 и g2 - решения си2nX 2nXстемы (∗).Задача № 38.
Пусть X1 , . . . , Xn независимы и имеют пуассоновское распределение Π(θ). Построить равномерно наиболее мощный критерий размера α для проверкигипотезы H0 : θ = θ0 при альтернативе H1 : θ < θ0 . Найти функцию мощности.Решение. Построим наиболее мощный критерий для простой альтернативы H1 :θ = θ1 , θ1 < θ0 . Для этого воспользуемся леммой Неймана–Пирсона:nQL1= i=1nL0Qi=1e−θ1e−θ0θ1XinPXi ! θ1 i=1 Xi=exp −n(θ1 −θ0 ) ≥ cαXiθ0θ0Xi !⇐⇒T (X)=nXXi ≤ c0α .i=1Учтем, что T (X) ∼ Π(θn). c0α найдем из условияFθ0 (c0α − 1) < α ≤ Fθ0 (c0α ),c0α ∈ Z,где Fθ0 (y) – функция распределения T (X) при условии, что гипотеза H0 верна:Fθ0 (y) =[y]Xexp(−nθ0 )k=0Критическая функция01, T (X) < cα ,ϕ(X) = εα , T (X) = c0α ,0, T (X) > c0 ;α(nθ0 )k.k!α − Fθ0 (c0α − 1)где εα =.Fθ0 (c0α ) − Fθ0 (c0α − 1)Если найдется c0α ∈ Z такое, что Fθ0 (c0α ) = α, критерий будет нерандомизированным:(1, T (X) ≤ c0α ,ϕ(X) =0, T (X) > c0α .Построенный критерий – наиболее мощный, если гипотеза H1 - простая (H1 : θ=θ1 ).При построении критерия значение θ1 используется неявно: важно лишь, что θ1 <θ0 .Значит, построенный критерий – равномерно наиболее мощный.Функция мощности:W (ϕ, θ) = E θ ϕ(X) = 1 · Pθ T (X) < c0α + εα · Pθ T (X) = c0α = Fθ (c0α −1) + εα Fθ (c0α ),где Fθ (y) =[y]Xk=037exp(−nθ)(nθ)k.k!Задача №39.
Пусть X1 , . . . , Xn независимы и имеют плотность распределения( exp −(x−θ) , x > θ,f (x, θ) =0,x ≤ θ.Построить наиболее мощный критерий размера α для проверки гипотезы H0 : θ=θ0при альтернативе H1 : θ=θ1 < θ0 . Найти мощность критерия.Решение. Для решения данной задачи воспользуемся леммой Неймана–Пирсона:nQexp(θ1 − Xi )IIXi >θ1X>θL11(1)= i=1= exp n(θ1 −θ0 ) n > cα .QL0IX(1) >θ0exp(θ0 − Xi )IXi >θ0i=1Поскольку(L1∞,X(1) ≤ θ0 ,=L0exp n(θ1 − θ0 ) , X(1) > θ0 ;то при X(1) ≤ θ0 иL1> cα для любого α критическая функция принимает видL0(1, X(1) ≤ θ0 ,ϕ(X) =εα , X(1) > θ0 .Отыщем εα :α = E θ0 ϕ(X) = 1 · Pθ0 X(1) ≤ θ0 + εα · Pθ0 X(1) > θ0 ) = 1 · 0 + εα · 1,откуда α = εα .Мощность критерияW (ϕ, θ1 ) = E θ1 ϕ(X) = Pθ1 X(1) ≤ θ0 + αPθ1 X(1) > θ0 ) =Z +∞n Z +∞n= 1−exp(θ1 −x) dx+αexp(θ1 −x) dx = 1 − (1−α) exp n(θ1 −θ0 ) .θ0θ0Задача №40.