Ю.Н. Тюрин - Лекции по математической статистике (1124591), страница 15
Текст из файла (страница 15)
Результат запишем в виде математических ожиданий.E1 IR (X) − λE0 IR (X) 6 E1 IS (X) − λE0 IS (X)илиE1 IS (X) − E1 IR (X) > λ[E0 IS (X) − E0 IR (X)].(6)В силу (4) и λ > 0 правая часть (6) неотрицательна, что и доказывает (a). Доказательство утверждения (b).Для доказательства утверждения (b) надо порознь рассмотреть для λ, определяющего Sλ в (2), две возможности: λ > 1 и λ < 1.• Допустим, что λ > 1. Тогда из (2) следует, что f1 (x) > f0 (x) для x ∈ Sλ . ПоэтомуP0 (X ∈ Sλ ) =ZIS (x)f0 (x)dx 6что и требуется.52ZIS (x)f1 (x)dx = P1 (X ∈ Sλ ),• Допустим, что λ < 1.
Рассмотрим множествоS λ = {x : f1 (x) 6 λf0 (x)}Его индикатор есть 1 − IS (x). При λ < 1 получаем, что f1 (x) 6 f0 (x) для x ∈ S λ . ПоэтомуZZP1 (X ∈ S λ ) = [1 − IS (x)]f1 (x)dx 6 [1 − IS (x)]f0 (x)dx = P0 (X ∈ S λ ).Отсюда следует, что при λ < 11 − P1 (X ∈ Sλ ) 6 1 − P0 (X ∈ Sλ ).Это доказывает (b) и в этом случае. Доказанная теорема определяет вид наилучшего критерия. Если мы хотим остановиться на оптимальномкритерии уровня ε, где ε задано, мы должны подобрать λ > 0 так, чтобыP0 (X ∈ Sλ ) = ε.(7)В случае плотности это означает, что мы должны решить относительно λ уравнениеZf0 (x)dx = ε.{x:f1 (x)>λf0 (x)}В типичном случае решение существует (и единственно).Для дискретно распределенных наблюдений X уравнение (7) разрешимо не для всех ε > 0.
В таком случае в поисках оптимального критерия уровня ε либо останавливаются на критерии вида (2) с меньшим, чемназначенный ε, с вероятностью ошибки I рода (увеличивая тем самым вероятность ошибки II рода), либо изменяют выбор уровня значимости так, чтобы (7) стало разрешимо. Последнее правильнее, ибо назначение уровнязначимости — решение в немалой степени произвольное.6.4. Равномерно наиболее мощные критерииОпределение равномерно наиболее мощных критериев дано в начале пункта 3.
Как правило, для сложныхгипотез и/или сложных альтернатив равномерно наиболее мощных критериев не существует. Типично такоеположение, когда для каждой пары распределений P0 ∈ P0 , P1 ∈ P1 есть «свой» (определяемый леммой Неймана – Пирсона) оптимальный критерий, но нет единого оптимального критерия. Но есть важные (для практики)исключения из сказанного, когда равномерно наиболее мощные критерии существуют.Пример:проверка односторонних гипотез против односторонних альтернатив в схеме Бернулли.Пусть проведено n, n задано, испытаний Бернулли.
Пусть θ ∈ (0, 1) - неизвестная вероятность успеха. Обозначим результат испытаний через X = (X1 , . . . , Xn ), где Xi = 1, если в i-ом испытании был успех, и Xi = 0 впротивном случае.По наблюденному X надо проверить гипотезуH0 : θ 6 θ 0против альтернативыH1 : θ > θ 0 ,где θ0 ∈ (0, 1) задано.Далее мы найдем р. н. м.
критерий для проверки H0 против H1 . Этот критерий будет найден с помощьюправила Неймана – Пирсона.Произвольно выберем два значения a и b параметра θ: a из гипотетического множества (0, θ0 ], b из альтернативного множества (θ0 , 1):0 < a 6 θ0 < b < 1(1)Для проверки простой гипотезы θ = a против простой альтернативы θ = b применим правило Неймана –Пирсона. Здесь:f1 (x) = bTn (x) (1 − b)n−Tn (x) ,f0 (x) = aTn (x) (1 − a)n−Tn (x) ,53где x = (x1 , .
. . , xn ) - точка выборочного пространства X , x — произвольная последовательность из нулей иnPединиц, Tn (x) =xi . (Заметим, что Tn (X) - знакомая нам достаточная статистика, общее число успехов.)i=1Критические множества Неймана – Пирсона для пары a, b сутьSλ = {x :илиSλ =(x:b 1−aa 1−bf1 (x)> λ},f0 (x)Tn (x) 1−b1−aλ>0n)>λ ,λ > 0.(2)Мы уже отмечали, что критерии Неймана – Пирсона образуют семейство оптимальных критериев. Из этого семейства потом выбирают критерий заданного уровня значимости. Сейчас семейство (2) параметризованопараметром λ, λ > 0. Любая другая параметризация этого семейства ничуть не хуже.В частности, семейство (2) можно записать в виде( )T (x)b 1−a n′x:> λ , λ′ > 0,1−b anгде λ′ = λ 1−a.
Впрочем, связь между новым параметром λ′ и старым параметром λ не важна. При1−bдальнейших изменениях параметризации мы такие связи отмечать не будем. В силу (1)b 1−a> 1.1−b aПоэтому (2) можно еще упростить:{x : Tn (x) > t}, t > 0.(3)Tn (X) > t,(4)Отметим главную особенность (3) как статистического критерия: его вид не зависит от конкретных a 6 θ0 ,b > θ0 . Этот критерий - общий для всех a ∈ (0, θ0 ], b ∈ (θ0 , 1).
Это означает, что критерий (3) в рассматриваемойзадаче является равномерно наиболее мощным.Статистическое правило теперь таково:Отвергать гипотезу H0 : θ 6 θ0 против альтернативы H1 : θ > θ0 , если произошло событиегде t - некоторое критическое значение. (Это значение t еще предстоит уточнить). Заметим, что решение осnPновывается на достаточной статистике Tn (X) =Xi (суммарном числе успехов), а не на самом наблюденииi=1X.
Эта черта характерна для всякого критерия в тех статистических моделях X, где существуют достаточныестатистики.Остается определить критическое значение t в (4).Для этого зададимся некоторым уровнем значимости ε. Для t должно выполняться условиедля всех θ 6 θ0 .Pθ (Tn > t) 6 εИз утверждения (b) леммы Неймана – Пирсона следует, чтоsup Pθ (Tn > t) = Pθ0 (Tn > t).θ:θ6θ 0Поэтому условие для выбора t упрощается:Pθ0 (Tn > t) 6 ε.(5)Ради достижения наибольшей мощности против альтернативы θ > θ0 в качестве критического значенияследует взять наименьшее t, удовлетворяющее (5). Выбор t при заданных θ и n помогают осуществить таблицыдля вероятностиXPθ (Tn > t) =Cnk θk (1 − θ)n−kk>tкак функции от θ и t; θ ∈ (0, 1), t = 1, n.54Можно не связывать себя заранее выбранным уровнем значимости и принимать решения на основе pзначения (p-value) критической статистики.
В нашем случае против проверяемой гипотезы говорят большиезначения критической статистики Tn . p-значение определяется как вероятность получить (при независимом повторении опыта) не меньшее, чем получено, значение критической статистики (не менее сильное, чем получено,свидетельство против проверяемой гипотезы).Если наблюденное значение значение статистики Tn обозначить как Tn (набл.), сохранив за Tn смысл случайной переменной, то p-значением Tn (набл.) служитPθ0 (Tn > Tn (набл.)).(6)Сопоставляя это выражение с (5), видим, что p-значение - это наименьший уровень значимости, на которомеще можно опровергнуть гипотезу H0 по правилу (5).Испытания Бернулли служат статистической моделью для многих реальных процессов.
В частности, при(массовом) производстве изделие может оказаться негодным (брак). Если предположить, что появление брака- дело случая, что бракованными различные изделия могут оказаться независимо друг от друга и что, наконец,вероятность появления бракованного изделия постоянна, для описания процесса мы можем применить схемуБернулли. Присутствие среди изделий некоторой доли θ бракованных неизбежно для любого производства.Величина θ0 может служить границей для все еще допустимой доли брака; если эта доля выше, в производство требуется вмешательство (наладка станков, например).Для контроля за долей текущего брака нужно производить регулярные проверки: нужно проверять гипотезуH0 : θ 6 θ0 против H1 : θ > θ0 .
Выше мы установили, как это следует делать наилучшим образом при простейшемплане эксперимента - выборке.Как объем выборки n, так и частота описанных проверок в нашей постановке не определяются. Их устанавливают, исходя из расходов на организацию и проведение контроля, от потерь от увеличения доли брака,скорости изменения θ в течение работы и т.д.Планы выборочного контроля, реально применяемые на массовых производствах, могут быть значительносложнее, чем изученная нами простая выборка и контроль по качественному признаку (когда изделие либогодно, либо нет).
Научная и техническая литература, посвященная контролю качества продукции, необъятна.Равномерно наиболее мощные критерии (для проверки односторонних гипотез против односторонних альтернатив) типичны для однопараметрических экспоненциальных семейств распределений. Об этих семействахмы упоминали в связи с неравенством Крамера – Рао и эффективными оценками. Плотность (вероятность) наблюдения X при этом равнаp(x, θ) = exp{c(θ)T (x) + S(x) + d(θ)}IA (x).Биномиальные распределения, которые мы исследовали выше, принадлежат этому классу. Если функция c(θ)монотонно зависит от θ, все проведенные выше выкладки повторяются практически без изменений и приводятк решающим правилам видаTn > tлибоTn 6 t.6.5.
Проверка линейных гипотез6.5.1. Выбор степени многочленаВ задачах регрессии y по x функциональный вид зависимости ожидаемого значения отклика E(y|x), какфункции x, бывает известен далеко не всегда. В таких случаях аппроксимирующее выражение для E(y|x) подбирают эмпирически. Часто для приближения выражения E(y|x) используют многочлены от x.Пусть, для простоты, x - скалярная переменная.
Предположим, что:E(y|x) = a0 + a1 x + · · · + ap xp(1)для некоторой степени p > 0 и некоторых коэффициентов a0 , a1 , . . . , ap .Далее предположим, что при некоторых заданных значениях x1 , . . . , xn фактора x проведены независимыеизмерения y1 , . . . , yn отклика y, так чтоyi = a0 + a1 xi + · · · + ap xpi + εi ,i = 1, n,(2)где ε1 , . . . , εn суть независимые случайные величины (ошибки).
Мы предположим, что εi ∼ N (0, σ 2 ), i = 1, n,причем дисперсия ошибки σ 2 неизвестна.Выбор степени p аппроксимирующего многочлена в формуле (1) всегда представляет определенную проблему. Эту степень надо выбрать так, чтобы погрешность в (1) (она же - систематическая ошибка в (2)) не влиялана статистические выводы о E(y|x), которые мы сумеем сделать по наблюдениям (xi , yi ), i = 1, n. Чем ниже этастепень, тем легче интерпретировать результаты опытов. На практике эта степень редко превышает 3.55Особенно часто приходится отвечать на вопрос: можно ли для аппроксимации E(y|x) обойтись многочленомпервой степени, т.е. простой линейной регрессией, или же надо обратиться к параболической регрессии, т.е.
кмногочлену второй степени?Статистически проблема выглядит так.Предположим, что наблюдения y удовлетворяют статистической моделиyi = a0 + a1 xi + a2 x2i + εi ,i = 1, n,(3)где ε1 , . . . , εn — суть неизвестные N (0, σ 2 ), a0 , a1 , a2 - неизвестные коэффициенты. По наблюдениям (3) надопроверить гипотезуH0 : a 2 = 0(4)против альтернативыH1 : a2 6= 0Гипотеза H0 (4) состоит в том, что зависимость отклика от фактора можно передать модельюyi = a0 + a1 xi + εi , i = 1, nпри тех же, что и выше, предположениях об ошибках ε1 , . . . , εn .6.5.2. Однофакторный дисперсионный анализПусть наблюдаются k > 2 независимых выборок, объемы которых обозначим через n1 , .
. . , nk . Элементывыборки номер j, j = 1, k, обозначим через xij , i меняется от 1 до nj . Предположим, чтоxij = aj + εij ,(5)где εij (j = 1, k, i = 1, nj ) суть независимые одинаково распределенные случайные величины. Всюду в дальнейшем εij ∼ N (0, σ 2 ).Такая модель возникает, например, при сравнении нескольких способов обработки, нескольких условий хранения, нескольких мест размещения и т.д. Модель (5) возникает также при любой классификации объектов поодному признаку (однофакторная классификация).При сравнении способов обработки часто бывает нужно выделить лучший (или группу лучших, или группунаихудших и т.п.) способов обработки.