1612725170-875f1dc1af30a046ee4b954c4f0d36bd (828896), страница 9
Текст из файла (страница 9)
Для любого априорного распределения Q = {qi ; i = 1, ..., m} гипотез байесовский критерий определяется по формулеδQ (X) = i, если q(i|X) = max q(j|X),j6mгдеΨX (j)qj.k6m ΨX (k)qkq(j|X) = PЗамечание. Набор вероятностей {q(i|X); i = 1, ..., m} называется апостериорным распределением гипотез. Так что смысл приведенного утверждения достаточно прозрачен – мывыбираем наиболее правдоподобную гипотезу с позиции апостериорного распределения. Приэтом экстремальных точек у апостериорной плотности q(i|X) может быть несколько. В этомслучае приведенный выше критерий выбирает любую из них.Д ОКАЗАТЕЛЬСТВО .Сначала мы получим нижнюю оценку для взвешенной вероятностиошибки произвольного критерия δ.
Обозначим через Si область приема i-ой гипотезы критерием δ. Ясно, что {Si } образуют конечное разбиение выборочного пространства Xn . ИмеемαQ (δ) =mXi=1(1 − Pi (δ = i))qi = 1 −m ZX−→→Ψ−z (i)qi λ (d z ) > 1 −ni=1 Sim ZXi=1 Si34→n −→max(Ψ−z (j)qj )λ (d z )j6mZ=1−−→→max(Ψ−z (j)qj )λ (d z ) = 1 −nj6mXnгдеZ→→→max q(j|−z )Ψ̃(−z )λn (d−z ),j6mXn→Ψ̃(−z)=X→Ψ−z (k)qk .k6mОтметим, во-первых, что правая часть приведенного неравенства не зависит ни от какого критерия.
Во-вторых, это неравенство превратится в равенство, если в качестве Siвзять область приема i-ой гипотезы для критерия, определенного в теореме.Проверка простой гипотезы против сложной альтернативы.Пусть H1 = {F = F0 } – простая гипотеза, H2 = H1 = {F 6= F0 } – классическая альтернатива к H1 (т. е. все распределения, отличающиеся от F0 ).В параметрическом случае проверки простой гипотезы против сложной альтернативы корректно определена вероятность ошибки первого рода. Аналогом вероятности ошибки второгорода будет функция от параметра θ, задаваемая соотношением αθ (δ) = Pθ (δ 6= θ). Здесьмы как-будто проверяем две простые гипотезы: значение неизвестного параметра принимаеттолько два возможных значения θ0 (основная гипотеза) и θ (конкурирующая гипотеза).Определение.
Функция βδ (θ) = 1 − αθ (δ) называется мощностью критерия δ. Если внекотором классе критериев существует критерий δ ∗ , имеющий максимальную мощность привсевозможных значениях параметра, то δ ∗ называется равномерно наиболее мощным в указанном классе.Рассмотрим один специальный случай, когда в параметрической постановке основная гипотеза имеет вид H1 = {θ = θ0 }, а конкурирующая – H2 = {θ > θ0 }или H2 = {θ < θ0 }.
Вэтом случае конкурирующие гипотезы называются односторонними альтернативами.Теорема (существование наиболее мощного критерия). Пусть S – некоторая достаточная статистика для параметрического семейства плотностей {fθ } со скалярным параметром θ. При этом первая компонента факторизации Неймана – Фишераимеет видϕ(S, θ) = exp{An (θ)S + Bn (θ)},где функция An (θ) монотонна. Тогда существует наиболее мощный критерий дляпроверки простой гипотезы против односторонней альтернативы. Например, еслиальтернатива имеет вид H2 = {θ > θ0 } и функция An (θ) возрастает, то критическаяобласть этого критерия задается соотношением S > cε , где критический уровень cεопределяется из уравненияP1 (S > cε ) = ε.Д ОКАЗАТЕЛЬСТВО . Ограничимся случаем, описанным в формулировке теоремы.
Другие возможные комбинации односторонних альтернатив и знака монотонности функции An (θ)рассматриваются аналогично. Если мы покажем, что при любом фиксированном θ1 > θ0 наиболее мощный критерий для проверки двух простых гипотез H1 = {θ = θ0 } и H2 = {θ = θ1 }не зависит от θ1 , т. е. будет универсальным, то утверждение будет доказано.
В самом деле,по теореме Неймана – Пирсона критическая область для проверки двух упомянутых простыхгипотез в условиях нашей теоремы выглядит какΨX (θ1 )= exp{(An (θ1 ) − An (θ0 ))S + (Bn (θ1 ) − Bn (θ0 ))} > c̃εΨX (θ0 )35или в эквивалентной форме: S > cε , где cε = (An (θ1 ) − An (θ0 ))−1 (log c̃ε + Bn (θ0 ) − Bn (θ1 )).Ясно, что cε зависит только от θ0 и ε. Упражнение. Построить равномерно наиболее мощный критерий для проверки простойгипотезы H1 = {α = 0} против односторонней альтернативы H2 = {α > 0} для выборки изнормального распределения N (α, 1).Упражнение.
Построить равномерно наиболее мощный критерий для проверки простойгипотезы H1 = {λ = 1} против односторонней альтернативы H2 = {λ > 1} для выборки изпуассоновского распределения Πλ .Принцип минимального расстояния. Пусть на множестве всех функций распределения{F } задана функция двух переменных d(F1 , F2 ), называемая статистическим расстоянием. Для любых функций распределения F1 и F2 предполагается выполненным следующее:1.
d(F1 , F1 ) = 0,2. d(F1 , F2 ) > 0.Это минимальные требования (мы не требуем симметричности и выполнения неравенства треугольника). Напомним, что по теореме Гливенко – Кантелли эмпирическая функция распределения Fn∗ с вероятностью 1 стремится в равномерной топологии к истинной функции распределения F0 . Рассмотрим поведение функционала d(Fn∗ , F0 ). Если он обладает свойствомнепрерывности относительно указанной равномерной топологии, то d(Fn∗ , F0 ) → 0 с вероятностью 1 при n → ∞.
Если это не так, то F0 определенно не является истинным распределением. Мы пришли к конструкции “асимптотического” критерия (которую, впрочем, на практикереализовать невозможно):1, d(Fn∗ , F0 ) → 0,δ(X) =2, d(Fn∗ , F0 ) 9 0.Это и есть описание “на пальцах” так называемого принципа минимального расстояния:если мы угадали истинное распределение (или выбрали близкое к нему), то статистическоерасстояние должно быть мало́. Критерии, основанные на таких расстояниях, называются критериями согласия (основной гипотезы с экспериментальными данными).
Но для того чтобысделать такой критерий конструктивным, нужно формализовать понятие "мало́".Критерий Колмогорова. Вводим равномерную метрику dk (F1 , F2 ) = sup |F1 (t) − F2 (t)|.t∈RЭтот функционал является не только статистическим, но и метрическим расстоянием.Лемма 1. Если истинное распределение F0 непрерывно, то выполняется свойствонепараметричности критерия, т. е. функция распределения P (dk (Fn∗ , F0 ) < t) не зависит от F0 .Д ОКАЗАТЕЛЬСТВО .
В качестве упражнения. Указание: с помощью квантильных преобразований сделать замену переменных под знаком супремума.Это замечательное свойство позволяет применять универсальные таблицы для вычисления так называемых критических уровней cε – разделительных барьеров между упомянутыми выше понятиями "мало́"и "не мало́". В результате получим критерий Колмогорова1, d(Fn∗ , F0 ) 6 cε ,δ(x) =2, d(Fn∗ , F0 ) > cε ,где cε находится из уравнения P1 (d(Fn∗ , F0 ) > cε ) = ε (это есть вероятность ошибки первогорода) и соответствующих таблиц. Однако эти таблицы созданы только для n ≤ 100.
Еслиже объем выборки существенно больше, то для вычисления критических уровней используютследующее утверждение.36Теорема (А. Н. Колмогоров). Если F0 ∈ C(R), то имеет место следующее предельноесоотношение:∞X√2 2∗lim P ( ndk (Fn , F0 ) < t) =(−1)k e−2k t ≡ K(t).n→∞k=−∞Функция K(t) называется функцией Колмогорова. Она является функцией распределения из класса C∞ , но не аналитическая. Приведенный результат неверен для разрывныхфункций F0 .Стало быть, при больших n справедливо приближенное равенство∞X√2 2∗∼(−1)k e−2k t = K(t),P ( ndk (Fn , F0 ) < t) =k=−∞которое и используется для вычисления критических уровней cε .Критерий χ2 . Речь пойдет о проверке двух гипотез в двух случаях, когда проверяется простая гипотеза против сложной альтернативы, а также сложная против сложной.Здесь мы имеем дело с наблюдениями произвольной природы.
Поэтому будем рассматривать расстояния вида d(P1 , P2 ) на пространстве всех распределений, которые заданы навсех измеримых подмножествах измеримого множества (X, B).Рассмотрим произвольное конечное разбиение {∆i , i 6 m} множества X. По этому разбиению определим так называемое расстояние χ2 :dχ2 (P1 , P2 ) =mX(P1 (∆i ) − P2 (∆i ))2P2 (∆i )i=1(по умолчанию предполагается P2 (∆i ) 6= 0), которое не является метрикой в отличии от расстояния Колмогорова, так как для него не выполнено неравенство треугольника и нет симметрии относительно перестановки аргументов. При этом выполнены упомянутые выше свойствастатистического расстояния (с очевидной заменой функций распределения на сами распределения).Следуя принципам построения критериев согласия, рассмотрим d(Pn∗ , P0 ), где Pn∗ – эмпирическое распределение, построенное по выборке x1 , .
. . , xn :Pn∗ (A) =#(xi | xi ∈ A)n(для случая простой основной гипотезы H1 = {P = P0 } и альтернативы H2 = H1 ).Обозначим через νi = #{xj | xj ∈ ∆i } число выборочных точек, попавших в множество∆i ; положим pi = P0 (∆i ) 6= 0. Тогдаd(Pn∗ , P0 ) =mXi=1νin2− pi.piКритерий строится следующим образом:1, d(Pn∗ , P0 ) 6 cε ,δ(x) =2, иначе.37Вероятность ошибки первого рода для этого критерия: ε = P1 (δ = 2) = P1 (d(Pn∗ , P0 ) > cε ).Тем самым мы получили уравнение для нахождения cε , где ε называют уровнем критерия.По аналогии с критерием Колмогорова имеет место свойство асимптотической непараметричности критерия χ2 в классе всех распределений.Для данного расстояния используем только асимптотический результат. Приведем без доказательства теорему Пирсона:Теорема. Если P0 – истинное распределение x1 , то при n → ∞ndχ2 (Pn∗ , P0 ) ⇒ η ∈ χ2m−1 .С ХЕМА ДОКАЗАТЕЛЬСТВА .