Учебник_Бочаров_Печинкин (846435), страница 46
Текст из файла (страница 46)
О другой стороны, в дискретном случае этого, как правило, вообще нельзя сделать, поскольку область Ррр состоит из конечного числа точек. Поэтому обычно идут более простым путем: при попадании выборки Хп ...,Х„ в область Ис„, которую называют областью рандомизации, проводят дополнительный независимый эксперимент с двумя исходами типа подбрасывания несимметричной монеты с вероятностью выпадения «цифры» (о — о')сс(о" — о'). При этом если выпадает «герб», то принимают гипотезу Но, «цифра» гипотезу Нь Такой критерий называется раидомизироваиным. В соответствии с формулой полной вероятности уровень значимости раидомизироваиного критерия равен о' + (оь — о')(о — о')сс(о" — о') =- о, Очевидно также, что рандомизированный критерий отношения правдоподобия будет наиболее мощным. Естественно, в наше время при дополнительном эксперименте ие бросают монету, а моделируют на ЭВМ псевдослучайное число.
В дальнейшем, как уже говорилось, мы ие будем рассматривать раидомизированные критерии, хотя это и вызовет у иас определенные трудности при формулировке и доказательстве некоторых результатов. При практической реализации критерия отношения правдоподобия обычно удобно пользоваться не отношением правдоподобия Л, а его логарифмом Л = 1пЛ. В этом случае мы должны принять гипотезу Но, если Л =. Л(Хс,..., Х„) < с = !пС, и отвергнуть ее (принять гипотезу Нс), если Л > с. В соответствии с общим правилом уровень значимости о и мощность 3 критерия отношения правдоподобия в зависимости от критического значения с определяются формулами (:) = Р(Л(Х,,...,Х„) > с ~ Но) .= ~'Ро(, ) "Ро(.,), 3 = 3(с) = Р(Л(Хп..., Х„) > с ( Н1 ) = ~ Рс(хс) "Рс(х„) в дискретном случае, где сумма берется по всем значениям хс,..., х«о принадлежащим множеству (оы...,бс,) и удовлетворяющим условию Л(хс,...,х„) > с, и сс = сс(с) = Р~Л(Хп..., Х„) > с / Но) = ро(хс) " ро(хп)с!хс " с1х., лгт,...,х 1>с 3 =- 3(с) =- Р~Л(Хп..., Х„) > с / Н~) = Р ~ (х1) .
"Рс (х„) асх с " с!х„ Л1т....,в,д > с в непрерывном. В этих формулах запись Р(Н(ХВ...,Х„) > С ~ Н,) (с =- О,!) обозначает вероятность статистике Я(ХП ,Х„) принять значение больше С при условии справедливости гипотезы Н,. Если задан уровень значимости сх, то критическое значение с определяется из решения относительно с уравнения сс = сс(с). Аналогично поступают и в том случае, когда задана мощность,'3. 2. Оростые гипотезы 217 Если задан уровень значимости а, то критическое значение с" определяется формулой с* = пдь — 'рь4па', где р — о-квантнль стандартного нормального закона Наконец, если заданы уровень значимости о н мощность д н требуется найти минимальный объем выборки и, позволяющий разделить гипотезы Уь н У~ с такими а и д, то с* должно удовлетворять двум равенствам: с: пдь ра'гпа, с: пд~ 1аетгпа Вычитая второе равенство из первого, получаем и(д/ — дь) = (рв — Эь )у по нлн и (М — 1ь ) ь (е~ — во) Разумеется, реальный объем выборки должен быть ближайшим к п сверху целым числом.
Зададим вопрос: а можно ли для проверки двух простых гипотез Но и Н~ построить критерий с заданным уровнем значимости о и мощностью 1э', который потребовал бы меньшего объема выборки, чем критерий отношения правдоподобия? Очевидно, среди критериев с фиксированным объемом выборки такого нет. Однако можно рассматривать последовательные критерии, в которых испытания проводятся последовательно, и после каждого испытания мы вправе либо прекратить испытания и принять одну из гипотез Но или Нн либо продолжить наблюдения.
При последовательном проведении испытаний после первого же испытания могут появиться столь серьезные основания в пользу той или иной гипотезы, что дальнейшие наблюдения становятся просто бессмысленными. Так, хороший врач по одному ярко выраженному признаку может поставить точный диагноз пациенту. Ясно, что у последовательного критерия число наблюдений случайно и поэтому вместо объема выборки следует оперировать средним числом наблюдений, которое, естественно, будет различным при условиях справедливости гипотез Но и Нн Оказывается, среди последовательных критериев также существует наилучший, который мы сейчас и опишем.
Последовательный критерий относиения правдоподобия (критерий Вальда) строят, опираясь на логарифм отношения правдоподобия (и это естественно, поскольку отношение правдоподобия наиболее объективная мера различия гипотез). Сама процедура принятия решения реализуется следующим образом. Задаются критические значения со и гп (со ( с~). Проводят первое испытание и по его результату Х~ определяют логарифм отношения правдоподобия Л(Х~) = 1п в дискретном случае или Гл. 3. Проверка сгпатпистинеских гипотез 218 Л(Х!, Хз) = Л(Х~) + Л(Хз) и сравнивают его с с! и со.
Если Л(Х!, Хз) > с!, то принимают гипотезу Нн если Л(Х!, Хз) < со — гипотезу Но, если со < Л(Х!, Хз) < с!, то переходят к третьему испытанию, по результатам которого определяют Л(Хь,Хю Хз) = Л(Х!) + Л(Ха) + Л(Хз) и т.д. Графическая схема проведения испытаний приведена на рис. 2.
Нахождение уровня значимости а и мощности,д последовательного Ы мн 'т! н1Я!нлтпы синит'чгл Н( с! 1 / Нанн Н н~ иытнннн гв ° гЮлнгть нрнннтнн гноите!м Нп Рис. 2 критерия отношения правдоподобия представляет собой весьма сложную задачу (задача выхода случайного блуждания из полосы), все имеющиеся решения которой (за исключением некоторых частных случаев) нужно признать неудовлетворительными в смысле методов вычисления.
Обычно используют следующие приближенные оценки: е" (1 — е" ) д т, М е' есО с, точность которых, как правило, увеличивается с ростом с! и уменьше- нием со. Из этих оценок можно при заданных а и Д найти приближен- ные выражения для критических значений со и с!. 1 —,3 со - -1п 1 — а с! - -1п —. а Другими важными характеристиками последовательного критерия отношения правдоподобия являются средние числа наблюдений гЛго и Лг! пРи УсловиЯх спРаведливости гипотез Но и Нн котоРые можно приближенно вычислить по формулам ас~ + (1 — а)св Пс~ + (1 — б)со М(Л(Х) Н,) ' ' М(Л(Х)/О,) в непрерывном. Если Л(Х!) > с!, то принимают гипотезу Н!, если Л(Х!) < со — гипотезу Но, если же со < Л(Х!) < с!, то проводят второе испытание. Снова определяют логарифм отношения правдоподобия 219 2.
Простые гипотезы Где М(Л(Х) / Ню) = ~ 1п ' ' Ро(бг), 1=! М(Л(Х) ~ Н!) = ~ )п ' ' )з!(Ьг) г=1 в дискретном случае и М(Л(Х) )Но) = 1п ' рю(х)с(т, рз(м) М(Л(Х) /Н!] = 1пР' р!(х) г(з рю(ж) в непрерывном, Оптимальные свойства последовательного критерия отношения правдоподобия задаются следующей теоремой.
Теорема 2 (Вальда). Среди всех критериев (последовательиых или нет) с заданными уровнем значимости сг и мощностью 3 и конечными средними числами наблюдений )Ло при условии справедливости гипотезы Ню и Х! при условии справедливости гипотезы Н! последовательный критерий отношения правдоподобия минимизирует как Хо, так и Х!. Доказательство теоремы наиболее просто получается с использованием байесовского подхода. Пусть гипотезы Пю и Н~ появляются случайным образом с известными вероятностями и появления гипотезы Ню и ! — к гипотезы Нп Пусть также задана стоимость И каждого наблюдения и при неправильном отклонении гипотезы Ню (Н~) мы несем потери шю (гю~).
Тогда для любого (в том числе последовательного) критерия К общий байесовский риск (общие средние потери) Н( т, К') определяются формулой Н(х, Н) = п(оюгею+ г(тЛгю) + (1 — п)(гг~ш~ + г(Г4~), (4) где ою (о~) — вероятность неправильного отклонения гипотезы Ню (П~), а Ню (Лг~) — среднее число наблюдений при условии справедливости гипотезы Ню (Н~). Доказательство состоит из двух основных частей.
Первая часть, представленная леммой 2.1, определяет байесовскую процедуру, минимизирующую (4). Отметим, что интерпретация (4) как байесовского риска помогает лучше понять доказательство и приводит к задачам, представляющим самостоятельный интерес. Прежде чем сформулировать лемму 2.1, произведем некоторые дополнительные рассмотрения. Обозначим через р(п) минимальный байесовский риск для всех критериев, требующих хотя бы одного наблюдения (класс таких 220 Гл. 3.
Проверка саааисаических гипоаез критериев обозначим через К). Тогда в силу линейности байесовского риска Л(к,К) по к для К 6 К и любого Т (О < Т < 1) справедливо соотношение р( упг + (! — у)яз) =- !и! Л( ~к7 Ч- (! — у)гг7, К) =. 'ш! ( уЛ(гг7, К) + (1 — у) Л(тгы К)) > > у !в! Л(пг, К) + (1 — 'у) Гпу Л тг, К) = 'ур(к7) + (! — 'у)р(яг). КЕ7С кек Следовательно, р(п) — выпуклая (вверх) функция (рис. 3). Г ! Рнс. 3 Рассмотрим критерий Ко (К7), отвергающий Но (Н7) без проведения ис- пытаний. Имеем Л(77, Ко) = 7Гюо (Л(7г, КГ) =- (1 — 7г)ю7). Если Р ( ) юг ) Гяого7 < юо4ч77~ ю,—,-ю,' то определим и' и пн из решения следующих уравнений (см.
рис. 3); Л(7Г,Ко) = Р(п ) Л(яя,КГ) = Р(я ); (5) ( т ! — 77 н со = !пСо = 1п ( и ), ', ! —:Г 7ггг Г с7 = 1пСГ =- 1п ( ., ). (7) Доказательство леммы 2.!. Заметим прежде всего, что если я < х7 или я > и", то вообще не имеет смысла проводить испытания. Поэтому оптимальный критерий состоит в следуюгцем поведении на первом шаге: мы принимаем гипотезу Но, если я < к', отвергаем, если к > к", и производим первое наблюдение, если к' < к < Гг".
в противном случае положим н 'ШГ 77 = 7Г (6) ЮО + Ю7 В силу свойств выпуклости и положительности функции р(п) числа к' и к", удовлетворяющие уравнениям (5) или (6), определяются единственным образом. Лемма 2.!. Если 0 < я' < ян < 1, то при всех я (к' < к < ян) байесовский риск (4) минимизирует последовательный критерий отношения правдоподобия с критическими значениями 2. Простые гипотезы 221 Доказательство леммы 2.1 завершается теперь по индукции. Действительно, если уже сделано п наблюдений Хы ..,, Х„, то мы попадаем в ту же ситуацию, что и перед первым наблюдением либо не производить дополнительные наблюдения и принять Но или Н~ с потерями шо или ич в случае неправильного решения, либо произвести (и гг 1)-е наблюдение.















