Учебник_Бочаров_Печинкин (846435), страница 47
Текст из файла (страница 47)
Наличие предыдуших наблюдений в силу аддитивности потерь никак не влияет на решение задачи, поскольку их вклад в общие потери последующими испытаниями уже нельзя ни увеличить, ни уменьшить. Итак, процедура принятия решения прежняя: если я < я' или я ) и", то испытания прекращаются и принимается Ио или Нп а если я' < я < я", то производится дополнительное наблюдение Однако при этом мы должны оперировать уже не априорной вероятностью я, а апостериорной вероятностью я(Хп ...,Х„) справедливости гипотезы Но при условии выборки Хы ...,Хч, определяемой формулой Байеса яро(Х~) ро(Х ) яро(Х~) .р>(Ль) -1- (1 — я)р~(Х~) ..р~(Ль) Оптимальный байесовский критерий, таким образом, требует продолжения наблюдений только в случае я' < я(Хы..., Х ) < яи или после проведения элементарных преобразований в случае т 1 — яи р~ (Х~) р~ (Х„) тг 1 — я' < ', =С,. С 1 „„„(Х,)...„(Х.) 1 Вторая часть доказательства теоремы 2 устанавливает связь между параметрами основной и байесовской задач и состоит в доказательстве следующей леммы.
Лемма 2.2. Для любых я' и я" (О < я' < яо < 1) найдутгя числа ш (О < ш < !) и г( ) О, такие, что решение байесовской задачи с потерями шо = 1 — ш, ш~ = ш, стоимостью одного испытания г( и априорной вероятностью я появления гипотезы Но задается последовательным критерием отношения правдоподобия с границами 1 — я и 1 — я Со= — —. ! в я я и 1 — 7г я Доказательство леммы 2.2 представляет, по сути дела, доказательство существования обратного отображения для двумерного вектора (я', яи) как функции от и и г).
Оно носит чисто аналитический характер и основывается на таких почти очевидных свойствах я' и я", как монотонность, непрерывность и т.д. Поэтому мы его здесь не приводим, отправляя заинтересованного читателя к (12). Отметим, что требование леммы шо + ш! =- ! нисколько не ограничивает общности задачи, поскольку этого всегда можно добиться линейной заменой «масштаба цен» («денежной реформой»). Для окончания доказательства теоремы 2 рассмотрим последовательный критерий отношения правдоподобия с границами Со и С~ (Со < 1 < С~). Для любого числа я положим ! 7г и 7Г С, (! — )+ ' Со(! — ) ж Эти значения удовлетворяют равенствам (7) и неравенствам О < я' < яч < !. Поэтому, по леммам 2.1 и 2.2, найдутся такие ш (О < и < 1) и г( > О, что рассматриваемый критерий будет являться решением байесовской задачи с априорной вероятностью .т, потерями шо = 1 — ш и ш~ = ш и стоимостью одного наблюдения с(.
Обозначим через оо, оы Но и )У~ вероятности ошибок 222 Гл. 3. Проверка сгпагпистипеских гипогпвз и средние числа наблюдений данного последовательного критерия отношения правдоподобия. Кроме того, рассмотрим любой другой критерий для проверки гипотез Е1о и Н~ с вероятностями ошибок йо < сго и Й~ < ои и средними числами наблюдений Аго и Агп Поскольку последовательный критерий отношения правдоподобия минимизирует байесовский риск, то применяя к байесовской задаче и второй критерий, имеем п((1 — ш) сто -~ 4% -~ (1 — и) (пссл~ П- с(К ) < < .г((1 — и )ос+ с(Ао) + (1 — к)(шсг~ -> с(Аг~), откуда получаем яйо ч (1 — к)Аг~ < кдо и (1 — к)Аи Из справедливости последнего неравенства при всех я (О < тг < 1) вытекают, в частности, соотношения Аго < Аго и Аг~ < Аги что и доказывает теорему.
Е) Замечание к теореме 2. Анализируя доказательство леммы 2.1, нетрудно заметить, что если на первом шаге х = я (я = я ). то у нас имеются две (а с учетом рандомизации и больше) идентичные с точки зрения байесовского риска возможности, принять Но (Н~) или продолжить испытания; такая же ситуация может возникнуть и после любого наблюдения. В том случае, когда отношение правдоподобия . ) ш(Х~) ...гч(Х„) ро(Х~) "ро(Хл) может равняться Со (С~) только с нулевой вероятностью, последнее обстоятельство не влияет на последовательный критерий отношения правдоподобия.
Если же эта вероятность не равна нулю, то можно предложить, по крайней мере, две модификации критерия, одна из которых будет предписывать прекращение испытаний при равенстве отношения правдоподобия соответствующей константе, а другая, наоборот, продолжение наблюдений. Обе эти модификации, как уже говорилось, имеют одинаковый байесовский риск. Однако другие характеристики для них будут различными, в частности, вторая модификация требует большего числа наблюдений Впрочем, никакого противоречия с изложенной теорией здесь нет, поскольку увеличение количества наблюдений компенсируется уменьшением уровня значимости и увеличением мощности Поэтому для построения последовательного критерия отношения правдоподобия, имеющего заданные уровень значимости и мощность, необходимо, вообще говоря, привлекать рандомизацию. Подробнее на этом мы останавливаться не будем.
При мер 2. Пусть наблюдается нормально распределенная случайная величина Х с известной дисперсией а и неизвестным средним д, относительно которого имеются две простые гипотезы: 11о. д = до и 11~ д = д~ (до < гз<). Как показано в примере 1, отношение правдоподобия имеет вид Л(х,,х„) ' ~х ...+х„' оч )]. сг При применении последовательного критерия отношения правдоподобия наблюдения продолжаются, пока со < Л(Ли, Х„) < си в противном случае принимается либо гипотеза Но (если Л(Хи,Х,) < со), либо гипотеза Н~ (если Л(Хи, Х„) > с~). 3.
Однопара,четрические гипотезы. Равномерно наилучшие критерии 223 Вычислим М[Л(Х) [Но) и М[Л(Х) [Н~). Поскольку М(Х Нв) = де, а М(Х [Н~) = дн то М[Л(Х) [ЕЕо[ = М[ ~ — о (Х ~ е) ЕЕо~ = В1 — ао /,. в|э ао~ (О~ — дор еа 2 2еа м[л(хПН) м[ (х ) н ~ (д1 'В1 — дв г Щ Э вот (д~ — до) а 2 2ае Предположим теперь, что заданы конкретные значения. о = 0,05, = 0,9, о~ = 1, дв = — 0,5 и д1 = 0,5. Тогда со = — 2,25, с~ = 2,89, М[Л(Х) [ЕЕе) .= — 0,5, М[Л(Х) [Н~) = 0,5, откуда определяем средние числа наблюдений Же 4 н Е1г~ 4,75. Для сравнения, подставив в примере 1 значения роа = 1,281552 и роев — — — — 1,644854 ([1, с !36)), находим, что прн использовании обычного критерия отношения правдоподобия для разделения гипотез Но и Н1 с уровнем значимости о = 0,05 и мощностью,З = 0,9 необходимо иметь выборку объема и = 9.
Значит, применение последовательного критерия отношения правдоподобия в случае справедливости гипотезы Не позволяет в среднем сократить число наблюдений более чем в 2 раза, а в случае справедливости гипотезы Н1 — почти в 2 раза. О У последовательного критерия отношения правдоподобия можно отметить два основных недостатка. Первым является невозможность одновременного проведения нескольких испытаний. Второй связан с тем, что если произошла ошибка в определении гипотез Но и Н! и истинная теоретическая функция распределения Е'(х) заключена между гипотетическими Ео(ш) и Г!(ш), то потребуется очень большое число наблюдений, поскольку логарифм отношения правдоподобия будет колебаться вокруг нуля, не выходя ни на одну из границ со или с!.
Для того чтобы компенсировать этот второй недостаток, на практике часто принудительно ограничивают число наблюдений. 3. Однопараметрические гипотезы. Равномерно наилучшие критерии Пусть выборка Х!,...,Х„ извлечена из генеральной совокупности с теоретической функцией распределения Е'(х), принадлежащей одно- параметрическому семейству Е'(Х; д) с неизвестным параметром д, область возможных значений которого будем обозначать через О (обычно О представляет собой либо всю прямую ( — ос,оо), либо полупрямую (а, оо) илн (-оо, а), либо отрезок [а. Ь[). Предположим, что в !д выделено некоторое подмножество Оо; дополнение к нему в О обозначим через О! = О Л Оо.
Относительно неизвестного параметра д имеются две гипотезы: основная Но. д Е Оо и конкурирующая Н!. д б О!. Зада- 224 Гл. 3. Проверка сп1аюистииеских гипотез ча состоит в построении критерия для проверки двух (вообще говоря, сложных) однопараметрнческнх гипотез Но н Н1. Отметим, что если подмножество Оо состоит всего из одной точки до, то критерии для проверки гипотез Нп и Н1 называют обычно критериями значимости. В этом параграфе мы рассмотрим те случаи, в которых существуют равномерно наиболее мощные несмещенные критерии.
Построение критериев в остальных случаях можно проводить по общему рецепту, приведенному для (много) параметрических гипотез в следующем параграфе. Односторонние гипотезы. Пусть подмножество Оо состоит из всех д < до; соответственно подмножество 01 бУдет содеРжать все д > до. Таким образом, мы имеем две односторонние гипотезы: основную Но.. д < до и конкУРиРУющУю Н11 д > дп. Возьмем пРоизвольные д' < д" и составим отношение правдоподобия Л(хь..., Х„; д', ди) = т'(х1 'х" д",), л(Х1,...,ХГн д') ' где Т,(Х1,...,Х„нд) =Р(Х,;д)" Р(ХГдд) в дискретном случае н Т,(Хы...,Х„;д) =р(Х,;д)" р(Хп;д) в непрерывном — функция правдоподобия. Теорема 3 (односторонние гипотезы). Предположим, что существует (одномерная) статистика Я = Н(Х1,..., Хп), такая, что для любых д' < д" отношение правдоподобия можно представить в виде Л(хы..., Х„,; д', ди) = Л(~ (Хь..., Х„), д', ди), причем Л(5,д',дп) — неубывающая функция от Я.
Тогда существует равномерно паиоолее мощный критерий' для проверки гипотез Но и Н1, критическая область И; которого состоит из всех точек (х1,...,юп), УДОВЛЕтВОРЯЮШНХ НЕРаВЕНСтВУ О(т1,..., ап) > С, а УРОВЕНЬ ЗпаЧИМОСтн сх = о(д) и мощность 3 =- 3(д) являются неубьгвающими функциями от д и, как обычно, определяются формулами сх(д) = Р(Я(Х1,...,Х„,) > С ~ д) = 2' Р(х1,д) ".Р(х„дд) З[и,,...,л,»С (д < до), ~3(д) = Р)Н(Х1,...,Х„) > С д) = ~' Р(т,1,д) ...Р(юп;д) 51Ю,... Л„1> П (д > до) 3.
Однопарамелзричаские гипожезьь Равномерно наилучшие крижерии 225 в дискретном случае н сс(д) = РТЯ(ХБ..., Хв > С ~ дХ = Я р(' 'д)" р( 'д) М д" (д < до), з(ю,...,г 1>с Д(д) = Р(Я(ХП..., Х„> С ~ д) = р(:и д) р(ш.;д) д дшп (д > до) ьтю,...,.















