Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 58
Текст из файла (страница 58)
Сложная гипотеза состоит нз простых гипотез, отвечающих фиксированным значениям параметров. Определение можно сформулировать н так: сложнал гипотеза есть множество прас!пах гипотез. Если хотят проверить простую гипотезу Н и если альтернатива Н' также является простой, то, как мы видели в з 59, для проверки Н все~да существует критерий, являющийся наиболее мощным относительно альтернативы Н'. Но если Н' является сложной, то могут иметь место два случая: либо существует равномерно наиболее мои(ный критерий, относительно всех простых гипотез, содержащихся в Н', либо такого критерия не существует.
Пример 42 (й 59) может служить иллюстрацией обоих случаев. В этом примере гипотеза Н является простой и гласит, что все 316 Гм ХТ. Проверка гипотез с помои1ью статистическик критериев х, независимы и распределены нормально с нулевым средним значением и единичной дисперсией.
Альтернативная гипотеза Н' зависит от параметра а и поэтому является сложной; согласно этой гипотезе, х, независимы и распределены нормально со средним значением а и единичной дисперсией. Если допустимы лишь положительные значения а, то существует равномерно наиболее мощный критерий: гипотеза П отвергается тогда, когда х превышает сЯи.
Но если допустимы также и отрицательные значения а, то равномерно наиболее мощного критерия не существует. Критерий, отвергающий большие значения а. теряет свою мощность при отрицательных а, и критерий, отвергающий малые значения х, не является наиболее мощным при положительных а, Для того чтобы в подобных случаях хорошие критерии можно было отличать от менее хороших, вводится понятие несмещенности.
Критерий для проверки простой гипотезы Н называется несмещенным, если вероятность отвергнуть Н, когда она верна, не превосходит вероятность отвергнуть Н, когда верка одна из гипотез Н', т. е. Р()г!Н) = Р()г~!Н') для всех Н'. Другими словами, вероятность отвергнуть гипотезу Н, когда она правильна, не должна превосходить вероятность отвергнуть Н, когда Н ложна. Вполне разумное требование! Если в примере 42 расширить гипотезу Н' и считать допустимыми все положительные и отрицательные средние значения о„ то односторонние критерии, которые отвергают гипотезу Н, коль скоро х> с/~п или коль скоро х ~ — с/(/и, не будут несмещенными.
Для того чтобы получить несмещенный критерий, нужно воспользоваться абсолютной величиной ~ х ~ и определить критическую область с помощью неравенства ~ х ~ > с'/(/и, Если с' выбрать таким образом, чтобы вероятность отвергнуть гипотезу Н, когда она правильна, в точности равнялась ф, то этот критерий будет несмещенным, наиболее мощным критерием относительно всех альтернатив Н'. Доказательство' можно найти в работе: Хеушап 1. апг( Рва га оп Е. Я., Оп СЬе ргоЬ)еш оу СЬе шовС еВйс1епС СевСв о1 в(а11вС1са1 ЬуроСЬеввв, РЬ11ов.
Тгапв. Воуа1 Яос., ?.опс(оп, А 231 (1933), Если гипотеза Н также является сложной, то и задача становится сложнее. Пусть, например, согласно гипотезе Н, случайные величины х„..., х„предполагаются независимыми и одинаково нормально распределенными с нулевым средним зна- г Это доказательство приводится а книге К р а и е р а Г., Математические методы статистики, ИЛ, М., 1948, стр.
581. — Прим. перев. д 60. Сложные гипотезы 317 чением и произвольным (незаданным) квадратичным отклонением о, Если гипотеза Н верна, то совместная плотность вероятности для х,,..., х„задается формулой и 1 — — — —, (х, '+... + х„) у(х~а) = (2пт) в (2) Пусть Тг — критическая область. Если наблюденная точка Х принадлежит Р, то гипотезу следует отвергнуть.
При этом вероятность ошибки первого рода вообще говоря, зависит от о. Если Р(е' ~о) чф для всех о.> О, то говорят, что уровень значимости критерия или области У не превосходит р. Если жс для всех о Р()г ) ог) = р, то говорят, что критерий (или область )г) имеет уровень значимости, в точности равный )3. В этом случае Нейман и Пирсон называют г' областью, подобной пространству выборок'. Нейман, Шсффе и Леманна разработали общие методы, позволяющие находить области Р с уровнем значимости, в точности равным р.
Сущность этих методов мы поясним с помощью только что сформулированного примера. Доказательства можно найти в соответствующей литературе. Формула плотности вероятности (2) непосредственно показывает, что (4) является достаточной оценкой для тих', Плотность распределения случайной величины Я равна л т — 1 — —,и 1 д(и ) о ) = С о'-" и~ в, где С = Г( — )2 Однопараметрическое семейство функций д(и ! тг) образует ограниченно-полную систему, в смысле Леманна и Шеффе; это т пространство выборок ж удовлетворяет равенству РЯ)а) = 1 нри всех о.. — Прим. нерее.
' Си. прежде всего 1 е и ш а пи апг) и сиеста, Соптр1ееепев, Йшиах хтей)опв апс) ЮпЬ)аееб КвИпзаыоп, оапйИуа, 10 (1960), 306 и 15 (1956), 219. Таи же указана дальнейшая литература. 818 Гл. Хдд Проверка гипотез с помоидою со~атистикгскик критериев означает, что если ограниченная интегрируемая функция р(1) удовлетворяет интегральному уравнению ~~р(и) д(и)сг) дди = О при всех ~г) О, (6) о то р(1) = О. Эта полнота становится тотчас же ясной, если, отбросив множитель Со.-", записать интегральное уравнение (б) так: п — — 1 а у(и) е-"'Ыи = О при всех к) О. о Леманн и Шеффе доказали, что в том случае, когда плотности вероятности образуют ограниченно-полную систему, все области е', имеющие уровень значимости, в точности равны,б, можно найти по методу Неймана. Согласно этому методу, для каждого отдельного значения и достаточной статистики 4 ищут такую область в'„, для которой условная вероятность, вычисленная при условии Я = и, принимает значение б.
Если объединение в' всех областей Ри измеримо, то оно имеет уровень значимости, в точности равный р. В нашем случае е'„ представляет собой область на сфере (8) 4+ +4=в. Условная плотность распределения случайных величин х„..., хп на этой сфере задается отношением 1(к ) а) ~1(и) т) йип д Э (9) причем интегрирование в знаменателе производится по сфере (8). Область г'„на этой сфере нужно выбрать таким образом, чтобы интеграл от функции (9) по )г„в точности равнялся ф. Так как функция ~(я ~ о.) на всей сфере равна некоторой постоянной величине, то в числителе и знаменателе (9) множители 1(х ~а.) сократятся и интеграл будет просто равен отношению площади к площади всей сферы.
Таким образом, площадь ри должна быть равна площади сферы, умноженной на р. В остальном области )ги можно выбирать произвольно (лншь бы они были не слишком дикими, с тем чтобы их объединение г" оставалось измеримым). Выбор областей в'„для построения наилучшего критерия в значительной мере зависит от рассматриваемых альтернативных гипотез 11'. В данном случае в качестве альтернативы Н' мы примем сложную гипотезу, согласно которой х„..., х„— независи- й 60. Сложные гппотгзы 319 мые, одинаково нормально распределенные случайные величины с положительным средним значением (з и произвольным квадратичным отклонением гг. Соответствующая плотность вероятности задается формулой п 1 — — [(е, — а) ° е ...ч (е — а)*1 Т',(х (сг) = (2тг гг) е, (10) Определение наиболее мощного критерия, соответствующего этой альтернативной гипотезе Н', не представляет труда.
Сначала зафиксируем значение сг и определим область Рп таким образом, чтобы соответствующий критерий был наиболее мощным относительно отдельной гипотезы Н'. Так как интеграл от функции (9) не зависит от г, то можно считать, что в (9) и (10) величины сг одинаковы. Тогда метод, изложенный в 9 59, сам собой приведет нас к критерию отношения правдоподобия' Лх! ) )а(* ( о") т.
е., в нашем случае, а па' —.М, ' ...Ее„[ — —, е а и, Таким образом. гипотезу Н следует отвергнуть, коль скоро выборочное среднее — 1 х = — (х, +... + х ) превышает некоторое критическое значение ш. Величина и: выбирается таким образом, чтобы плоскость с уравнением х = ео разбивала сферу (8) на двз части и чтобы площадь той части, где х> то, равнялась площади всей сферы, умноженной на )8. Полученный критерий в точности совпадает с односторонним критерием Таким образом, среди всех критериев, имеющих уровень значимости, в точности равный б, односторонний критерий 1 ' Так как мы хотим найти область Гш расположенную на сфере (8), то мы должны воспользоваться условными плотностями (9) й (е(з, о) ~~ (а(х(ы) г[ып — г где интегрирование производится по сфере (8). Так как интегралы в знаменателях условных плотностей зависят лишь ото, то отношение правдоподобия можно записать в виде(11), где, вообще говоря, о = о(о).