Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 25
Текст из файла (страница 25)
Таким образом, интер- вал Х, — ($ < 0 < Х;, где д = л ' 1он(1 — Р), задает наимень- шую апостериорную зону, содержащую апостериорную вероят- ность с вероятностью Р. Для указанной выше выборки получим 11.23 < О <!2.0. С точки зрения теории доверительных интер- валов можно было бы сказать, что 0 не является достаточной статистикой для О, а статистика Х; — достаточная. Довери- тельный интервал наименьшей длины, построенный по доста- точной статистике, совпадает с байесовским интервалом, указан- ным выше.
Но даже если мы работаем с Хп может оказаться, что 00 г)в доверительный интервал ( — оо, 1(Х;)) лежит на от- рицательной полуоси, а нам известно (априорная информация), что величина О не может быть отрицательной. д) Литература Вагйо!отсе Р, Д "А сотраг!воп о1 соте Вауез!ап апв (геяиепнз( !и- 1егепсе", Выте(г!Ьа, 52, 19 — 35, (1965), В!гпЬашп А. "Оп йв (оипвацоп о1 в1апвцса! !п$егепсе (чгНЬ 6(зсизз(оп)", У, Атсг. 8(анз(, Атос., 67, 269 — 326, (1962). Вох Л. Е., Р!вьег И. А.
Тье 1Це о1 8с!слив(, айву, Мае Тоги, 1978. Ретрз(ег А. Р. "Оп а рагавох сопсегп(пн 1п$егепсе аЬои! а сочаггапсе та1г!х", Алла(з о1 Ма(Ь. 8(а(М(., 34, 1414 — 1418, (1963). Е$гоп Е. "Соп1гочегз!ез !и йе (оипвацопв о$ з(апзнсв", Тье Атедсал Ма(Л. Моей!у, 86, 231 — 246, (1978). Р!всьег И. А. "1пчегве ргоЬаЫ!И(ев", Ргос.
СатЬгыуе РЬИ. 8ос., 26, Быг— 535, (1930). РмЬег й. А. 8(ливиса! Мейоаз апг(8с!елй1(с !л1егелсе, Ончег апв Воуй Ьопаоп, 1956. заупвв Е. Т. "Соп1!Белее !и!егча!в чв Вауев!ап 1п1егча!в", 1и: Роилланолз о1 РгоЬаЬШ(у Тьеогу, 8(а(1зцса! (п1егепсе, але 8игизИса1 Тьеогмв о1 8М- елсез, евз. Ьу Нагрвг й(. 1.. апв Ноо!гвг С. Ал Р.
ИеЫв! Риы!вЫпк Со., Рогвгссйй Нонапг(, 1976. зеИгауз Н. Таеогу о1 РгоЬаЬИИу, С!агепвоп Ргвзв, Ох$огй 1967. Кепван М О, "И. А. Р!зсвег 1890 — 1962", В(оте(г!Ьз, 60, 1 — 16, (1963). Наутап Я. "Оп йе 1чго ЖИегеж азрес(в о$ гергеввп!аиче тейой ТЬе твйов о( в1га!И!еа вапгрнпн апг( йе те!Ьов о( ригров(че зе1есИоп", Ез(шйз- Иса, 17, 587 — 651, (!959).
НоЫпвоп О. К. "Боте соип1егехатр1ез 1о йе йеогу о1 соп(Ыепсе !п!ег- ча!з", В!отг(г!Ьа, 62, 155 — 162, (1975). 51е)п С. "Ап ехатр1е о( гг!Ве Шзсгерапсу Ьемзееп 1!Бис!а! апв соп(!Аепсе !и!егча!з", Алла1з о1 Ма(Ь. 8(а(м(., 30, 877 — 880, (1959). жопе М. "%голи !псопв!в!епсу $гогп ипИопп ргтгв", У. Атег. 8(а!Ы!. Аззос, 71, 114 — 118, (!976). 10. Парадокс проверки гипотез а) История парадокса Трудно сказать что-то определенное о том, когда предприиимались первые попытки проверять статистические гипотезы.
Б. Б. Гнеденно в своей книге отмечает, что учет населения, проведеииый в древнем Китае в 2238 г. до и. э., показал, что доля родившихся мальчиков составляла 50 %. Джон Арбутнот (1667 †17 гг.), английский математик, врач и писатель, был первым, кто (в 1710 г.) заметил, что гипотеза о равном соотношении родившихся мальчиков и девочек должна быть отвергнута, так как согласно демографическим данным за 82 года (доступиым в то время) мальчиков каждый год рождалось больше, чем девочек.
Если бы вероятяость рождения мальчика была равна 1/2, то итог за 82 года был бы настолько маловероятеи (1/2ы), что его можно было бы считать практически иевозможиым. Итак, Арбутиот был первым, кто отверг естественную статистическую гипотезу. Этот (иематематический) парадокс заиитересовал Лапласа. В 1784 г.
ои с удивлением обнаружил, что в нескольких различных районах доля родившихся мальчикав приблизительио равнялась 22/43, а в Париже это отношение было равно 25/49. Лаплас был заиитриговаи таким различием, ио вскоре нашел для него разумное объяснение: в общее число родившихся в Париже включались также все подкидыши, а иаселение из пригородов предпочитало подкидывать младенцев одного пола.
Когда Лаплас исключил подкидышей из общего числа родившихся, доля новорожденных мальчиков стала близкой к 22/43. В 1734 г. Французская академия присудила Даниилу Бернулли премию за исследование по орбитам планет. С помощью некоторого критерия проверки гипотез Вериулли пытался показать, что схожесть орбит планет является далеко ие случайной. Из правила правой руки ясно, что каждая орбита соответствует некоторой точке иа единичной сфере, и Бернулли проверял гипотезу о том, что распределение этих точек иа единичной сфере равномерно. В 1812 г. Лаплас исследовал похожую проблему.
Ои пытался применить статистические методы для решения вопроса о том, какую из гипотез следует принять: являются ли кометы обычными элементами Солнечной системы или оии всего лишь «иезваиые гости». В последнем случае углы между орбитами комет и эклиптикой были бы равномерно распределены иа интервале от 0 до н/2, что как раз совпадает с математической записью предположения Лапласа. (Ои обнаружил, что кометы не являются обычными элементами Солнечной системы.) Основоположниками современной теории проверки статистических гипотез были К.
Пирсон, Э. Пирсон, Р. Фишер и Е. Нейман. Предположим, что нужно проверить гипотезу о том, что распределение некоторой случайной величины равно Р. (В проблеме Лапласа распределение Р было равномерным на интервале (О, н/2).) Для решения этой проблемы «степени согласия» К. Пирсон, Х. Крамер, Р. фон Мизес, А. Н. Колмогоров, Н. В. Смирнов и другие ученые, работавшие позднее, предложили несколько различных критериев, и возникла необходимость сравнивать нх эффективности. Э, Пирсон и Е. Нейман сделали первые шаги на пути решения теоретических задач по нахождению лучших методов принятия решений.
Во-первых,они ввели понятие альтернативной гипотезы, которая, вообще говоря, не является полным отрицанием основной, нулевой гипотезы. Рассмотрим, например, случайную величину, имеющую нормальное распределение с единичной дисперсией и неизвестным математическим ожиданием. Если нулевая гипотеза состоит в том, что «математическое ожидание равно — 1», а альтернативная гипотеза заключается в том, что «математическое ожидание равно +1», то обе гипотезы, очевидно, не охватывают все возможные случаи. В 1933 г. Нейман и Пирсон показали, что для таких простых гипотез (когда как нулевая, так и альтернативная гипотезы, определяются по одному распределению) существует критерий, наиболее мощный в следующем смысле.
При использовании статистических критериев возможны ошибки двух типов. Можно отвергнуть нулевую гипотезу, когда она верна, и допустить тем самым ошибку 1-го рода (или ошибку первого типа). С другой стороны, можно принять нулевую гипотезу, когда она неверна, и допустить ошибку 2-го рода (или ошибку второго типа). Метод принятия решений (критерий), основанный на выборке данного объема, называется наиболее мощным критерием, если для любой заданной вероятности ошибки 1-го рода вероятность ошибки 2-го рода мала настолько, насколько это возможно. (При фиксированном объеме выборки сумма вероятностей ошибок обоих типов не может быть сделана как угодно малой.
Это своего рода принцип неопределенности при проверке гипотез.) Предположим для простоты, что оба распределения (в нулевой н альтернативной гипотезах) имеют плотности вероятности. Тогда по основной лемме Неймана — Пирсона существует наиболее мощный критерий следующего вида. Обозначим через )г и ~~ плотности вероятности выборки Х =(Х,, Хь ..., Х,) прн условии, что верна соответственно нулевая или альтернативная гипотеза.
Нулевая гипотеза принимается тогда и только тогда, когда — < с, где с — соответствующая постоянная. й (х) 1. (х) (Для простоты предполагается, что вероятность того, что 6(Х)/1о(Х) =с равна О.) Теория Неймана и Пирсона стала основной при проверке гипотез, не лишенной, однако, парадоксов. В 1950 г. Герберт Роббинс показал, что существует критерий, который в некотором смысле является более мощным, чем наиболее мощный критерий Неймана — Пирсона.
б) Парадокс Предположим, что случайная величина Х нормально распределена с математическим ожиданием 0 и дисперсией 1. Пусть нулевая гипотеза состоит в том, что 6 = — 1, а альтернативная гипотеза заключается в том, что 0 = +1. На основе выборки из одного элемента Х наиболее мощным критерием проверки нулевой гипотезы против альтернативной гипотезы является следующий: если Х ( О, то нулевая гипотеза принимается, а альтернативная отвергается; в противном случае нулевая гипотеза отвергается, а альтернативная принимается. В этом случае вероятность ошибок обоих видов составляет приблизительно 16 л6, так как Р(Х > 0)6= — 1) =Р(Х < О!0=+1) = = = ~ е <'+пч'с(к=0.1587...
0.16. 1 о Если воспользоваться этим критерием в У независимых случаях, то при больших М среднее число ошибочных решений приблизительно равно 0.16 У. Поскольку в каждом случае использовался наиболее мощный критерий, следовало бы ожидать, что среднее число ошибочных решений никогда не может быть меньше, чем 0.16М. Как ни парадоксально, но следующий метод Роббинса показывает, что это не так. Пусть Х вЂ” арифметическое среднее наблюдений Хь Хь ...
..., Хл. Критерий Роббинса состоит в следующем: если Х ( — 1, то 6! = — 1 для всех ! = 1, 2, ..., М, если Х ) +1, то О! =+1 для всех ! = 1, 2, ..., У, и, наконец„ если — 1( Х(+1, то О!= — 1 или О! =+1, в зависимости от того, выполнено неравенство 1 ! — Х Х,( — 1п= 2 1+Х или нет. Этот метод удивителен тем, что он объединяет независимые друг от друга задачи. Если истинное отношение тех Оь для которых О, =+1, к тем Ог, для которых Ог = — 1, равно 0 или 1, то при больших А! (например, для 37=100) критерий Роббинса дает ответ со 100 !7с надежностью; для отношения 0.1 или 0.9 вероятность ошибки (обоих типов) составляет 7 з(т; для отношения 0.2 или 0.8 вероятность неверного решения равна 11%; для отношения 0.3 или 0.7 она составляет 14 о и даже для отношения 0.4 или 0.6 процент ошибок меньше 16 % уровня наиболее мощного критерия.
Метод Роббинса становится менее эффективным, чем наиболее мощный критерий, лишь в случае отношения, близкого к 0.6. в) Объяснение парадокса Парадокс Гоббинса показывает, что даже тогда, когда нужно принять решение о приеме нли отказе от продукции, поступающей с различных независимо работающих фабрик, общее число ошибочных решений будет в среднем меньше, если мы не будем принимать решения независимо одно от другого. Поскольку это по существу та же проблема, что и парадокс Стейна о допустимых оценках для математического ожидания, здесь мы лишь предложим посмотреть объяснение в равд. 2 и фундаментальную статью Гоббинса.