Б.В. Гнеденко - Курс теории вероятностей (1119912), страница 59
Текст из файла (страница 59)
Понятно, что чем меньше для данной критической области числа а~ и аз, тем удачнее выбрана критическая область. Однако при данном числе испытаний и невозможно ни при каком выборе критической области одновременно сделать как угодно малыми оба числа а~ и аз. В то же время изменением критической области мы можем добиться произвольной малости ошибок первого и второго рода в отдельности. Так, если положить В„з = В„, то ясно, что в этом случае аз = О; если же положить В„1 — — В„, то а~ = О. Отсюда вытекает следующий рациональный принцип выбора критической области: при заданных значениях а~ и и нужно выбирать ту область В„з, для которой аз достигает минимума.
При этом, конечно, чем меньшее значение а~ мы выбираем, тем большее значение получается для минимума аг. Заранее нельзя сказать, какое а~ нужно выбрать, чтобы метод проверки гипотезы был самым выгодным, так как основную роль при этом играет практическая сторона дела. Пусть для примера отбрасывание или прием гипотезы Н~ связаны с материальными затратами.
Если прием гипотезы Ню в то время как она неверна, приводит к большим затратам (скажем, к необходимости ручной подгонки некоторых деталей, поступающих для сборки на некоторое предприятия), тогда как отбрасывание гипотезы Ны в то время как она верна, приводит к сравнительно небольшим потерям, то ясно, что необходимо выбрать возможно меньшее аз и при этом можно помириться со сравнительно большими значениями аю Предположим, что практические соображения приняты в расчет и величина а~ выбрана; тогда имеет место следующее предложение, которое мы сформулируем лишь для того случая, когда величина С имеет конечную плотность распределения вероятностей как при гипотезе Ню так и при гипотезе Нп Теорема.
Среди всевозможных критических областей, для которых вероятность ошибок первого рода равна аш вероятность ошибок второго рода принимает наименьшее значение для критической облаппи В*„з, состоящем из всех тех точек (хп хз,..., хя), для которых я и П У(хь~Нз) ) с П У(хь~Н~) з>. ь=1 ь=! Число с определяется из условия уз(с) = Р((хихз ".,х„) б Вд(Н,) = ам Я Таким обряюм, Д,'а является ививыгадяейюсй критической областью.
б 64. Проверка статистических гипотез 355 Доказательство. Так как (в случае независимых испытаний) вероятность точке (х!, хг,..., х„) находиться в какой-нибудь области Я равна при условии, что верна гипотеза Н! и к Р(В~Н,)=~...~ПУ((~Н,)а*,а*,... И*„ к=! при условии, что верна гипотеза Н,, то согласно предположению, Р(В„',г)Н!) = а! и для любой другой рассматриваемой нами области В„г также Р(В„г! Н<) = о . Согласно аксиоме сложения вероятностей Р(В. -В. В.'г~Н!) = Р(В.г~Н!)-Р(В. В*.г~Н!) =. -Р(В:В.'4Н!) и Р(В!а ВкгВчг!Н!) = о! Р(Вага!!Н1) т, е. Р(В„, — В.'гВ„г! Н ) = Р(В'.г — В В~Ф ) Согласно определению В„', и последнему равенству Р(Вчг ВчгВчгфг) ~>сР(Вкг ВчгВвг ~Н! ) = ср(Вкг ВчгВиг )Н! ) (4) Но для любой точки (х!, хг,..., х„), не приналлежацгей В;а, л к П У(хк!Нг) < оп У(хк!Н!) к=! к=! и, следовательно, поскольку область В„г — В„аВ;, находится целиком вне В„*г, должно быть сР(Ва — ВаВа(Н!) > Р(Ва — В гВ,",г(Нг).
Это неравенство вместе с (4) приводит нас к неравенству Р(Вяг ВчгВяг~Нг) > Р(Вчг ВкгВяг)Нг) ° 356 Глава 11. Элементы статистики Прибавив к обеим частям последнего неравенства Р(я,зя*„21Н2), находим, что Р1яч21Н2) > Р(Вв21Н2). А так как РкЯ 1Н2) ! и я ! В я 2 В ! я В 2 то Р(Я,',! )Н2) < Р(Я„! 1Н2).
Так как Р(В !)Н2) и Р(я„"!(Н2) прелставляют собой ошибки второго рода лля критических областей Я„2 и соответственно Я„",, то теорема доказана. Нам остается подтвердить, что выбор постоянной с действительно можно произвести по правилу (3). С этой целью заметим, что функция Ф() =РЖ!Н) с ростом с может только убывать (так как неравенству (2) будет удовлетворять все более и более «тощее» множество точек (х!, х2,..., х„)). Кроме того, ясно, что у1(0) = 1, так как для каждой точки (х„х2,..., х„) к ПУ(хкФ2) >О. к=! Далее из (2) следует, что Р(я„"2~Н2) > сР(В"2~Н!).
заменив левую часть неравенства единицей и вспомнив определение кр(с), находим неравенство 1 > с1Р(с). Итак 1 0 < 21!(с) < —. с Таким образом, 1Р(с) -+ 0 при с -к со. Так как функция 1Р(с) не возрастает, то при любом а! (О < а! < 1) найдется такое с, что 1р(с — 0) > а! > 2р(с+ 0). Если в точке с функция 1Р(с) непрерывна, то выбор постоянной с согласно правилу (3) оправдан; если же в точке с функция у2(с) имеет разрыв, то положение несколько усложняется и требуется незначительно изменить определение множества Я'„2, исключив из него часть точек (х! хт ", х,), для которых и и П Ихк!!Н2) = с П 2 (хк'!Н!), к=! 0 04.
Проверке ствтистическик гипотез Збу и присоелинив их к множеству Н„',, так чтобы вероятность ошибок первого рода была равна ап Рассмотрим пример. Пусть известно, что С распределено нормально с известной дисперсией ез. Относительно математического ожидания а имеются две гипотезы, состоящие в том, что а = а ~ (гипотеза Н1 ) и а = аз (гипотеза Нз). Требуется найти выгоднейшую критическую область. В нашем примере соотношение (2) может быть записано в следующем виде: Это неравенство, как легко подсчитать, эквивалентно следующему (в предположении, что аз > а~): ез!и с и х«> — + -(а~+аз) «=~ аз — а~ 2 или, что то же самое, неравенству 1 е!пс з/й — ~~) (х« — а,) > + — (аз — а~) = йп аз/и, (аз — а~)з/й 2»г Полученное неравенство определяет выгоднейшую критическую область Я*„,.
Так как величина 1 — ~~>, (х» — а~) ««н распределена нормально с математическим ожиданием 0 и дисперсией 1, если только гипотеза Н~ имеет место, то по таблицам нормального распределения и заданному а~ легко определить й1 (и тем самым с). Пусть для определенности а~ = 0,05. Тогда й~ — — 1,645 и, следовательно, наивыгоднейшая критическая область при а1 — — 0,05 определяется неравенством л ~~> (х» — а,) > 1,645 ез/й. «ьн Интересно отметить, что критическая область в нашем примере не зависит от конкурирующего значения аз. Область Нл ! определяется неравенством ез!пс и х» < +-(аз+а,), ««и аз — а~ 2 которое, очевидно, может быть записано в таком виле: 1 т-~ з/й — (х» — аз) < й~ — — (аз — а~).
ез/й „ е 350 Глава 11. Элементы статистики Величина, стоящая в левой части неравенства, в предположении, что имеет место гипотеза Нг, распределена нормально с математическим ожиданием 0 и дисперсией 1. Отсюда следует, что вероятность ошибки второго рода равна М-(~/в/к)(м-и ) зУй ') 1 Г ( л') Ф й~ — — (аг — о~)) = — ~ ехр~ — — уел. о ) зУ2я l ( 2 ) Если заданы величины а~ и аг, то возникает задача определения минимального числа и = п(ам аз) необходимых испытаний для того, чтобы ошибочные заключения могли быть сделаны с вероятностями, не большими, чем а~ и аг. С ростом и величина аг„= аг(ан н) не возрастает и, вообще говоря, стремится к нулю.
Очевидно, что п(ан аг) есть наименьшее из тех и, для которых аг(а„п) < аг. В только что рассмотренном примере число и по заданным значениям а ~ н аг найти очень просто. В самом деле, из того, что 1 — Ф(й~) = а~ ,Я Ф Й~ — — (аг — а~) = аг, мы получаем два уравнения: Й~ —— (л(1 — а~) з/й й, — — (ог — а~) = (к(аг), е где ф — функция, обратная для Ф(х). Отсюда ,М вЂ”.)-и )1 (аг о,)г Приведем небольшой числовой пример.
Пусть а~ = 135, аг = 150, е = 25, а~ = 0,01, аг = 0,03. Поскольку ф(0,99) = 2,33, ф(0,03) = - 1,88, то и = — [2,33+ 1,88] = — ° 4,21 49. г 15г ' ' 9 б 64. Проверка статистических гипотез 359 Таким образом, минимальное число наблюдений, которое необходимо провести лля выбора между гипотезами Н, и Нз в случае нормального распределения и только что указанных данных, должно быть 49.
Только при таком числе испытаний мы можем быть уверены в том, что если верна гипотеза Ны то мы отбросить ее можем с вероятностью„не большей одной сотой, а если верна гипотеза Нз, то ее отбросить мы можем с вероятностью, не превосходящей 0,03. Дополнение 1 Определение математического ожидания в аксиоматике Колмогорова Настоящее дополнение не предназначено для первоначального чтения, так как оно предъявляет повышенные требования к знаниям читателя в области теории интегрирования. Общая концепция, излагаемая здесь, является естественным развитием построения понятий случайного события, вероятности, случайной величины, данных А.
Н. Колмогоровым. В этой концепции понятие математического ожидания, естественно, сводится к абстрактному интегралу Лебега. По определению, математическое ожидание случайной величины С = у(е) есть интеграл МС = / 1(е)Р(4е). Условное математическое ожидание при условии В равно м(6в) = / Юров). Легко доказать, что это определение эквивалентно следующему: М(6В) = У(е)Р(г(е) —, 1 Р(В) ' в которое часто лучше приспособлено для практического использования. Заметим, что если событие В представимо в виде суммы конечного или счетного множества непересекающихся событий Вь.
в=в,+в,+... то / йе)РИе) =~~ / йе)РИе). в с Полезно заметить, что если раньше лля доказательства теоремы о математическом ожндании суммы нам пришлось провести довольно длинные рассуждения, то теперь эта теорема является следствием формулы / (~ + у) Р(де) = / Р(г(е) + / дР(йе). Математическое ожиданно в аксиоматике Колмогорова 361 Для независимых случайных величин С и «мы раньше доказали формулу М(б «) =Мб М« (1) лишь в случае дискретных и в случае непрерывных случайных величин. В общем случае определим дискретные случайные величины с„и «„ формулами т т+1 при — <с < й й !с !г+ 1 при — < «< —.
й й Тогда М(6 «я) =Щи М«л. Из известных теорем о переходе к пределу под знаком интеграла Лебега легко выводим: !пп МСч = МС, 1пп М«„= М«, 1пп М((„«„) = М(С ° «). Таким образом, формула (!) доказана в общем случае. Полученные сведения мы применим к выводу формулы, обобщающей результат б 25 (следствие 2 к теореме 2). Эта формула будет получена нами из следующей теоремы, доказанной А. Н. Колмогоровым и Ю. В. Прохоровым. Пусть дана последовательность случайных величин С! ъз ( и Ьк=С!+Сз+" +6 означает сумму и первых величин, причем само число слагаемых и является случайной величиной.
Обозначив через Я„, событие, состоящее в том, что и = гп, положим р =р(я ), Р.=р(и>й)=у р . м=я Теорема. Если яри й > т случаиная величина С„и событие Ят независимы, существуют математические ожидания а„= МС„ (и, значит, величины с„= М!С„( конечны), ряд ,'; „Р„ ч=! сходится, то математическое ожидание величины ~„существует и равно М~к = ~~' рпдл. ч=! Дополнение 2 Лемма Бореля — Кантелли и ее применение Пусть имеется последовательность событий А!, Аз,....