Б.А. Севастьянов - Курс теории вероятностей и математической статистики (1119910), страница 27
Текст из файла (страница 27)
где элементарные события «й =(/г, /), 1 (йФ. ! Ф/(й/, и элементарные вероятности р(«й)= Случайные величины хг, х/ определим равенствами х!(/г, 1)=ХМ х/(/г, /) =-Х!. Тогда Мх = — ~~ Х, = Х, 0х, = — ~~ (Х» — Х)' = бй й-! й-! н при /че/ Сот(х„х;)= й/(и !) ~~ (Х» — Х)(Х! — Х)= »Ф! [ — г «х,— х! «-[г.'«х,— х«]]- — — ' й-! й-1 7 Б. А. Севаехьаиов пронедурой лгобое число раз (например, результаты пз. мерсннй, размер деталей при массовом их изготовлении и т.д.). В дальнейшем мы будем в основном заниматься не.
зависимыми выборками. Относительно бесповторпой выоорки докажем лишь следующую теорему. Обозначим и н Х= Ч ХХ„Вг= у Х(Х1 — Х)' 1 134 Гл. !3. статистические дАнные Подставляя полученные значения в (6), получаем фор« мулы (5). Замечание. !тля выборки с возвращением дисперсия х равна 5Цп. По неравенству Чебышева при Р гьг ) и-» оо мы получим х — Х как в случае выборки с возвращением, так и в случае выборки без возвращения. Задачл 1.
Иа конечной генеральной совокупности (Хп Х, . „ Хп) берутся последовательно дпс беспоаторныс выборки (хп ..., х„ ) „ (р!, ..., Еа,), и, + пз(!У. Найти ковариаци!о и коэффициент коррел, и 1ч 1ч~ лицин между средними Х = — ~ х н у — ~ р . и х ! ! ! 2. Найти математическое ожидааие Ма' выборочной дисперсии а' = — ~ (х — х)ь где х= — хт х, для бесповторной выборки ! ! !-! хп ..., х„иа конечной генеральной совокупности (Хп Х„, ..., Хм). 3. Найти математическое ожидание Ма' выборо(мой дисперсии 2 — ! ат = — ~ гх — х)а, если х, ..., х — независимая выборка иа г=! распрсделевпя с дисперсией Ох = о'.
4. Вычислить Мх<а! и Ох1, если вариациопиый ряд хгп~~х!е!<~... .. (~я !в! получен иа независимой выборки хи ..., х с равномерч пым распределением в (О, а). Г л а в а 14. СТАТИСТИЧЕСКИЕ КРИТЕРИИ 5 52, Статистические гипотезы Пусть случайная величина $ или случайный вектор в'=(вь ., я,) имеет плотность р(х;О), зависящую от параметра О, одномерного нли многомерного, принимающего значения из некоторого множества 6. В частности, если р(х; 0) — одномерная плотность и независимая выборка х„хе... х„ получена из распределения с этой плотностью, то и-мерная плотность, соответствуюшая выборке (1), равна. произведению л р(х„..., х„; 0) =Ц р(хл, О).
г ! Хотя мы будем далее говорить о р(х; О) как о плот. ности, все сказанное с очевиднымн видоизменениями будет применимо н к дискретным случайным величинам с законом распределечня р (х; О) = Р (ч = х), где х принимает счетное нли конечное число значений. Значение параметра 0 вполне определяет плотность р(х; О).
Тс нлн иные предположения о значениях параметра О мы буден называть ститистичеснилш гипоге лажи. Статистическая гипотеза называется простой„ если она состоит в том, что 0 = Ом где Ое — некоторое риксированное знзчспне. Если жс наше предположение закспочается в том, что О е:— . Ом где Ое — подмножество зшожества параметров 6, состояшее более чем из одной точки, то мы говорим о сложной еипотезе. Рассмо~- рнм примеры.
м — и' 1 Пример !. Пусть р(х;а, о)= е "'* — плотч/зя о ность нормального распределения, зависящая от дву- 196 ГЛ. 14. СТАТИСТИЧЕСКИЕ КРИТЕРИИ мерного параметра (а„п). Гипотеза (п, о) = (О, 1) является простой, а гипотеза а = аь где а, фиксировано, — сложной.
Пример 2. Пусть р(х; 0)=С,'О (1 — 0) — "еро" ятность х успехов в схеме Бернулли с я независимыми испытаниями. Примером простой гипотезы слугкггт О = =1/2, а примером сложной — 0) 1/2. Задача проверки статистических гипотез ставится следующим образом. Известно, что выборка (1) получена из распределения, имеющего плотность вида р(х; 0). Относительно параметра 0 имеется некоторая основная, илн проверяемая, гипотеза Н,: О ен сге.
Мы должны построить такой статистический крнтерпй, который позволяет нам заключить, согласуется ли выборка (1) с гипотезой Нв нлп нет. Обычно критерий строится с помощью критического множества. Из множествами всех возможных значений х =(хь ..., х ) выборки (1) выделяется такое подмножество 5, называемое критическим, что прн х ~ 5 гипотеза Нв отвергается, а в остальных случаях опа принимается. Критическое множество 5 выбирается таким, чтобы вероятность Рв(5) = = ~ р(х; 0)4(х выборке х попасть в 5 при гипотезе Нв была мала. Получаемый с помощью критического мно.
жества 5 статистический критерий называют иногда 5-критерием. Естественно, что множество 5, удовлетворяющее этому требованию, можно выбрать многимнспособами. Более определенный выбор возникает в том случае, когда нам задана конкурирующая, нлн альтернативная, гипотеза Ни О пе сгь Мы будем рассматривать главным образом случай двух простых гнпотеи проверяемой гипотезы Н;г рв(х) = р(х; 04) и конкурирующей гипотезы Н,: рг (х) = р(х; 04), Есть задачи, в которых гипотезы Н, н Н, равноправны. Так обстоит дело прн разбиении множества каких-либо объектов на два вида по значениям определенных параметров. Однако очень часто в реальных задачах гипотезы Нв н Н, выступают неравноправно.
Например, размер годной детали, изготавливаемой на заводе, есть случайная величина, имеющая нормальное распределение с парамеграми (ао, ав), Предположим, что дефектнаядетальнмеет $53. УРОВВНЪ ЗНАЧИМОСТИ И МОЩНОСТЬ КРИТЕРИЯ !97 соответствующий размер также нормально распределен ным, но уже с параметрами (а, оо), где а чь ао. Технический контроль, на который поступают изготовленные детали, исходит из того, что детали должны быть годными, и поэтому проверяет гипотезу Но, т.
е. их годность. В этом случае Но — основная гипотеза, и на конт. роле надо уловить те детали, которые изготовлены в условиях конкурирующей гипотезы Н,. 0 33. Уровень значимости и мощность критерия Рассмотрим две простые гипотезы: проверяемую Но. 8 = Оо, и конкурирующую Н~. О = Оп С каждым 5.кри. терием связаны ошибки двух родов. Ошибка первого рода — отвержение гипотезы Но, когда она верна; прн. пимая гипотезу Но в случае, когда верна конкурирую. шая гипотеза Нь мы делаем ошибку второго рода. Обо.
значим Р~(В)= ~ р(х; О;)ах, 1=0, 1. (1) и Тогда вероятность ошибки первого рода 5-критерия равна а = Ро(5) (2) а вероятность ошибки второго рода равна О=Р,(5), (3) где 5 = Х"~5. Иногда мы кратко вероятности ошибок первого и второго родов будем называть просто ошиб. ками первого и второго рода. Задача построения 5-критерия для проверки простой гипотезы Н, при конкурирующей гипотезе Н, ста« вится следующим образом. Вероятность ошибки первого рода а называется уровнем значимости 5-критерия.
Функцией мощности 1Р'= 1Р'(5; 8) 5-критерия называется следующая функция от О: В' (5; 8) = ~ р (х; О) дх, (4) т. е, вероятность отвергнуть гипотезу Но, когда истинное значение параметра равно О. Как видно из (2), (,1) Гл. !4. статистические кРитеРии 1ВВ а=1)г(5;6), 1 — р=й7(5;6). Итак, сначала задается уровень значимости а и рассматривается множество У„всех 5-критериев с уровнем значимости»». Средн этих критериев выбирается критерий 5', для которого мощность при 0 = 0~ принимает наибольшее значение, т.
с. йг(5*;6»)=а, йг(5',6,)= шах 07(5;6~). (5) з ~ 'т» Критерий 5', удовлетворя|оппзй условиям (5), называется оптимальным, плп наиболее мои!ным, критерием. Оптимальный критериИ, удовлетворяющий (5),не всегда существует, поэтому нам удобно будет обобщить понятие статистического критерия. Для этого опишем 5-критсрий с помощью функции 6(х), определенной следующим образом: 1, если хее 5, ф(х) = О, если хФ5.
(6) Мы можем истолковывать ~р(х) как вероятность от. вергнуть гипотезу Н», когда выборка прнобрстает значение х. Критерии, описываемые функцией вида (6), называются нериндонизироаанныти. Введем понятие рандожизироаанного критерия (от англ. гапдош — случайный). Пусть задана функция »р(х), такая, что 0( ( ~р(х) ( 1 дли всех х. Мы предполагаем, что с каждым значением выборки х связывается некий случайный эксперимент (рандолизичин) с двумя исходами 1 и О, причем вероятность 1 равна <р(х), а вероятность 0 равна 1 — ~Р(х).
В зависимости от исхода этой рандомизацни действует и наш рандомизпрованный критерий. Если выпала 1, то Н, отвергается; если выпал О, то Н» принимается. Функшпо мощности этого критерия, который можно назвать Ф-критерием, обозначим (Р'(~р, 0). Она равна )1г(ф, 0)= ~ ф(х) р(х; 0)дх= М»~р($), где М» означает математическое ожидание по распределению р(х; 0), а в — случайная величина, плотность и (4), вероятности ошибок первого и второго рода следующим образом выражаются через функцию мощности: э 54.
ОптимАлы!ьги кРитеРип ислмАИА — пиРсОнА гэф которой равна р(х; 8). Уровень значимости гр-критерии равен а = — Ят (гр; 8о) = Ме,ф ($), а вероятность ошибки второго рода равна (" Аф Ог) ! Ме,ф(о) Рассмотрим множество Уо всех гр-критериев с фнк. сированным уровнем значимости а. Мы будем называть ф*-критерий оптимальным, или наибо,!ее мощным, если В'(ф'! 8о) = а, йк (ф"; 8,) = !пах Ят (ф; 8,), (7) 'то Задача (7) всегда допускает решение. $54. Оптимальный критерий Неймана — Пирсона Обозначим ро(х)=р(х;8„), р,(х)=р(х;8,), М,гр =~)ф(х)ро(х) "х Мгф=~ ф(х) рг(х)дх. Оптимальный кри- терий (7) можно искать среди критериев, которые опре- деляются отногиением правдоподобия Р!(х)/Ро(х).
Теорема 1. (Теорема Неймана — Пирсона.) Д.гя любого Оог,а ..1 существуют такие числа с О и О ~ а 1, что гр'-критерий с функцией 1, если р,(х) ) ср,(х), гр" (х) = е, если р, (х) = сро(х), О, если р,(х) ( сро(х), определяет оптимальньгй критерий с уровнем зна щ- мости а, удовлетворяющий (7). Доказательство. Пусть О ( а - 1. Случаи а = О и а = 1 проверяются отдельно, н мы не будем здесь этим заниматься.