Полезная книга (543702), страница 25
Текст из файла (страница 25)
СТАТИСТИЧЕСКИЕ КРИТЕРИИ 196 мерного параметра (и, о). Гипотеза (а, о) =(О, 1) является простой, а гипотеза а = ам где а, фиксировано, — сложной. П р и м е р 2. Пусть р(х; О) = С„О' (1 — О) — вероятность х успехов в схеме Бернулли с и независимыми испытаниями. Примером простой гипотезы служит 0 ==. =1/2, а примером сложной — 0 1/2.
Задача проверки статистических гипотез ставит я следующим образом. Известно, что выборка (!) пол)- чена из распределения, имеющего плотность вида р(х; 0). Относительно параметра 0 имеется некоторая основная, или проверяемая, гипотеза НР. .Ое:-йм Мы должны построить такой статистический критерий, который позволяет нам заключить, согласустся ли выборка (1) с гипотезой На или нет. Обычно критерий строится с помощью критического множества. Из множества Х всех возможных значений х=(хь ..., х,) выборки (!) выделяется такое подмножество 5„наэьщаемое критическим, что при хен 5 гипотеза Нв отвергается„а в остальных случаях она принимается, Критическое множество 5 выбирается таким, чтобы вероятность Р„(5) = = ~ р(х; 0)Нх выборке х попасть в 5 при гипотезе Н, была мала.
Получаемый с помощью критического мяо. жества 5 статистический критерий называют ино|дз 5-критеривхн Естественно, что множество 5, удовлетворяющее этому требованию, можно выбрать мпопемнспо. собамн. Более определенный выбор возникает в том случае, когда нам задана коннурируоп!ал, или альтврнативная, гипотеза Н,: 0 ен еь в1ы будем рассматривать главным образом случай двух простых гнпотем проверяемой гипотезы НР. ра(х) = р(х; Оа) и конкурирующей гипотезы Н1.
р1 (х) = р(х; О,). Есть задачи, в которых гипотезы Н, и Н, равноправны. Так обстоит дело при разбиении множества каких-либо объектов на два вида по значениям определенных параметров. Однако очень часто в реальных задачах гипотезы НР и Н, выступают неравноправно. Например, размер годной детали, изготавливаемой на заводе, есть случайная величина, имеющая нормальное распределение с параме~- рами (ав, оа), Предположим, что дефектная деталь имеет соответствующий размер также нормально распределен. ным, но уже с параметрами (а, ОА), где а чь иа, Технический контроль, на который поступают изготовленные детали, исходит из того, что детали должны быть годными, и поэтому проверяет гипотезу Нм т, е.
их годность. В этом случае НР— основная гипотеза, и на конт. роле надо уловить те детали, которые изготовлены в ус. ловиях конкурирующей гипотезы Нь й 53. Уровень значимости и мощность критерия Рассмотрим две простые гипотезы: проверяемую На.- 8 = Ом и конкурирующую НМ 0 = О,. С каждым 5-критерием связаны ошибки двух родов. Ошибка первого рода — отвержение гипотезы Нм когда она верна; принимая гипотезу На в случае, когда верна конкурирующая гипотеза Нь мы делаем ошибку второго рода. Обо. значим Р;(В)= ~ р(х;0~)г(х, 1=0,!. (1) в Тогда вероятность ошибки первого рода 5-критерия ранна а = Р„(5), (2) а вероятность ошибки второго рода равна 0 = Р, (5), (3) где 5 = — Х'~,5.
Иногда мы кратко вероятности ошибок первого и второго родов будем называть просто ошибками первого и второго рода, Задача построения 5-критерия для проверки про. стой гипотезы Нв при конкурирующей гипотезе Н, ставится следующим образом. Вероятность ошибки первого рода я называется уровнем значимости 5-критерия. Функцией мощности !У = !У(5; 8) 5-критсрия называется следующая функция от 0: В'(5;О)= ~ Р(х;0)(х, (4) т, е. вероятность отвергнуть гипотезу Нм когда истинное значение параметра равно О. Как видно нз (2), ('1) гл. !«, стьтистичвскив !«в!1!внии % я. ОптимАльныл квитвиин напил!!А — иичсо!!А «эв !98 и (4), вероятности ошибок первого и второго рода следующим образом выражаются через функцию мощности: а=%'(5; О(,. 1 — р= Ж'(5; О). Итак, сначала задается уровень значимости а и рассматривается множество й'„всех 5-критернев с уровнем значимости а.
Среди этих критериев выбирается критерий 5", для которого мощность при 0 = О, принимает паиболшпсе зпа !ение, т. е. !Г(5"; 0„):=а, 1Г(5'; О,)= гпах Ф'(5; О!). (О) Критерий 5*, удовлетворя!ощий "словпям (О), назь«- вается оптимальным, ичи наиболее л!ощиым, критерием. Оптимальный критерии, удовлетворя!ошнй (5), не нсегдз существует, поэтому нам удобно будет обобщить понятие статистического критерия. Для этого опишсм 5-критерий с помощь!о функции г!!(х), определенной следующим образом: 1, если х~5, ф(т) = О, если хч 5.
(0) Ф' (ф, О) = ~ «р (х) р (х; О) йх = Моф Я), глс М, означает математическое ожидание по распр«- делению р(х; О), а с — случайная величина, плотность Ыы можем истолковывать ф(х) как вероятность отвергнуть гипотезу 7!о, когда выборка приобретает значение х. Критерии, описываемые функцией вида (0), называ«отея нериидоххизироиииными.
Введем понятие раидомизированного критерия (от англ. Тап«!оп! — случа!1- пый). Пусть зздапа функция «р(х), токая, что О.с,' -- ф(х) ~ 1 для всех х. Мы предполагаем, что с кандым значением выборка х связывается некий случайный эксперимент (раи«)о,чизииия) с двумя исходами 1 н О, причем вероятность 1 равна «р(х), а вероятность О рави! 1 — ф(х). В зависимости от исхода этой рандомизации действует н паш рандомизированный критерий. Если выпала 1, то )уо отвергается; если выпал О, то !!о принимается. Функцию мощности этого критерия, который можно назвать ф-критериех«, обозначим Ж'(ф, О).
Оиа равна которой равна р(х; 0). Уровень значимости ф-критерия равен а = (т' (ф; Оо) = Мо.ф 6), а вероятность ошибки второго рода равна 0=1 — !У'(ф'0,) =1 — М„«р(з). Рассмотрим множество й„всех ф-критериев с фиксированным уровнем значимости а.
Мы будем называть «р"-критерий оптинальиьт, или наиболее мощным, если йх(ф*;Оо)=а, 1!!'(ф";О)= гпах %" (ф16,). (7) "а Задача (7) всегда допускает решение. $ 04. Оптимальный критерий Неймана — Пирсона Обозначим ро(х) = р(х; О,), р, (х) = р(х; О,), Мо«р = =$ ф(х) ро(х) а«х, М!ф=~ ф(х) р, (х) дх. Оптимальный кри- терий (7) можно искать среди критериев, которые опре- деляются относиеиием правдоподобия р,(х)/ро(х).
Те о р ем а 1. (Теорема 1-!еймана — Пирсона.) !7ля любого О «а 1 существу!от такие числа с =» О и О ~ з ~ 1, что ф'-критерий с функцией 1, если р,(х) > сро(х), «р*(х) = з, если .р, (х) = ср,(х), (О) О, если р,(х) < сро(х), определяет оптил!альный кри!ерий с уровнем зии и- мости и, удовлетворяющий !7). Доказательство. Пусть О ( а ( 1. Случаи а = О и а = 1 проверяются отдельно, н мы нс будем здесь этим заничшться. Рассмотрим функцию от с а (с) = Р (р! (Ы > сро (-') ! 77о) в предполох«епии, что верна гипотеза 77о, Функппя 1 — ~(.)=Р~ — ",';"', ~.!О,~ есть функция распределения случайной величины Р«($)!РАД)л поэтомУ она непРеРывна спРава и й«(оо)=, ГЛ.И.
СТЛТИСТИЧГСКНБ'КГИТСРИИ 2СО З сс. ОптимАльныв КгитьРии =- О, д(0 — ) = 1. Определим с,„нз условия' ]Г(с„) ~а < д(с — 0). Если д(са) < ]г(са — О), то выбираем и — я (с„] и (с„ — О] — я (с„] ' Если д(си) = д(с — 0), то полагаем ги = О. В случае, когда д(с) = — а для целого отрезка с! «- с сь прини- маем за с„любую точку этого отрезка, например, са- му]о левую. Полагая с и е в (8) раиными найденньп! с„н е, строим функцию ]р'. Докажем, что полученныч ср*-критерий имеет уровень значимости а и обладает свойством оптимальности (7), Докажем сначала, что уровень значимости ср*-критерия равен сс.
Имеем Мс р' = ~ ]зс (х) с(х+ Р1 (х),рс Рс(х] и — с (са) и (с„— 01 — с (са) р, (х]=сара(х] и — л (с„) — д(са) + ( е] ° ' (д (с 0) д (са)) — и Пусть ч] — л]обой другой критерий с М,!!р=-.а. Покажем, что тогда М]]ра> М]]р.
Рассмотрим интеграл $ (Ч ' (х) — ]( (х)) (р! ( ) — с,„с (х)) ]х. (О) Разобьем его на два слагаемых (]р' — ]р)(р! — С„рс) дх+ ~ (]р' — ]р) (р,— сирс) с(х. (1О), Ф )Ф э'<Ф В первом слагаемом интегрирование производится по точкам х, для которых жа(х) ~ с]](х) = О, поэтому в этом интеграле р](х) ~ с„р,(х), т. е. подынтегральная функция неотрнцательна. Аналогично, во втором интег- рале (10) ф'(х) ( ср(х) ~ 1, поэтому р! (х) ~ с„рс(х), и подынтегральная функция также неотрицательна.
ОГ- сюда заключаем, что интеграл (9) неотр]гцателеп, т, с. 1 *- (!р* — ср) р, с(х ) с ~(<р — ф)рис(х, или М]]р' — М]]р ~ еа (а Мо](]) ~: О, что и требовалось доказать. Замечание. Теорема справедлива и для дискретных распределений ра(х) и р](х). В доказательстве в этом случае надо везде интегралы заменять суымамн. ф и 55. Оптимальные критерии для проверки гипотез . „: о параметрах нормального и биномиального распределений Пусть (1) есть независимая выборка из нормального распределеяня с параметрами (п,о). Пусть о известно, а относительно и имеются две гипотезы: гипотеза Н,: л=а,, гипотеза Н,: ас п]>ас. Т1остронм оптимальный крптерий Неймана — Пирсона.
В этом случае а - —., '~~ (х]-а!)х р;(Х)=,„, аЕ 1=0, 1, (2!с)" и" — =екр) пх(а! — ас) — —,. (а];-е,') ~, (11) где х — выборочное среднее. Из (11) следует, что об. ласть значений х, для которых р](х)/рс(х) ~ С, определяется неравснством х С! Прн некотором С!. Как известно, среднее Х распределено нормально с парамеги рами (а, =). Определим теперь ошибки первого и второго рода: а1 Р(- С (Нс) 1 ~ - з ('С! — ас ~Д т/Ы (1 ) С,-а, 1]а ср й=Р(х~~С](Н!)== 1 е ' с(И=Ф( ' а'трсп). 2и д е ' / (13) ГЛ. И.
СТЛТИСТИЧЕСКИЕ КРИТЕРИИ Ю4 $ ло. кРитсРии для провеРки сложных гиптттез яое и необходимый объем выборки Р. Тй-М-'- тиТГ= 17' (ри р~)3 й 56. Критерии для проверки сложных гипотез 0 аи На примерах выборок из нормального распределения разберем те задачи, которые возникают при проверке сложных гипотез. Пример 3. Пусть независимая выборка (1) взята из нормального распределения с параметрами (а, а), причем о известно. чг(а) Рассмотрим простую проверяемую гипотезу Но а = ао н одностороннюю сложную конкурирующую гипотезу а Н11 а» ао. Деиствун так же, как в $55 прн различении двух проРнс.
14. ФУнкенннощностн)Р ОО "Р"" етых гипотез, находим, а теряя х > ас + аа =. что критерий х Ст = =по+ ааа/ т'а будет иметь уровень значимости я и будет нанболсе мощным для любой простой гипотезы а1 -» ао, Функция мощности этого критерия УР'(а) будет иметь график, изображенный на рис. 14, и ошибка второго рода р(а)=1 — 11т(а) при а т ао в пределе равна 1 — а. Поэтому по критерию х~С1 мы можем лишь с малой ошибкой а отвергнуть гипотезу Но. В случае х ~ С1 мы пе имеем больших осно. наний утверждать только на основе выборки (1), что а = ао, а не а » ао, так как при а, близких к ао, вероятность события х: С1 близка к единице.