XVII Математическая статистика (1081432), страница 19
Текст из файла (страница 19)
Решение принимают следующим образом: 1) если выборка х„принадлежит критическому множеству И', то отвергают основную гипотезу Не и принимают альтернативную гипотезу Ню,' 2) если выборка я„не принадлежит критическому множеству И' (т.е. принадлежит дополнению тт' множества И' до выборочного пространства Х„), то отвергают альтернативную гипотезу Н1 и принимают основную гипотезу Не. При использовании любого критерия возможны ошибки следующих видов: 1) принять гипотезу Нм когда верна Не — оииюбка тьервоео родо; 161 43. Критерий Неймана — Пирсона 2) принять гипотезу Нв, когда верна Н1 — ошибка второго рода.
Вероятности совершения ошибок первого и второго рода обозначают а и ~3: а = Р(Ха Е И' ! Не)~ ~9 = Р(Х„Е И ~ Н1 ), где Р(А ~ Нй) — вероятность события А при условии, что справедлива гипотеза Ну, у' = О, 1. Указанные вероятности вычисляют с использованием функции плотности распределения случайной выборки Х„: Вероятность совершения ошибки первого рода а называют также уровнем значимости критерия. Величину 1 — ф, равную вероятности отвергнуть основную гипотезу Нв, когда она неверна, называют мошносепью кратер и,а.
4.3. Критерий Неймана — Пирсона При построении критерия для проверки статистических гипотез, как правило, исходят из необходимости максимизации его лнниности 1- р' (минимизации вероятности совершения ошибки второго родо) при фиксированном уровне значимости а кршперил (вероятности совершения ошибки первого рода). Для упрощения дальнейших рассуждений будем считать, что Մ— случайнаа выборка вбьема и из генеральной совокупности непрерывной случайной величины Х, плотность распределения нероятностей которой р(Ф;б) зависит от неизвестного 162 4. ПРОВЕРКА ГИПОТЕЗ.
ПАРАМЕТРИЧЕСКИЕ МОДЕЛИ параметра В, н рассмотрим две арестные гипотезы Но. В = Вв и н: в=в . Введем функцию случайной выборки Х„: 1,(х„;в,) 1(х„;в ) 1,(х„;в) = Пр(х;;в). вю! вр(гвв) ~~ Свтв где константу С, выбирают из условия Р(Р(Х.) > С,(ив) =а, которое обеспечивает заданное значение уровня значимости а и может быть записано в виде ер„...л„»се При этом вероятность ошибки второго рода не может быть уменьшена при данном значении вероятности ошибки первого рода а. рассмотрим примеры построения оптимального критерия Неймана — Пирсона при проверке простых гипотез относительно параметров основных, наиболее часто используемых распределений.
Сил Леман Э. Статистика ввв(Х„) представляет собой отношение функций правдоподобия при истинности альтернативной и основной гипотез соответственно. Ее называют отпношением правдоподобия. Для построения оптпимального' (нанболее мощного) при заданном уровне значимости а нритпери,я Неймана — Пирсона в критическое множество тт' включают те элементы У„выборочного пространства Х„случайной выборки Х„, для которых выполняется неравенство 164 а пРОВеРкА ГипОтез.
пАРАметрические мОдели Действительно, 1п ехр л ~~) х; ехр откуда следует, что Случайная величина Хл + ... + Х„имеет нормальное распределение с математическим ожиданием вп и дисперсией п~тз (см. 1.2). Поэтому условие (4.2) можно записать в виде (4.3) или С- про = пл-е. Таким образом, константа С, задающая критическую область в (4.1), определяется равенством С = про+ вл плГо. (4.4) При зтом вероятность совершения ошибки второго рода является минимально возможной прв данном значении о. 1бб 4.3.
Критерий Неймана — Парсона Пример 4.5. Если в условиях примера 4.4 неравенство ре < р1 заменить неравенством р1 < ро, то в этом случае критическое множество И~ задается неравенством ~я;<С, где константу С выбирают из условия и Р(~~ Х,<С~р=ро)=о. Таким образом, или, что то же самое, С- про = ва = ~И-а.
О,/о Из последнего равенства находим С = вре — кч о.ф~. Пример 4.6. Построение оптимального критерия Неймана — Пирсона в случае экспоненциального распределения с параметром Л проведем для двух простых гипотез Не: Л=л, и: л=л„ где Ле < Л1. В этом случае функция правдоподобия и ЦХН...,Х„;Л) =Л"ехр~-Л~~ Х;). Таким образом, и МР.) =( — „)"ехр(-СЛ -Лд~х;).
1=1 166 4. ПРОВЕРКА ГИПОТЕЗ. ПАРАМЕТРИЧЕСКИЕ МОДЕЛИ Отсюда видно, что критическое множество можно задать неравенством ~х;<С, 1ьм где константа С выбрана из условия обеспечения заданного уровня значимости а". Р(~) Х;<С~Л=Ло~=о. 1=1 Случайная величина 2Л(Х| + ... + Х„) при Л = Ло имеет Хз-распределение с 2п степенями свободы (см. Д.3.1). Исходя из зтого,получаем выражение для константы С: Х~ (2п) Ло% 2 где Х~(2п) — квантиль уровня о для Хз-распределения с 2п степенями свободы. При зтом вероятность совершения ошибки второго рода равна ,0 = Р(~~> Х; > С ~ Л = Л|~ = в=1 = 1 — Нз~(2Л1С) = 1 — Нзи(Х~(2п) — ), Л ~ Ле ' где Нз„(Ф) — функция распределения случайной величины, имеющей Хз-распределение с 2п степенями свободы.
Пример 4.7. Построение оптимального критерия Неймана — Пирсона для параметра биномиальиого распределения проведем для случая двух простых гипотез Но: р=ре, Н|: р=рм где р — вероятность „успеха" в одном испытании при реализации схемы независимых испытаний Бернулли, а ро и р1— 167 4.3. Критерий Неймана — Пирсона Ь(Х,...,Х„;р) = Ск~»"1р 1»"1(1 — р)" где К(Х„) = Х1+...+Մ— общее число „успехов" в серии из и испытаний.
Отношение правдоподобия определяется равен- ством ЦХм...,Х„;р~) гр,~~к1» )(1 — ро к(» ) ~р(Х„) = ЦХм-",Х;Ро) Ро 1-Р1 Значит, критическое множество для оптимального критерия Неймана — Пирсона в данном случае имеет вид К(х ) = ~х; ) С. (4.6) Константу С выбирают исходя из условия Р(Х1+...+Х„) С ~р=ро) =о. Распределение случайной величины К(Х„) при достаточно больших и в соответствии с известной интегральной теоремой Муавра — Лапласа имеет асимптотически нормальное распределение с математическим ожиданием р = пр и дисперсией п~ = пр(1 — р). Используя указанное распределение, выберем константу С в (4.6) из условия обеспечения заданного уровня значимости а, т.е.
из условия е(к[х)>с~>а 1 1 е( > 1=, (4>~ >а1 — в) ) заданные значения параметра, удовлетворяющие неравенству Ро < Р1. Пусть объем испытаний достаточно велик и Х. — результат 1-го испытания. Случайная величина Хй принимает значения 0 и 1 с вероятностями 1 — р и р соответственно. Функция правдоподобия в этом случае имеет вид 168 4.
ПРОВЕРКА ГИПОТЕЗ. ПАРАМЕТРИЧЕСКИЕ МОДЕЛИ откуда, используя квантиль ия стандартного нормального закона, получаем с=„,+„„,(,~р-~~. При этом вероятность ошибки второго рода равна я=е(к(х„><с~р=р,) е~ ю (1-я)~ и(ре — рд) + и1 ире(1 — ре) / р 0-вТ 4.4. Определение объема выборки Выше (см. 4.3) при построении апти.вольного критерия Нейиана — Пирсона с заданным уровнем значимости о предполагалось, что объем н случайной выборки Х„известен в фиксирован.
Но возможной является ситуация, когда нозникает необходимость в определении (заранее, до проведения наблюдений) такого объема и* случайной выборки, при котором может быть построен критерий для проверки двух простые гипотез Нв. В = Ве и Н1. .В = В| с заданными или меньшими значениями вероятностей о и,в совершения ошибок первого и второго рода соответственно. В рассматриваемой ситуации величину и' определяют как минимальное целое значение и, для которого система нера- венств < Р(~р(хм" Х ) > С ~ В = Во) < о, (4.9) р(~ (х„...,х„) <с„~в=в,) < в может быть выполнена при некотором значении константы С=С*. При этом соответствующий оптимальный критерий Неймана — Пирсона, обеспечивающий заданные значения о, ф 169 4.4.
Определение объема вмборни будет иметь крпшичесмое множество, определяемое неравенством ~о(хм...,х„) ) С„;. Пример 4.8. Определим объем выборки для случая нормальной модели. Для ситуации, рассмотренной в примере 4.4, нз выражений (4.3), (4Л) получаем, что система неравенств (4.9) в этом случае имеет вид 1 — Ф <а, Ф 4 <11. Следовательно, для обеспечения заданных значений о,,О вероятностей совершения ошибок первого и второго рода минимально необходимый объем и* выборки и соответствующую константу С' можно определить из системы уравнений 1 — Ф =о, Ф =,б.
Используя кваитили стандартного нормального распределения, запишем эти уравнения в виде С- ппо С вЂ” пп1 =в~ и, — — ив=-нъ и. (4.10) <т~~п о~й Исключая из уравнений константу С, находим необходимый объем выборки 2( — — )' ( ) о" (и1 +н1 л) (4.1Ц (р1- р')' Пусть, например, требуется проверить гипотезы Нв: р =де=3,5, Н1 . '4л = рю — — 3,8 при о = 0,8 и заданных значениях вероятностей а = 0,05, ~3 = 0,1. Применяя формулу (4.11) и учитывая, что нз = ноев — — 1,64, 170 4. ПРОВЕРКА ГИПОТЕЗ. ПАРАМЕТРИЧЕСКИЕ МОДЕЛИ п1 д = нее = 1,28, получаем необходимый в этом случае объем выборки и" = 61. Пример 4.9.
Определим объем выборки для схемы испытаний Бернулли. Для задачи проверки гипотез, рассмотренной в примере 4.7, вновь используем возможность аппроксимации биномиального распределении нормальным распределением с параметрами ,и = «р и пз = пр(1 — р). После этого, согласно (4.7), (4.8), приходим к системе уравнений для определения и и С': С - вре 1 ( С вЂ” пр1 l'мГ- )~ ' '„~.ю-м3 которал может быть представлена в следующем виде: С- про С вЂ” пр1 — н! -а1 =Яд= — п1 д. 4 Ь7г~в ~ Ь(~ ~ ) Решая зту систему, находим . (- 2 —.ъЯ~:вТ~- -аЯт:в7) и' — .
(4.12) (р1-р )' Равенство (4.12) (приближенно) определяет минимально необходимый объем выборки, позволяющий обеспечить заданные значения вероятностей совершения ошибок перного и второго рода при проверке простых гипотез вида Ие.р=ро, Н~: р=р1 в схеме Бернулли. Поскольку в (4.12) величина и' не обязательно целая, то на практике в качестве объема выборкв берут наименьшее целое число, большее нли равное и*.