XVII Математическая статистика (1081432), страница 45
Текст из файла (страница 45)
Теорема 8.1. Пусть Хы ..., Մ— независимые одинаково распределенные случайные величины с функцией распределения г (х;д) = г'(х — В), г Е Ко, д Е И. Тогда случайная величина 373 9. Ь Одиоаыборочная эадача о сдвиге 5(Во) имеет бииомиольное распределение с параметром рв = = 1 — ЦВо — В): Рв(5(до) = Ц = Саров(1 — рв)" ~, й = О, и. (9.7) м Так как случайные величины Хя, ..., Х„независимы, то независимы и случайные величины О(Х~ — Во), ..., и(Х„- Во) как функции независимых случайных величин (ХЧ1].
Кроме того, Рв(0(Х; — Во) = 0) = Рв(Х~ < Во) = Г(Оо,В) = Г(Во — В), Р(О(Х~ — Во) = 1 1 = 1 — Рв (О(Х~ — Во) = 01 = 1 — г (Во — В). Таким образом, 5(Во) есть сумма независимых случайных не- личин, каждая из которых имеет биномиальное распределение с параметром рв = 1 — Г(Во — В). Следовательно, 5(Во) имеет биномиальное распределение с тем же параметром рв [ХЧ11. ~ Следствие 9.1. При истинности статистической гипотезы Ио случайная величина 5(Во) имеет биномиальное распределение с параметром р= 1/2.
При этом квантили в и вя связаны равенством (9.8) в =и — в~ +1, 0<о<1, где и — объем случайной выборки Хя, ..., Х„из генеральной сонокупности Х. < При истинности статистической гипотезы Но имеем В = Во. Поэтому 1 1 р,, =1-Р'(В,-В,) =1- Р(О) =1-- = -. 2 2 Так как Са =С„" а, й=О,и, то длЯ любого й=О,и Рв(5(Во) =й)=С~( — ) (1 — -) =С„2 "=Са 2 "=Рв,(5(до) = и — Мс).
374 и НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ Таким образом, аа-1 аа 1 о=Рла(Я(до) <ла) = ~ Са2 "= ~ С,", ~2 "= а-аа+1 Са 2 =Раа(ь(до) ~ 111+ 1 ла)~ откуда следует (9.8). ~ь Итак, при истинности статистической гипотезы Но закон распределения случайной неличины 5(до) не зависит от функции распределения Г случайной величины Х. Поэтому для практического применения критерия знаков нужны только таблицы биномиального распределения. Именно в этом смысле критерий проверки Но, основанный на статистике 5(до), называется непарометрическим критперием.
Конечно же, при истинности альтернативной гипотезы, например Н1, распределение случайной величины 5(до) зависит и от Р, и от д — зто вытекает из равенства (9.7). В практических задачах условие одинаковой распределенности случайных величин Х1, ..., Х„может нарушаться. Например, если зти величины характеризуют измерения, которые проводились различными приборами и в различных условиях, то случайные величины л1 = Х1 — д, 1 = 1, и, могут иметь уже различные функции распределения г)(я), хотя по-прежнему изза отсутствия систематической ошибки измерения Р1(0) = 1/2, 1=1,и. Пример 9.1.
Рассмотрим задачу, которая в математической статистике известна как задача коркии наблюдений. Пусть для двумерных случайных векторов (У;, Я1), 1= 1, и, верно представление 9. Ь Одновынорочнав эадача о сдвиге где д — скалярный параметр, а е; — независимые одинаково распределенные случайные величины с нулевым математическим ожиданием и непрерывной функцией распределения Г.
Независимость случайных величин 1с и У;, 1= 1, и, не предполагается, более того, на практике они, как правило, зависимы. Требуется проверить гипотезу (9.2) против одной из альтернативных гипотез 19.3). Эта задача сводится к одновыборочной задаче о сдвиге с моделью 19.1), в которой Х; = У; — У;, 1 = 1, а. В большинстве приложений У;.
и У, — характеристики одного и того же объекта, полученные при различных условиях эксперимента. Например, У; и У; — артериальное давление у 1-го пациента до и после принятия лекарства соотнетственно, а предположение о неэффективности (бесполезности) лекарства равносильно гипотезе Ио. В = О. Если У; и Я; — упругость г-го образца стали при традиционном и модифицированном способах закаливания, то гипотеза Ио.' д = О равносильна предположению об одинаковых упругих свойствах стали при обоих способах обработки.
Критерий знаков можно применять и при различных законах распределения независимых случайных величин с;, 1= 1, в, так как при истинности статистической гипотезы Ио 1 1 1 —.Е(-9,9) =1 — К(-а) — 1 — К(О) — 1 и следствие 9.1 остается справедливым. Таблицы биномиального распределеняя" существуют только для небольших значений и. Если же а велико, то квантили аа статистики 51ао) можно вычислЯть, основывалсь на интегРальной теореме Муавра — Лапласа.
Из этой теоремы следует, что при больших и закон распределения случайной величины з19 ) — Мз10о) 1У~~Во) 'См.: Большев Л.Н., Смирнов Н.В. 376 9. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ хорошо аппроксимируется стандартным нормальным распределением. Это позволяет приближенно вычислять квантили г„ при истинности статистической гипотезы Не, а именно, так как распределение Я(Во) биномиально, МЯ(Вп) = п(1 — Г(до-В)), Х)Я(Во) = в(1 — Р(Во — В)) Г(Вп -В).
Поэтому при В = Вп имеем МЯ(Во) = и/2, Р 5(Во) = п/4, и, как следствие, и ~/й г †+ 2 2 ' где и — квантиль стандартного нормального распределения. Выше (см. 4) отмечалось, что при фиксированном объеме случайной выборки управлять вероятностями о и,8 ошибок первого и второго родов одновременно невозможно — при построении критерия с меньшей ошибкой первого рода растет ошибка второго рода и наоборот. Однако при и -+ оо, т.е. когда объем информации о распределении Г(г — В) растет, естественным требованием к критерию является безошибочное (в пределе) различение основной и, альтернативной гипотез.
Это приводит нас к следуюшему понятию. Определение 9.1. Статистический крмтиерий проверки гипотез называют сосзиолтпельмььм, если для любой вероятности о ошибки первого рода, вероятность,б ошибки второго рода при и-+ оо стремится к нулю. Таким образом, критерий знаков проверки гипотезы Но против альтернатив (9.3) будет состоятельным, если в случае В ~ Во для любого о, 0 < а < 1, Ря(5(Во) <л1 )-+1 при п-+со, где г — квантиль распределения статистики 5(Во) с уровнем значимости о, которая определяется формулой (9.6) при 7 = = 1 — е.
9.Ь Одноаылорочазз задача о сдвиге Теорема 9.2*. Критерий знаков для одновыборочной задачи о сдвиге является состоятельным. Перейдем к построению точечных оценок параметра д функции распределения г'(я — д). Предположим, что Нв отклонена, т.е. функция распределения случайной величины Х имеет вид г'(я — д), где д ф дв — неизвестный параметр. Как оценить д по данным случайной выборки Хе, ..., Х„из генеральной совокупности Х? В 1963 г. Ходжес и Леман"' предложили общий способ построения точечных и интервальных оценок д, основанный на критериях проверки гипотез о параметре д.
Точечная оценка д(Х„) параметра д строится аналогично оценкам максамалькоео правдоподобия. Введем обозначение А(Х„;д) = 5(д), подчеркивая, что 5(д) является функцией и параметра д, и случайной выборки Х„из генеральной совокупности Х. Функция Ь(Х„;д) при построении оценки параметра д будет играть роль функции правдоподобия.
Отметим, что для конкретной реализации х„случайной выборки Х„функция А(х„; д) = в(д) есть функция аргумента д. В качестве оценки параметра д возьмем статистику д(Х„), значение д которой для любой выборки я"„удовлетворяет условию А(У„;д) = щахА(х„;д). Так как случайная величина 5(д) распределена по бнномиальному закону, то для каждого д у функции ЦХ„; д) существует одно или два наиболее вероятных значения [ХМ). Поэтому в качестве значения оценки параметра д нужно взять такое число д, при котором функция Ця„;д) принимает наиболее вероятное значение.
Иэ теоремы 9.1 следует, что если д — истинное значение параметра, то случайная величина ЦХ„; д) имеет биномиальное распределение с параметром 1/2. Поэтому наиболее вероятное значение 1.(Х„;д) при четном в равно п/2, а при 'Смз Хеооааомсоереер Т. "Смз Ноодез 1.Ьч Лг аво ЬеЬзаооп Е.й.
378 и иепАРАметрические метОДы стАтистики нечетном и таких значений сразу двал (и — 1)/2 и (о+ 1)/2. Возьмем в качестве значения оценки О параметра В решение уравнения Е(х„;й) = л и — четное; о+1 — и — нечетное. 2 1 (9.9) Заметим, что Их„;в1 и-1 х(Н х(й) " х(Я х(э+Н " х(» — П хип 6 З(О) ='~ 1(Х10-В), (9.10) «ж1 где Х111, ..., Х1„1 — вариационный ряд случайной выборки Х„(представление 5(д) в виде (9.10) называют с итиаюи1ей формой стпатистини лионов). Отсюда следует, что для любой реализации х„случайной выборки Х„функция Цх„;о), рассматриваемая как функция от д при фиксированных хы ..., х„, является невозрастаюшей кусочно-постоянной ступенчатой функцией с „высотой ступеньки", равной единице.
На каждом полуинтервале (х10, хб+Н) функция Цх„;в) постоянна и равна и — 1, 1= 1,п — 1, при д < х01 ЦХ„;в) равна и, а при д ) хрб ЦХ„; д) равна нулю (рнс. 9.2). 379 П Ь Одиовыоорочиав эадача о сдвиге В качестве решения д уравнения (9.9) можно брать любое число в полуинтервале [х 2 „~, х2„11 при четном и и в полуинтервале [х(„1), х(„, )) — при нечетном.
Обычно в качестве д берут медиану реализацни случайной выборки х„, полагая 17 - р(а) + х(и )), и — четное; (9.11) и — нечетное. *(а21) ! Построенную таким образом оценку д(Х„) называют о21еммоб Ходжеса — Лемана параметра 9. Для построения интервальной оценки параметрами, входяшего в одновыборочную задачу о сдвиге с моделью (9.1), воспользуемся известными результатами (см.
3) и статистикой 5(д), определенной равенством (9.10). Согласно теореме 9.1, при истинности статистической гипотезы Но.. в = до закон распределения статистики ь(Х„;д) = = 5(о) не зависит от параметра д, и, как следствие (см. 3), при аб (0,1) РВ(яо/2 ~< е'(Хи~о) < В1-о/2) — Рео(в 7~ < А(Х„,д) < л, „(~) — 1 — о.
Как уже отмечалось, функция г'(х„;д) при возрастании д убывает скачками величиной 1 в точках вариационного ряда х1П, ..., х1„р Позтому для любого 1=0,п — 1 неравенство г'(х„;д) < и — 1 верно тогда и только тогда, когда д > хб+П. Аналогично для любого г = 1, и неравенство г (хо;д) > 1 верно тогда и только тогда, когда д < х1„+, 0. Следовательно, г(х„;д) <я2 72 тогдаитолькотогда, когдаВ>х1„+...,21, а и (х„; д) > л 72 тогДа и только тогДа, когДа д < х1„+~,,эР Так 380 9. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ как (см. следствие 9.1) и+ 1 — л ~з —— л1 „~з, то нижняя д(Х„) и верхняя д(Х„) границы доверительного интервала уровня значимости о для параметра д могут быть определены по формулам (рис. 9.3) (9.12) 6(Хс) Х(~ ~ф) 6(Хс) = Х(~+1-~~ ~я) или по формулам (9.13) Рис.
9.3 Пример 9.2. По выборке х„ 5,08; 3,51; 5,78; 4,88; 4,66; 3,94; 4,78; 4,99; 5,33; 5,10; 2,17; 5,32; 4,75; 4,09; 3,98; 3,95; 4,86; 4,89, "5,03; 4,36 объема и = 20 из генеральной совокупности Х проверим на уровне значимости о = 0,05 гипотезу Не. д = 6~> = 4 против альтернативной гипотезы Нз. .д ~ до. Для этого перейдем к 381 И Ь Одноаыборочнаа задача о сданге вариационному ряду вида (9.4), построенному для заданной выборки: -0,05; — 0,02; 0,09; 0,36; 0,86; 0,88; 0,89; 0,99; -1,83; — 0,49; -0,06; 0,66; 0,75; 0,78; 1,03; 1,08; 1,10; 1,32; 1,33; 1,78.