4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 30
Текст из файла (страница 30)
выборка Х=(Х» ..., Х„), так как прн этом всегда можно упорядочить элементы выборки, построив соответствшоогий варна- цнонный ряд, В этом случае рангом 1-го наблюдения (случайной величины ХВ является номер места /7» которое занимает Хг н вариацнонпом ряду Ха, » Х е, ...= Х,„,. Теория ранговых нрнтериев является важной и хорошо разработанной частью математической статистики, она достаточно полно изло- жена в (4). В дальнейшем будут рассь1отрены примеры рапговых крнтернса. Одним иэ таких критериев в задаче проверки гипотезы однорбдностн являетсн критерий Вилкоксоиа.
Рассмотрим, как и з предыдущем случае, объелнненную выборку (Х» ... Х„, Ут, „,, Ум) и постРоим ее паРиацнонный Ред, ПУсть /7«, ..., /7„— Ранги величин Х„..., Х„соответственно в Т = /(т+... +/(и. Таким образом, Т-сумма номеров мест, которые занимэнот в общем варнацяоявом ряду эле- 12В ыенты первой выборки. Кригернй, основанный на ранговой статистике Т.
н есть крвгервй Вилкоксона. Он был впервые предложен Внлкоксовом (!945 г ) для выборок одннакоеего объема и распространен на случай выборок произвольных объемов Манном и Уитни (1947 г.). ( 1 при Х.» Ую Введеы случайные ееличнны Л, = н положим ( 0 в противном случае (/=(/(а, т)= Х; ~Р 2„,, г=!«=! (3.27) так что (/ — общее число тех случаев, когда элементы выборки Х предшествуют в обшеи варвационвом ряду элементам выборки У.
Можно показать, что статистики Т н 6' связаны линейным соотношением Т-1-В=игл+п(л -1-1)/2, поэтому критерий Вилкскссна эквивалентен критерню, оснонанному на статистике (/. Вычислим первые деа люмента статистики !/ прн любой гипотезе, задаваемой парой непрерывных функций распределеяия (рн Г,). Из (3.27) имеем «а Е(/=птЕХы=лтР (Х,» У )=лт ) гг(х) Йре (х)=лтл, (3.2В) В частности, для случая г«(х) е ре(х) (т. е. при нулевой гипотезе) а=1/2. Аналогично можно получить, что В(/=лт (а+(л — 1) Ь+(т — 1) с — (л-)-т — 1) ае), где Ь= 5 Ре,(х) дРе(х), г= ! (1 — Ра(х))збР,(х).
При нулевой гипотезе Ь =о= 1/3, поэтому В()=лт(п+ т+ 1)/12. Известно, что при л, т-«-оо ) /лт лт (и+ т+ 1)) Это предельное соотношение можно с хорошии приближением использовать уже прн л, т» 4, и+т 20. Оснонываясь на полученных результатах, можно построить и рассчитать критерий согласия проверки гипотезы //ь Кригнческан область У'та имеет различный вид в зависимости от целей, ддя которых с~роится критерий, Если хатят получить критерий, состоятельный против альтернатив, для которы:г величина а в (3.2В) удовлетворяет условию а » 1/2, то критическую область задают в аиде «УзамЂ вЂ (! » /„ !л, т)), где прь больших л н т можно положить /и(л, т)=- -+ й/ /„, Ф( — /а)=и лт - / лт(а+т+1) лт) лт(п+т+!) ) сг у'.-1~' — ~= 2 1 /а/г) Ф ( /и/з) = 2 . 2 Отметим. что в послелнем случае критерий ие отличает от нулевой гипотезы те альтеРнативы (Рт, гз), г! ==й Рэ, дла котоРых а= 1/2.
Рассмотренный в и. 1 критерий Смирнова также, по существу, является ранговым критерием (4; с. !!2). заказ дз !аз! Случай а)1/2 сводится н рассаютренному перестановкой р, и ре. Наконец, кРитеРий, состоательный пРотив альтеРнзтвв, опРеделаемых Условием ачь 1/2, задают двусторонней критической областью $3.5. Гипотеза независимости таблица г,г Сумма Ь, ~ Ь1 ~ ., ~ Ьь »ы »д. »д ». »м »м ад аа Сумма Пусть ри = Р ($д = аь $а = Ь~), ! = 1, ..., з, / — — 1, ..., А. Тогда гипотеза независимости означает, что существуют а+А постояи- В данном параграфе будут рассмотрены несколько вариантов проверки гипотезы независимости, описанной в примере З.З. В этом случае имеется выборка ((Х„У!), ...
..., (Х„, У„)) из двумерного распределения Ж(э=(ад, $ )) с неизвестной функцией распределения Рх(х„у), для которой требуется проверить гипотезу На. Рь(х, у) =Рп(х) Рп(у), где Рь, 1= 1, 2,— некоторые одномерные функции распределения. 1. Критерий независимости уд. Простой критерий согласия для гипотезы На можно построить, основываясь иа методике та. Как известно, эту' методику применяют для дискретных моделей с конечным числом исходов, поэтому условимся считать, что случайная величина $! принимает конечное число з некоторых значений, которые будем обозначать буквами а„..., а„а вторая компонента $д — А значений Ьд, ..., Ьь.
Если исходная модель имеет другую структуру, то предварительно группируют возможные значения случайных величин отдельно по первой н второй компонентам. В этом случае множество значений 5д разбивается иа з интервалов й!", ..., Гд~", множество значений Ц вЂ” иа А интервалов 3',"..... Жь", а само множество значений $=1эд, $а) — на !»'=зй прямоугольников Ж1ахЖ)!".
Обозначим через»ы число наблюдений пары (аи Ь,) (число ЭЛЕМЕНТОВ ВЫбОрКИ, ПрниадЛЕжащНХ ПряМОуГОЛЬНИКу Ж';а Х Жда', д ь если данные группируются), так что ~~, '~ч~ агу=и. Результаты ! = ! 1 =-. ! наблюдений удобно расположить в виде таблица сопряженности двух признаков (табл. 3.2). В приложениях $! и $а обычно означают два признака, по которым производится классификация результатов наблюдений. Рь Р., таких, что '3„'Рь — ~, "р„=! и р.
Р,р 1=! А!На) =31(п„р=(рдрп 1=1, ..., з, 1=1,, „А)). Таким образом, гипотеза На сводится к утверждению, что ча- стоты»;, (число их равно Ы =ай) распределены по полиномиаль- ному закону с вероятностями исходов, имеющими указанную сне цифическую структуру (вектор вероятностей исходов р опреде- ляется значениями с=в+А — 2 неизвестных параметров р, в р,, ° д Рд — ! Р.! " Р ь — !). Для проверки этой гипотезы, следовательно, можно применить описанную в п. 3 5 3.2 методику тд. Найдем оценки максималь- ного правдоподобия для определяющих рассматриваемую схему неизвестных параметров.
Если справедлива нулевая гипотеза, то функция правдоподобия имеет вид А(р) =сп(рар1)'н=сЦР 1 Пр» 1 1,/ 1 1 где множитечь с от неизвестных параметров не зависит Отсюда по методу неопределенных множителей Лагранжа получаем, что искомые оценки имеют вид рьс »1./и !'=1, ..., ж ". =». ~п, 7' =' 1, ..., А, Следовательно, статистика (3.30) г =! 1=-! ~1.1 ' ' и, по теореме 3.2, 2'(Хй)Н»)--д-Хд((з — 1) (А — 1)) при п — со, по- скольку число степеней свободы в предельном распределении ть равно 1»' — ! — г = вй — 1 — (в+ А — 2) = (з — 1) (А — 1) . Итак, при достаточно больших и можно использовать следую- щее правило проверки гипотезы: гипотезу Н, опиергают тседа и только тогда, когда вычисленное по фактическим данным значе- ние 1 статисдпики (3.30) удовлетворяет неравенству1~Хд 1 и „м.
Этот критерий имеет асимптотически (при и- оо) заданный уро- вень значимости сд и называется критерием независимости у'. Пример 3.9 [!О, с. 781!. В эксперименте каждый индивидуум классифнцировался по двум признакам: цвету глаз н цвету волос; при этом по первому признаку'$! индивидуум относился к одной из трех категорий ам са, а„ а по второму $д — к одной нз четы- рех категорий Ьд, ..., Ь». Соответствующие данные для и=6800 индивидуумов приведены в табл.
З.З. Здесь значение статистики (З.ЗО) равно 1= 1075,2. По табли- цам распределения да находим, что, например, 11ь.ддь! ь = 22,5. Таким образом, гипотезу о независимости этих двух признаков следует отклонить; вероятность ошибки при этом значительно меньше 0,001. 131 Таблица З.З >керт волос Пает глаз Сумма ь, ] ь, ~ ь, ~ ь, 1?68 807 189 47 281! 946 >387 746 53 3!32 Н5 438 288 16 857 и! аз аз Сумма 2829 2632 ! 223 1 Гб 6800 2. Критерий Спармена. На праитике для проверки гипотезы независимости часта используют ранговые критерии (см. п. Зг) предыдущего параграфа).
Наиболее известным нз них является критерий Спармена. который можно построить следующим образом. Обозначим через )>! ранг Х; среди элементов Хз, ..., Х„(т. е. номер места, занимаемого величиной Х! в вариацнонном Ряду Хи, == ...( Х,„,); аналогично, пусть 5; — ранг у! среди элементов Уг, ..., ун. Таким образом, исходная выборка порождает множество пар рангов (>?г, 5!)..., Ян, 5„).
Переправка эти пары а порядке возрастают нерпой компоненты, обазначйм пглученное множество пар через (1, Т!), ..., (и, Тл). Рассмотриы теперь ранговую статистику л ! ! л >т/а Р ~ (>7! )7) (5! 5) ~" ()[г П)в ~ (5! 5)т 1=! р=! представляющую сабой коэффнииенг корреляцни двух множеств рангов (Нр ", >?л) н (5», ..., 5„) (здесь Н и 5 — соответствующие арифметические средине). Но (йт, ..., )?и) и (5,, ..., 5„) — некоторые перестановки множества (1, ..., л), поэтому — 1 'кт . и+1 >>=5= — у !=в л а~> 2 л л и ,~ [>71-йз= ~~~', (5>-5»э=,У, '"- — "( 2 ) = р=! г= — ! с=! Отсюда л г=! л ! ! (ЗЗ!) р= > — 6 'т' (>7- 5.)р= ! — У К вЂ” Тйз.