Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 27
Текст из файла (страница 27)
Подробнее о критериях независимости см. (28, 47, 68). ПРИБЛИЖЕННЫЕ КРИТЕРИИ В СЛУЧАЕ БОЛЬШИХ ВЫБОРОК Если Л' велико, что в силу формул (22) н (26) критические области приближенных односторонних критериев задаются неравенствами мр) ) У(1 — 0,01(7)+ ( мР) ( Т(1 001Ч) у Ор (2У Ор) где ~) — заданный уровень значимости (в»~»'), Ч" (р) есть р-квантнль нормального распределения с параметрами (0,1) (см. таблицу 1.3).
Отсюда следует, что критическая область приближенного двустороннего критерия с уровнем значимости 2ч' задается неравенством т (1 0,01()) + л'рр (2 1грр) илн, что то 'ке самое, РР [ (2 У"Р[») 1 м"Р ) [" т(1 — 0,01(7)+ ' 1'. Еслй Л/ очень велико и ни одна из величин и', /»' — п, М и /у — ЛХ не слишком мала, то по- правкой 1/(2)/Ьр) можно пренебречь. В этом случае мы получаем хорошо известный т'-кри- терий с одной степенью свободы (см. [68[, гл. 30.5; [28[, $ 9 л 56). В предисловии к таблице 38 сборйнка [Т27) при построении прибл»пкенных критериев (с учетом поправки 1/(21/Вр) допущены две ошибки: а) для обоих односторонних критериев поправку рекомендуется брать со злаком «ми- нус», что противоречит определони»о процент- ных точек гипергеометрнческого распределения; б) в результате этой ошибки возникает прибли- женный двусторонний критерий с излишне рас- ширенной критической областью: 0'+" — р)' -- [~У(1 0,01~))» ПР Такое введение поправки противоречит и определению процелтных точек (34), и самой идее поправок Иэйтса (см.
[51)). Для построения приблйженного критерия можно также воспользоваться формулой (27] и вычислить верхние и нижние критические значения х„и х, для «вероятности» х, ааданной фор»«улой (28). Согласно обозначениям квантялей В-распределения, введенным при описании таблиц 3.4, а также в силу того, что [» — с приближенно подчиняется биномиальному распределению с параметрами (и', х), имеем х, = Х(0,01(/; [» — с, и' — [»+с+1), х, = 1 — Х (0,01~; ' — [» + с, р, — с + 1), где Х (Р; а, Ь) есть Р-квантиль В-распределения с параметрами а и Ь; величины и' и с определяются формулами (29) и (30). Если нарушается одно из неравенств х, ( х ( х„то соответствующая таблица 2 х 2 считается значимой.
Такой двусторонний критерий имеет уровень значимости 2()»/,. В том случае, когда 2п )~ Л' н [»/и ) ) (ЛХ вЂ” [»)/(Л' — и) (выполнения этих неравенств всегда можно добиться соответствующей перестановкой столбцов и строк таблицы 2 х 2), двусторонний критерий с уровнем значимости 2ч»6 строится с помощью одной величины х,: если х ( хы то таблица 2 Х 2 считается значимой, в противном случае — незначи мой. Указанный приближенный критерий требует больше вычислений, чем критерий, основанный на нормальном приближении, и его рекомендуется применять лишь тогда, когда малы некоторые из величин и, /у — п, ЛХ н Л вЂ” ЛХ, а са»ю 78— П р к м ".
р. В брпгаде, состоял!сй нз 25 человек («' = 25), 20 че<швек были подвергнуты дейстэню протнвогрполоэной сыворотки. я в теченке шести месяцев кз зтои < ру тпы заоололн гриппом лишь 6 человек (М = = 20 и ц = 14]. Остальные пятеро от вакцэвацяв отказалпсь, к среди янх наолюдалксь четыре случая заболевавпя тронном (за те же шесть месяцев).
Такпм образом, и — (< = 1 и и = 15. (сказыва<от лк этн результаты благотворчое действпе испытываемого сорта протввогрчпяознол сывороткнз [ля ответа на этот вопрос за<хишем результаты опыта в впдо таблццы 2 М 2: 14 1 6 4 15 10 20 5 н применял одностороньяй крнтернй с уровнем значимости () = 2,5»йр. 1. Согласно формулам (28) — (30) находим з = = 0,44, с = 10,23, и' = 4,07, поэтому р — с = 3,77 н и) + с — р + 1 = 1,3. По таблицам 3.4 находим хт = Х (0,025; 3,77, ! сз) < 0,40 < 0,41 = х.
Следоват~ лько, эффективность сывороткв пельзя счвтать доксзанноп. 2. Так как в дэпаом случае оо формулам (22) Мр = = '12, пр = 1 я, кроле того, 1<(0,975) = 1,960, то (р — М!0/г Ор = 2 ( Ч' (0,975) + 0,5 = 2,46, поэтому критерий, основанный яа нормальной аппрокснмацня, также не подтверждает эффептнэность испытываемого сорта сыворотки. 3. По таблице 5.6 для данного случаа находим, что 51, — р = 5 ( М вЂ” р = 6, следовательно, точный крнтернй в данном случае подтверя«дает выводы прнбляженныл крвтериев.. Гслп бы мы задались уровнем значэлсчости () = 5«4, та снова получялл бы тот же результат, так как в таблице 5.6 для такого уровня опять М, — )< = 5.
Нетрудно убедиться, что оба прпблнскенных крктерня в эхом случае приводят к заключенню: зффектлвность сывороткн нельзя считать доказанноп. (Попутно замотям, что прнмеяевпе первого критерия, основанного на В-прнблкженпн, ла эхот раз потребует более пцательной интерполяция ~абака 3.4). Полу ~опньз зыводы нельзя считать доказательством неэффеьпшяостэ сывороткя. По-вяднмому, более )у' велико.
Для определения х, и х, можно применять таблицы 3.4 и приближенные формулы, указанные в описании этих таблиц. Полезно также иметь в виду, что х, н хр представляют собой нижний и верхний доверительные пределы для вероятности х в последовательности независимых испытаний с параметрами (и', х). Поэтому значения х, и х, мол«ио определить интерполяцией таблглэпл 5.2, где в качестве )«следует припять И вЂ” с, а в качестве и — р взять величину и — И+ с.
В результате получим х, = и и х» =- П. правильным будет ааключенке: благоприятное влпяяяо испытываемого сорта Протквогрнппозной сыворотки не столь велико, чтобы быть обнаруженным лрн малом количестве экспериментов. «ОТРИЦАТЕЛЬНОЕ» ГИПЕРГЕО5(ЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ Если выборка (без возвращения) нз конечной совокупности объема Л" производится до тех пор, пока среди отобранных набепется ровно т элементов с призяаком У (т ( М), то объем выборки э будет подчиняться распределеншо, которое (по аналогйлл с отрицательным бпномиальным распределением *); см. ошлсание таблицы 5.2) естественно назвать «отрицательным» гнпергеометрнческим распределением: Р (У = и ! М, т) = П„, сэр „!Сй (т ( и ( Л( — ЛХ + т).
Функция «отрицательного» гипергеометрического распределения связана с функцией обычного гипергеометрического распределения (24) соотношением Р (э ( и ) М, т) = 1 — Р (и — 1 ( ЛХ, и). Поэтому для решення статистических задач, связанных с распределением вероятностей случайной величины ч, можно восполъзоваться таблицами и формулами для гипергеометрического распределения (с очевидными изменениями).
В частности, можно показать, что если М, ((); )«, и) и М, (()) )«, и) — нижний и верхний доверительные пределы для параметра ЛХ гипергеометрнческого распределения, определенные выше, то Мл (<',); т, у) и М, ((7; т — 1, ъ — 1) — нижний н верхний доверительные пределы для параметра М в «отрицательном» гипергеометрическом распределении и, значит, для их отыскания можно воспользоваться таблицей 5.6.
Иными словами, доверительные пределы вычисляются так же, как в случае обычного гнпергеометрического распределения, с той лишь разницей, что при определении ЛХ, значения т и ч заменяются на т — 1 и т — 1 соответственно. Этот вывод остается в силе и тогда, когда применяются приближенные критерии (прп больших значениях Лт).
Если учесть замечание в сноске, то можно убедиться, что доверительные пределы для ЛХ конструируются так же, как и доверительные пределы для р в случае отрицательного биномиального распределения. «) В описании таблицы 5.2 случайная велкчнна у представляет собой количество <неудач», тогда как здесь р — объем выборки, т. е.
сумма числа «неудач» л числа «успехов». У1. ТАБЛИЦЫ НЕПАРАМЕТРИЧЕСКОЙ СТАТИСТИКИ Н«МР (х) ен Р (х) ([ х [ ( со) Ч (Ч ( .(Чо Р(-"- =Ч' [Ч«Ч .,Ч„) =1/и (1 — 1,2,...,и). Критерии Колмогорова и Смирнова — 80— Теорию статистических выводов называют нспараметрической статистикой, если эти выводы не зависят от неизвестного теоретического распределения и, в частности, от его параметров. Подробнее о непараметрической статистике см. [37, 38, 47, 113, 136!, Первая часть этого раздела (таблицы 6.1— 6.5) посвлщена непараметрическим критериям, статистики которых представляют собой функционалы от разности функций эмпирического и тесрзтяческого распределений. Во второй части дан 1 таблицы критериев, основанных на более простых (в смысле затраты вычислительной работы) функционалах от функций эмпирического распределения; при этом «простота» обычно достигаетсл за счет некоторого снижения мощности по сравнению с мощностью соответствующих критериев из первой части.
Таблицы могут быть использованы для построения непараметрических оценок (интервальных и точечных). КРИТЕРИИ, ОСНОВАННЫЕ НА РАЗНОСТЯХ ФУНКЦИЙ В'.~1ПИРИЧЕСКОГО И ТЕОРЕТИЧЕСКОГО РАСПРЕДЕЛГ»НИИ Пусть $,, з„..., с„— взаимно независимые и одинаково непрерывно распределенные случайные величины, и пусть те же 8;, но расположенные в порядке возрастания их значений.
Эмпирическим называют распределение дискретной случайной величины $*, которая принимает значения Ч„Ч„..., Ч„ с одинаковыми вероятностями, равными 1/и: Функция эмпирического распределения выражается равенством Рч(х [Чи Ч»..., Ч») = 1'(ь* (х [Чи Ч«, . Чп] = О, если х(ЧВ т/и, если Ч (х ( Ч~ы, 1 (т ( и — 1, 1, если х) Ч„, (1) и при каждом действительном х является случайной величиной (функцией от Ч„ч„..., Ч„). В дальнейшем функцию эмпирического распределения мы будем обозначать Р„(х), не указывая явно зависимости от величин Ч~.
Так как МР„(х) =— Р (х), 0Р„(х) = — Р (х) [1 — Р (х)] 0 (и ), 1 где Р (х) — функция распределения исходных величин См (ее называют функцией теоретического распределения), то Р (х) — несмещенная н состоятельная оценка для Р (х) (см., например, [28, 68, 115, 137!). Если функция теоретического распределения достоверно неизвестна и лишь высказывается гипотеза, согласно которой этой функцией явллется некоторая заданная функция непрерывного распределения Р (х), не содержащая неизвестных параметров, то, обозначая такую гипотезу символом Н„»«ы условимся формально записывать ее в виде тождества: Точно так же пусть неравенствами, приведенными пил«е, выражаются гипотезы, конкурирующие с Н«.' Н» (»Р[Р(х)[): зпр ф[Р(х)](МР„(х) — Р(х))) О, 14«» Н«(««[Р(х)[): 1п[ ф[Р(х)](МР„(х) — Р(х)) (О, «а( Н,(ф[Р(х)]): зпр ф[Р(х)][МР„(т) — Р(х) [) О, 1М < где ф (Р) — заданная неотрицательная функция (ее часто называют весовой функцией).
В этом разделе мы рассмотрим некоторые наиболее употребительные критерии для проверки гипотезы Н». Предназначены для проверки гипотеаы Н„ при конкурирующей гипотезе Н, (1)(критерий Колмогорова)' и Н, (1) или Н, (1) (критерий Смирнова). Статистики критериев аадаются формулами Р„= зпр СУ„(х) — Р(х) С, 1х~< Р„= зир (г"п(х) — г" (х)), 1х|< Р,,= — [п1 (Уп(х) — У(х)), Н< где в левых частях знаки + и —, а также от- сутствие знака указывают соответствующую конкурирующую гипотезу. Для практических вычислений этих стати- стик полезны другие формулы, эквивалентные предыдущим: Р„= шах С вЂ” — Г(т[ )), 1<а<о т, Р„= шах СЕ(т[ ) —:), (2) 1<В<В~ .Р„=шах (Р„, Р„).