Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 59
Текст из файла (страница 59)
Если гипотеза Н верна, то 0 — достаточная статистика, поэтому условное распределение з, при условии (З =- н, не зависит от о-. — Слил. перев. 920 Гт ХГ, Проверка гипотез с помощью стаглистических критериев является равномерно наиболее мощным' относительно всех альтернатив Н' с а> О. Пусть х„,..., х и уы..., д„— независимые, нормально распределенные случайные величины с одинаковыми неизвестными ДиспеРсиЯми и пУсть Сохх =... =Ьх = М и с Ут =... = = Я у„= и.
Тем же самым методом можно доказать, что среди всех критериев с точным уровнем значимости ф, предназначенных для проверки гипотезы р, = и, односторонний критерий 4 является равномерно наиболее мощным относительно всех альтернатив Н'с гх> ш Естественно поставить вопрос, не является ли критерий Стьюдента равномерно наиболее мощным также и среди всех критериев с уровнем значимости, не превосходящим р? К сожалению, ответ на зтот вопрос получается отрицательным'.
т Можно показать, что среди всех несмсщснных критериев с точным уровнем значимое~и 2ф, предназначенных для проверки сипотсзы а = О, двусторонний критерий г является несмещенным, равномерно наиболее мощным относительно всех альтернатив а~. О (см. К р а м е р Г., Математические методы статистики, ИЛ, М., ! 948, стр, 583). — Прим. перев. ' 1 е Ь шапа Е. 1. впб 3 Зе т и С., Мовх рожстЬИ тсвтв от сошрощее Ьуро$Ьевся 1, гтгш.
от Мать. 84в$., 19 (1948Ь 495. ГЛАВА ХП ПОРЯДКОВЫЕ КРИТЕРИИ Порядковыми критериями называют такие критерии, в которых используются не сами значения наблюденных величин, а лишь их упорядоченность, т. е. соотнсшения х ( у н л > у (между двумя измеренными величинами). Такие крнтерии не зависят от функций распределения случайных величин х н у, и поэтому их называют не зависящими от распределения или непараметрическими. Изучение теории порядковых критериев не требует больших предварительных познаний.
Будет предполагаться известным лишь содержание гл. 1 н 11. $ 61. Критерий знаков А. Основнои принцип Если 10 подопытных животных подвергались некоторому воздействию и во всех 10 случаях наблюдалссь повышение кровяного давления, то, руководствуясь лишь одним чутьем, можно утверждать, что такой результат не является случайным! Это произвольное заключение можно обосновать следующим образом. Если бы наблюдаемые изменения кровяного давления колебались чисто случайно, то с большой вероятностью примерно половина всех разностей состояла бы из положительных величин, а другая половина — из отрицательных.
Для каждого отдельного животного вероятность положительной разности — вероятность повышения кровяного давления — равнялась бы '/,. Следовательно, вероятность того, что все разности будут положительными, равнялась бы (1/2)'Р = 1/!024. Столь маловероятный исход люжно не принимать в расчет и поэтому следует заключить, что указанное выше утверждение соответствует действительности. Этот совсем простой вывод заключения можно превратить в точный порядковый критерий с произвольно заданным уровнем значимости р.
Пусть в результате наблюдений получены я разностей з) — у1 (г = 1, 2,..., п), из которых й положительны и п — й отрицательны. Возможность равенства з, = у, мы пока исключаем. Гипотеза ё, которую нужно проверить, утверждает, что при каждом г оба результата наблюдений х,. и у, — независимые, одинаково в1 в, л. аан дер Вардев ° ш62 Гя. ХИ. Порядковые критерии 322 распределенные случайные величины. Согласно этой гипотезе, вероятность того, что разность х, — у; окажется положительной, в точности равна вероятности, что эта разность будет отрицательной. Так как вероятность события х, = у, ранна нулю, то вероятности для положительных и отрицательных разностей равны '/,.
Это и является тем следствием гипотезы Н, которое нужно проверить с помощью критерия знаков. Можно также положить г, = х, — уд разности г,,..., г„ являются независимыми случайными величинами. Тогда подлежащая проверке гипотеза Н утверждает, что для каждого е вероятности событий г, > 0 и г; < 0 равны друг другу: Р(ге > 0) = Р(г, < 0). Критерий знаков можно использовать для проверки гипотезы (1) также и в том случае, когда г не являются разностями. Если вероятность события ге = 0 равна нулю, то из (1) следует, что (2) р(г, > 0) = --. Прн этом предположении вероятность того, что среди всех г„..., г„положительных величин окажется больше, чем т, равна (3) Если т — наименьшее число, для которого выражение (3) еще не превосходит )у, то критерий знаков можно сформулировать так: Гипотезу Н следует отвергнуть, коль скоро й (количество положительных ге) окажется больше, чем т.
Уровень значимости этого критерия, т. е. вероятностьотвергнуть гипотезу Н, когда она правильна, очевидно, не превосходит р'. Ведь критерий именно так и строился! Сформулированное правило представляет собой односторонний критерий знаков. Двусторонний критерий отвергает гнпогезу Н не только тогда, когда количество к (количество положительных г,) превышает границу т,, но также и тогда, когда количество п — к (количество отрицательных ге) превышает эту же границу. Если граница т осталась той жс самой, что и в одностороннем критерии, то уровень значимости двустороннего критерия вдвое больше уровня одностороннего критерия, следовательно, он не превосходит 2р. В 61. Критерий знаков 323 В таблице 9 указаны границь! т для п - 50. соответствующие обычным уровням значимости, а именно: Двусторонний критерии: 2)8 = 0,05; 0,02; 0,01; Односторонний критерии: р" = 0,025; 0,01; 0,005.
Б. СВЯЗИ Спрашивается, как нужно поступать в том свчуг!ае, ко~да имеются «связи». т. е. когда некоторые разности и! — у, = х! обращаются в нуль? Можно, например, половину связей счйтать положительными, а другую половину — отрицательными. Можно также для каждой связи бросать монету, и если вь!падет герб, то считать разность з! положительной. Однако лучше всего связи просто отброситв'. Пусть й — количество положительных разностей яг, 1 — количество отрицательных разностей и пусть и = й+ 1. Если к этим и разностям применить критерий значимости, то можно гарантировать, что уровень значимости пе превзойдет !У (в случае двустороннего критерия — 28).
Д о к а з а т е л ь с т в о. Предположим, что гипотеза (1) является правильной. Пусть .У вЂ” общее число наблюдений (Х ~ и) и пусть р, — вероятность того. что и разностей будут отличными от нуля. Сумма всех р„, разумеется, равна единице: ~ р„ = 1.
(4) о Если количество отличных от нуля разностей равно г», то условная вероятность события ?6) т (и» вЂ” граница, соответствующая числу и) не превышает !3. Обозначим эту условную вероятность Р„. Тогда (5) Безусловная вероятность отвергнуть гипотезу УХ, в сиду формулы полной вероятности, удовлетворяет неравенству Р = ~ р Р. - ~ р.,д = Р. (6) Теорема доказана. Пример 44.
В опытах Фрииа.!1иггли' яйии»!ухи-лрозофилы полаергались возлейсгвик1 мягкого и жесткого излучеиия !!8- !44 и 3! ° 10« электрои-вольт) Вз частот смсртиосчи в различиых группах яии, полвср- ' 11 е го е 1 г у 1« 3., А ььеогсгп оп «Ье Мип гся«авсп «!ев аго ргеяеп«, Ргос. !хоп. !ч<ч!. Аког!. весыоп ог во!спася, А 33, 322. в В г» «я - 1Ч г 8 811 !1., уегя!Моиегм!с Апа1уве йег В»га!г!епвсьао!яппи иоп Х!говор!1!1а.ииегп, ног!всьг, аи! Веко 0сь. «1, !!Бп18епя«гаысп, 83 !13661, 178. 2! Гл, Х11.
Порядковые критерии гавшихся возлействню одинаковых доз излучения, были сначала составлены средние, Затем, во всех случаях, вычислялись разности средних д длн мягкого и жесткого излучений. К разностям д применялся критерий Стью. денга. При этом д имели следующие знаки (лля яиц различного возраста) Возраст яиц (в часах): 1 + + 4 + — + + — (8 случаев) 1'(ч+ + -,'- — — — чс (7 случаев) 3 +++++ 4++++ (5 случаев) (5 случаен) (2 случая) (4 случая). бг/э+ + 7 +-';++ в.
симметрия рдсппеделения Распределение случайной величины г называется симметричным опгмосипгельно нуля, если при всех и имеет место равенство (э(г ~ и) = Р(г < — м), (7) Если распределение задается плотностью вероятности д(ы). то равенство (7) означает, что д(ы) является четной функцией д(м) = д( — и). (8) В возрастных группах от 1 до 3 час. критерий Стьюдента обнаружил превышение 5%-ной границы лишь в одном-единственном случае (а именно, у яиц возраста (а(4 часа); случаев же превышения 1%-ной границы вообще не оказалось. Напротив, в возрастных группах ат 4 до 7 час. этот критерий в 7 случаях из 1! выявил превышение 5%-ной границы и в 5 случаях— превышение ! %-ной границы. Следовательно, практически можно считать установленным (по крайней мере для яиц старшего возраста), что при равных дозак мягкое излучение имеет более сильные летальные свойства, чем жесткое излучение.
Применение критерия Стьюдента было связано с большим количеством вычислений и, кроме того, потребовало предположения нормальности распределения. Поэтому возникает вопрос, нельзя ли сделать вывод о свойствах излучения с помощью одних только знаков + и — 7 Если мы объединим возрастные группы от 4 до 7 час., то в !! случаях из ! 1 будем иметь знак +. В качестве двусторонних! %-ных границ табл. 9 указывает 1 и 10.
Так как 11 накопится вне этих границ, то с большой уверенностью можно утнерждатгч что летальные свойства мягкого излучения более эффективны, чем жесткого. Вероятность ошибочности этого вывода не превышает 0,01. В возрастнык группах от ! до 3 час. знак + наблюдался в !5 случаях нз 20. двусторонние 5чюпыс границы равны б и !4. Так как 15 находится вне этих границ, то эффективность мягкого излучения можно также считать установленной, степень уверенности здесь, конечно, меньше, чем в предыдущем случае. Таким образом, критерий знаков позволяет установить почти без вычислений, что мягкие лучи на яйца старшего поноления действуют, практически достоверно, сильнее, а на яйца младшего возраста, вероятно, сильнее, чем жесткие лучи. ззв В ВЕ.