М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 11
Текст из файла (страница 11)
Лен и а 1. Пусть Уь 1=1, ..., и, независимы, Ф(0, 1)-распределены, С= (сц, 1, 1=1, ..., и) — ортогональная нХп-матрица: и Хс~'си=0 нри!чьй, ~~ с» ==1. Положил! А. 1/ что доказывает первое утверждение леммы 1. Равенство (б) зь..- текает из (8), (9). ° Выберем в условиях леммы 1 ортогональную пхп-матрицу С=-(!,!) так, чтобы с„!=!/гй, 1=1, ..., и. Значения си прп /чьп нам не важны, лишь бы матрица С была ортогональной (иапри. мер, легко проверить, что годятся с„в форме с„= 1, У1(1+1).
1<1(п; с„;,= — 1/)/1(1:,«1); си;.=О. : + 1 с. / < п). Тогда ь ь ь Г= — '~ У,= — '2„, '~'У' =~~)',2,'-'. !! ~=! !=1 Г=! л /! ь в — ! ,~~ ()'! — У)'=-~ )'! — пУ'=Я Х!г — Х,,— — ~ 2,. Учитывая (3), (4) н определения у'„н 1, ! (см. $7), приходим к следующему утверждению. Лемма 2. Пусть Х!, 1 1, ..., и, независимы и /т'(р, от)-распределены. Тогда )~!! (Х вЂ” р)/о =-. = Т (Х, — р) и !Гпв л4 !=! ! независи!!и и распределены соответственно й/(О, 1) и Хт, ! а отно- шение Уй(Х вЂ” р)/5 имеет распределение 1, ! ° . Из леммы 2 получаем а-доверительный интервал для о'! (и — 1) 5х/х!-ьм (Ха-!) ~ оь'Ц, (и 1) 5 /хате (Хн-!) (10) где х (Ха !) — а-квантнль Х праспределения, и и- доверительный интервал для р: Х вЂ” х! ° (1„!) 5/)/й < р < Х вЂ” х,:! (1„!) 5/~п, (11) где х.,(1„!) — и-кванпсаь 1, !-распределения. Если в (1О) нли (1!) оставить лишь одно неравенство, то получим односторонние и/2 доверительные границы, верхние или нижние.
4. Сравнение дисперсии а двух выборках. Од«о нз па'!.«ых «рпложс««!1 !пь!ожс"!иой выше тсср««откос!ГГся «так «азы«асмо«за.',:!че о двух выборках. /(опустим, пме ются:!ве не!ьшю«мыс нормаль«ые иыборки: Х, Х„„..., Х„, /г=-1, 2. (12) Обозначим через и<, н о»-", й:-1, 2, средние и дьсперсии сд.в. (12) Во многих экспериментальных исследованиях возникает воирос о сравнении по результатам испытаний (12) значений о" и о<», р< и рь Это сравнение естественно проводить, опираясь иа соответствующие выборочные характеристики и» < з 1 чч 5,=- — э, (Х„,— Х,)».
и» вЂ” 1 (13) « Отношение У= 5 <'/5»» (14) Если здесь оставить лишь одно неравенство, <о получается односторонний а/2-доверительный интервал. Особенно часто в приложениях возникает вонрос, верно ли, что о<э=о<и т. е. «.= 1. Говорят в этом случае, что необходимо проверить гипотезу Н»=-(«.= !). На:<более широкая альтернатива к Н,, — это противоположное допущение.
что «.Ф1, однако значительный интерес иредставляют и тьк называемые односторонние альтернативы Е>1 илн «.(1 (случай «.(1 сводится к й>1 иере. меиоГ< местамн а<» и о»»1. Например, может быть известно. что точность некоторого усовершенствованного измерительного прибора или некоторой методики ио крайней мере ие хуже прежней и задача состоит в том, чтобы ио результатам наблюдений (12< ирннять или отклонить гипотезу «.=1 ироп<в альтернативы «.>1. Наличие доверительного интервала (14) наводит на мысль сформулировать следующий критерий: подставим в (14) й=1, и если результаты наблюдений х»о х„,...., хм„, 1=1, 2, (1б) ириво .ят к верному неравенству о/х<-ам~» ! а< <хм2 (!6) где л»-< <, к~ О= 3<!3 .
5» =- — ~ (л„.: — х<,1, ч» — < < выборочных дисперсий имеет распределение, зависящее лишь от отношения «.=о<»/о»», ио не от !»< и рь Такни образом, если речь идет о сравнении о<» и о,', а параметры р< и р» не представляют интереса и являются, как говорят, х<е<иаюн!и.ии пара»<етрасчи.
то переход к статистике У полностью устраняет влияние этих мешающих параметров Величина «я<У имеет в силу леммы 2 распределение Р„, «,, , откуда для отношения и неизвестных дисперсий можно напйсать а-доверительны«интервал У/х«з(Р, «,„) С««У/х~<з(Г,, <,, <). хь — дх,|, й 1,2, ! ъч яь (17) го считать гипотезу Х= 1 против двусторонней альтернативы йчь! верной; в противном случае гипотезу отвергнуть. Ь'ак мы уже не раз отмечали, статистические выводы о вероятностных моделях обладают принципиальной неопределенностью.
Так, указывая и-доверительный интервал (!4) для )., следует помнить, что утверждение (14) о границах, в которых лежит неизвестное Х, может оказаться верным прн одной реализации опыта (12) н неверным при другой. Увеличивая в (14) значение а, мы тем самым уменьшаем допуск для неизвестного Х, но эа это расплачиваемся уменьшением коэффициента доверия 1 — а к указываемым границам, т. е. уменьшаем долю верных заключений при многократном использовании данной процедуры.
Это замечание равным образом относится и к задаче проверки статистической гипотезы Х=1. Если предположить, что на самом деле гипотеза 3.=! верна, то тем не менее остается вероятность а, что выборочная точка (15) попадает за пределы области (15) и тем самым верная гипотеза будет отвергнута. Значение а называется уровнем значимости критерия. Обычно критерий задают не областью (18) принятия гипотезы, а дополнительной областью, которую называют критической' областью.
Для рассматриваемого критерия эта область получается объединением выборочных точек (15), удовлетворяющих одному из неравенств: о(х д или о>х| гз. (18) Совокупность критических множеств (18), зависящая от параметра а. собственно и определяет данный критерий. Иначе критерий (18) можно задать с помощью статистики критерия о= з1|/з|' и указания того, какие значения критерия приводят к отвержению гипотезы. Введенный критерий называют Р-крите р нем.
° 5. Задача сравнения средних р| и р,. В начале нашего века англичанин Госсет, работая на фирме, занимавшейся пивовареиием, столкнулся со следующей проблемой. Было необходимо сравнить теоретические средние р,. в некоторои числе Й~2 малых выборок. Затруднения заключалнсь в малости выборок, пбо в протпвпол| случае можно было рассчитывать пл приближенное равенство зРявоР и полагать х|/э, распреде;|еоиыми приближенно нормально со средними Гч и дисперсиями 1/п, — такая техника работы в те времена широко применялась. Госсст нашел точное распределение х/з„что совершило, по общеему прчэпапкю, и реворот в статистике.
Идея избавиться от мешая'ш;.; параметров в последующем привела Фишера к созданию дпсдерсиоииого анализа, простейшим |римером которог является изложенная выше методика сравнения дисперсий с помсшью Г-критерия. РассмотРим заДачУ сРавненна !»~ и Рт в ДвУх независимых нормальных выборках в предположении, что дисперсии одинаковые: оР=пет=от. Статистика Х» — Хт в таком случае имеет нормальное распределение со средним р» — р, и дисперсией о»9п~+ отт/пт= =пт(!!и» 91/пт) (см.
$7. п. 3). зависяшей от неизвестного о. Для оценивании и' можно было бы воспользоваться любой яз статистик 5»т. й=1, 2. Ясно, однако. что более точной будет оценка, используюшая всю выборку. Именно ввиду леммы 2 н свойств распределения дт (9 7, п. 4) величина ( (п,— 1) 5»т+ (пт — 1) 5тт) !от имеет Х„',+„, т-распределение и, следовательно, статистика 5в= ((и,— 1)5Р+ (пт — 1)5вв)((п»+пт — 2) (19) является несмещенной оценкой о', построенной по полной выборке, Вспоминая, что дисперсия у,',-распределения равна 2п, получаем, что Р5т= (п,+пт — 1)-'от, в то время как 05Р=(п,— 1)-'о'. Таким образом, отношение х, — те а )т1/их+ 1/ие где зв ((п» вЂ” 1)з,т+ (пт — 1) зтт)/(п»+пт-2).
Если альтернативой к Но служит р»>рь то в критическое множество зачисляются все выборочные точки (1б), для которых статистика 1 принимает значения, большие некоторого заданного: («и «тв» «»их «вы ...ю «ви 1) с) Выбор числа с определяет уровень значимости, нлн, как еще говоРЯт, Разлад кРитической области. Полагаа с=«(1„,+,, т), получаем одностороннюю критическую область размера и. При н»ио *' Условия контракта, по'которому Госсст работал с фирмоа по ппиовареиы. ие давали ем> свободы и бликаиии, н его внаменнтаи работа было оитбапкоиеиа под скромным псевдойпмом Гцидепи (21) 3 М в. ко»лов, А, В. Пиехоиоа («х — ле) 0 х рт) (20) 5»»къ» имеет распределение дч+и т.
Отсюда получаем а-доверительный интервал для разности средних (ср. (11)) их,— х~ — ~х,— хи<» . т.,.. их~~и,»и,, Обычным образом строятся односторонние доверительные границы. Статистика критерия Стьюдента'~ для проверки гипотезы Не=(р»=1ат) имеет вид альтернативе )г!м1М критическая область размера и получается объединением двух областей !>с! н !(сь Дпсперснонный, или с=критерий, (16) и (-критерий, нлн критерий Стьюдепта, (21) относят к числу так называемых критериее значимости (нх еще иначе называют критериями согласия).
Задача проверки гипотезы ставится в форме поиска функции от результатов наблюдений — статистики критерия, — которая служила бы подходящей мерой согласия наблюденных значений состатнстнчес. кой моделью. По идее в зависимости от задачи слишком большие плн слишком маленькие, илн н те и другие значения статнстики критерия должны рассматриваться как противоречащие нулевой гипотезе Не. В предположении, что гипотеза Не верна, этн значения могут быть наблюдены с вероятностью а — уровнем значимости нашего вывода. Итак, отвергая гипотезу Не, мы должны считаться с возможностью, что на самом деле гипотеза верна н тем самым сделан ошибочный вывод.
Значение а является вероятностью этой ошибки. Разумеется, есть н другая возможность ошибиться — принять гипотезу На, когда на самом деле она неверна. К этому вопросу мы вернемся в гл. 1Ч. 6. Пример (6!. В следующей таблице приведены результаты двух опытов над мухами. Мухи полвергалнсь действию яда в течение 30 с в первом опыте н 60 с — во втором. Измерялось время от момента соприкосновения мухи с ядом до момента, называемого временем реакции, когда вызываемый ядом паралич распространится настолько, что муха уже не может стоять н падает.