Шеффе Г. - Дисперсионный анализ (1185347), страница 8
Текст из файла (страница 8)
Для обычных Р-критериев нужны только верхние а-пределы (для малых значений а), но для некоторых двусторонних доверительных интервалов (например, в гл. 8) нужны также нижние а-пределы. Нижний а-предел величины Р„,, обозначим Р! , „ „. Тогда из определения Р„, „ следует (заметьте, что числа степеней свободы переставлеиы), что Р!-а! ав т, = Га! »в тТ . Значения )(2, „и 1„, можно получить из таблицы Р, „„с по! мощью соотношений)(з,=тР „, 1,„,=(Р.
! .)2. (Заметьте, что верхний а-предел Р-распределеиия соответствует «двустороннему» а-пределу й) Функцию распределения Х'„ можно найти в «Биометрических таблицах для статистиков» (В!Огпе1гйа ТаЫез 1ог 81а1)з11- с!апз, таблица 7) под редакцией Е. С. Пирсона и Хартии (Е, 3. Реагзоп й Наг11еу, !954); дополнение функции распределения до единицы называется «вероятностным интегралом»„ Вероятностный интеграл Р,„м можно получить из «Таблиц неполной В-функции» К. Пирсона (К. Реагзоп, 1934). Р(Рт, т «Ра)=за,(йч! й Тя) ГДЕ ! 1 тыча хе= та+ ч~ро а 1„,(р,д) — обозначение К.
Пирсона для неполной В-функции, которую он табулировал е). Функция распределения 1, табулирована в «Биометрических таблицах для статистиков» (таблица 9) и называется «вероятностиым интегралом». Некоторые таблицы и диаграммы для нецентральных распределений описываются в 9 2.8. В конце следующей главы нам потребуется случайная величина да, и ее верхний са-предел д .,а, Дадим определение закона распределения 2)а,, Пусть случайные величины х!, ...
«) Она является обычно определяемой неполной В-фунннней, разделенной на В(р, д) = г~(р, д). 4 ЕЛ. СЛУЧАЙ ФУНКЦИЙ, ДОПУСКАЮШИХ ОЦЕНКУ 41 , хв независимы и нормально распределены с параметрами (!А„,а„'). Обозначим через !с размах (х,), т. е. !с = гаах х1 — ппп хФ. Пусть ээ является независимой средней квадратичной оценкой Ва с т степенями свободы. Таким образом, уэ'„/а'„=Х,' и не зависит от !т.
Случайную величину Я/э будем обозначать через р,ч и назовем стьюдентизированным размахом. Значения его верхнего а-предела для а = 0,01; 0,05 и О,!0 приведены в конце втой книги в кТаблице стьюдентизированного размаха». $,2.3. Доверительные эллипсоиды и доверительные интервалы для функций, допускающих оценку Доверительные множества являются обобщением аналогичного понятия доверительных интервалов. Допустим, что (у1,уь..., ун) — наблюдения, законы распределения которых полностью определяются неизвестными значениями параметров (9и...,йж), И Чта (ФГЬ...,Фуе) — ТОЧНО ОПрЕдЕЛяЕМЫЕ ЭТИМИ Па(Фяметрами функции (которые представляют особенный интерес в некоторых приложениях).
Обозначим три точки с координатами (Уь...,У„), (Оь...,9 ), (ФРь...,ФРФ) соответственно чеРез у; 9, Фр, так что точка Фр в д-мерном Фр-пространстве определяется значением 9. Предположим, что для каждого возмож. ного у из выборочного пространства в а-мерном ф-пространстве определена область*) !С(у). Тогда если область ес(у) покрыВает истинную точку Фр с вероятностью, большей некоторой заранее заданной постоянной ! — а и не зависящей от неизвестных истинных значений параметров 9, то область !С(у) называют доверительным множеством для Фр с доверительным коэффициентом 1 — а.
Частотный смысл этого определения такой: в. большом ряде различных последовательных применений доверительных множеств с доверительным коэффициентом ! — а число случаев, когда доверительное множество покрывает истинное значение Фр, подлежащее оценке, пропорционально 1 — а (причем в различных случаях могут меняться не только значения у, но и ти, п, 9 распределения и ф-фуикции). Доверительный интервал является частным случаем, когда д = 1, и тогда 1ч(у) — множество в одномерном Фр-пространстве. Через Фрь фь ..., Фр обозначим д допускающих оценку функций, В этом параграфе мы получим доверительное множество (вчем ".Ф) Ф.
Ф ° Ф'Ф Ф - ° Ф Ф ° ] Точечное множество. 42 гл. а. ошцнв постяовнин довнритнльных эллипсоидов эллипсоида *) (приложение 1П). Наиболее важным приложением доверительных эллипсоидов является, по-внднмому, 5-метод множественного сравнения ($3.4; $ 3.5). Можно допустить, что фь ..., тря линейно независимы; тогда если тв1я"н = С<я"л1р1я"'1, то строки матрицы С линейно независимы.
В противном случае можно найти пт (и ( д) линейно независимых арь так что остальные будут их линейными комбинациямн. Перенумеруем (ар;) так, чтобы (ар +ь....фе) были линейными комбинациями (с известными коэффициентами) от линейно независимых функций (фь..., ар ). Тогда каждая точка (трь...,ар ) однозначно определяет точку (арь...,аре), так что по доверительному множеству первой точки сразу строится доверительное множество для второй. Используем теперь формулы (2.!.!) и (2.1.4) $ 2.!. Ранг С = д, так как (фа) линейно независимы. По теореме й 2.1 случайная величина тр имеет распределение )Ч(тр,оаВ), где В оаГ4 = АА', (2.3.1) и независима от Уо= овха, Ниже мы покажем, что матрица В невырождена. Отсюда будет следовать (приложение Ч), что (т — ар) В (ар — ар) (2.3.2) является о')(т и независима от величины — имеющей распределение )(а,. Таким образом, мы докажем, что случайная величина (2.3.4) является Р,,„, с д и п — г ст.
св.; здесь за = Ж~/(и — г), т. е. да†средний квадрат ошибок. Для доказательства невырожденности В вычислим математическое ожидание от равенства ф = Ард тождественно по р имеем тр = АХ'!! = Ср. Таким образом, С = АХ' н д = г(С)= = г (АХ') ~ г(А1«иа1) ( д, отсюда г(А) = д. Применяя теорему 7 (приложение !1) к (2.3.1), получим г(В) = г(А), и следовательно, В«ию — невырожденная матрица. Искомое доверительное множество можно получить из (2.3.4). В условиях !2 вероятность неравенства Рть„, Р„, „„ т. е. (тьт тр) В ~ (тгь тр) к да~Роя я (2'3'5) а) Понятие доверительных эллиясоидов было введено Хотеллингом (Но(с!Пня, 1929, 1931). Обитая теория доверительных интервалов была обоснова.
На Нейманом (Меутап, 1937). $2Л. КРИТПРИП ДЛЯ ПРОВЕРКИ ГИПОТЕЗЫ И равна 1 — а. Неравенство (2.3.5) определяет в д-мерном зр-пространстве эллипсоид (см. приложение Н1) с центром в (ф„... ...,зрч). Вероятность того, что этот случайный эллипсоид покроет истинную точку параметров, равна 1 — а и не зависит от значений неизвестных параметров ((ь ..., рю ат. Можно получить доверительный интервал для одной допускающей оценку функции тр = с'р (с ~ 0), если повторить проведенные выше вычисления с д = 1. В результате получим одномерный эллипсоид, т. е.
интервал (зр ф) ~ ~з Ра' ь з-о (2.3.6) где ф = а'р является лгнк-оценкой тр и Ь = а'а. Оценку Э(зр) = = а'апз находим по формуле й. =а'аз~, Неравенство (2.3.6) запишем в виде — й ~~зр~~зр+(, а. (2.3.7) Вероятность того, что этот случайный интервал покроет неизвестное тр, равна ! — сз. Интервал (2.3.7) можно еще получить, исходя из того факта, что — имеет распределение (,, Ф вЂ” р (2.3.8) о Односторонние доверительные интервалы можно сразу полу. чить, используя (2.3.8) и соотношения Р(1„, ( („; „,) = 1 — ст илн Р((„, ~ ~— (о;,,) = 1 — а. Следует предостеречь читателя от многократного использования «(-интервалов» (2.3.7), вычисленных по одним и тем же данным (каждый, например, с 95з(з доверительным коэффициентом), и особенно от частого использования (2.3.7) для тех тр, которые были по этим данным подобраны, поскольку последние могут дать оценке ф значение, большее по сравнению с й., и тогда читатель не будет знать, какое «доверие» можно Ф приписать множеству своих заключений.
Более корректный метод для таких случаев будет изложен в Я 3.4 и 3.5. $2.4. Критерий для проверки гипотезы Н, построенный по доверительному эллипсонду В 0-предположениях $2.1 при помощи доверительного эллипсоида (2.3.5) строится критерий проверки гипотезы *) Н: ф,=фт= ... =фч=О, ь) Критерий для более общих гипотез зр~ = зр-а (( = 1, Ч), где зрн— зндниные постоянные, можно построить с помощью доверительного эллипсоидз (2.3,5), который может покрывать или не покрывать точку (зрм, зй,а).
В дисперснониом знзлнзе задачи пврзмстризовзны тзк, что нзнбо. лес интересны гипотезы, когдв все йм = О. 44 ГЛ. К ОБЩЕЕ ПОСТРОЕНИЕ ДОВЕРИТЕЛЬНЫХ ЭЛЛИПСОИДОВ где (ф>) — множество д линейно независимых, допускающих оценку функций; а именно гипотеза Н отвергается в том и только в том случае, когда доверительный эллипсоид не накроет точку (>(»,..., >(>«) = (О,..., 0), т. е. мы отбрасываем гипотезу Н тогда и только тогда, когда >(>'В '»>) г(з р,;д,п-.. (2.4.! ) Если гипотеза Н верна, то вероятность отвергнуть ее равна а и не зависит от значений любых параметров, которые не определяются точно гипотезой Н («неопределенные» параметры, например, о2).
Таким образом, уровень значимости этого критерия равен а. Только что полученный критерий зависит от допускающих оценку функций (ф>,...,ф«), используемых в определении Н. Нам нужно рассмотреть влияние на критерий различных множеств, допускающих оценку функций, используемых для определения одной и той же гипотезы Н. Пусть (>р;, ..., ф' ) — множество д' линейно независимых функций, допускающих оценку.
Обозначим через Н' гипотезы Н': ф',= ... =ф',=О. Гипотезы Н и Н' являются одной и той же гипотезой в том смысле, что Н верна тогда и только тогда, когда верна Н*. В (1.2.3) можно записать фы»» = С(1>Р"»ф'>«'"» = С'р. Тогда гипотезы Н и Н' совпадают, если мномгество (1, для которых С(1= 0, совпадает с множеством (), для которых С'р = О.
Покажем, что Н и Н* совпадают в том и только в том случае, когда существует невырожденная матрица Р>«к«> такая, что С' = ЭС (и тогда д* = д). Предположим сначала, что существует невырожденная матрица Рык«> такая, что С' = Х)С. Тогда каждое из следующих утверждений верно в том и только в том случае, когда верно одно из них (и, следовательно, Н и Н* совпадают): Н* верна ф*=О; С'р=О; ЭС(1=0; Ср=О; ф=О; Н верна.
Предположим теперь, что Н и Н* совпадают. Через (Р' обозначим множество векторов ((1), удовлетворяющих равносильным соотношениям С(1 = 0 или С"р = О, а через У, обозначим р-мерное пространство всех векторов (>. Записав С(1= 0 в виде р'С' = 0', мы увидим, что (Р' является множеством векторов в Ур, ортогональных столбцам С'.
Таким образом, если пространство У порождено столбцами С', то >Р' является ортогональным дополнением (см. конец приложения 1) У в У„а У вЂ” ортогональное дополнение >Р'. Аналогично, если пространство У' порождено столбцами С", то У" есть ортогональное дополнение )Р в Ур, Отсюда следует, что У и У' совпадают, т, е. столбцы С' и С" порождают одно и то же пространство. Из $2.5. ОТНОШЕНИЕ ПРАВДОПОДОБИЯ. СТАТИСТИКА 45 Линейной независимости д допускающих оценку функций следует линейная независимость и столбцов С', следовательно, они являются базисом К Также устанавливаем, что д* столбцов С» образуют базис пространства и" = (г. Отсюда и" = г).
Столбцы С» должны быть линейной комбинацией столбцов С', так как последние образуют базис 1г. Эти соотношения можно записать в матричной форме С" = С'Р' (здесь Р'=Рча"41) или С' = = РС. Из равенства г(С") = г(С) = д следует, что г(Р) = г) и, таким образом, матрица Р невырождена. Если одна и та же гипотеза Н определяется равенством ф = О или ф" = О, где тр = С() и тр' = С" р, то С' = РС и матрица Р невырождена. Построим для проверки гипотезы Н критерий с функциями тр' по аналогии с (2,4.1). Мы отвергаем гипотезу Н тогда и только тогда, когда тра В~~ар~ ) ЧзаР .