М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 36
Текст из файла (страница 36)
Такая таблица, рассчитанная Коэном, приведена в (9, с. 147— 1481. Проиллюстрируем изложенную методику иа примере (1) $11, где л=10; г=3; />/=7; />=0,3; х=1,70471; з,Р=0,003514; х<л>-— 1,778. Тогда у=э»>/(х<л> — х)'=0,554.
Из таблицы, приведенной в (9, с. !48), интерполяцией по 7 находим Л=0,512. Подставляя в (18), получаем >>=1,742; о=0,079. Всестороннее обсуждение этого примера содержится иа с. !50— 151 книги (9). 206 3. Метод Монте-Карло в моделн сдвига-масштаба. Рассмотрнм статнстнческую модель, задаваемую а-мерной плотностью внда /(х; р, о) =о™/(о->(х — р 1)), 1 = (1, ..., 1), (20) где /(х) /(х; О, 1) — некоторая нзвестная плотность, р, о— нензвестные параметры. Модечь (20) охватывает важный для приложений случай цензурнрованной выборки, когда наблюдению доступны порядковые статпстикн (х>о.ь», х„,+з>, ..., х„„>) ш(р>, ..., у„) яву н плотность наблюдений равна (ср.
пример (И) $16) /(у'И о) —— >т =- — ', Р((р>+р)/о)' (1 — Р((у„— р)/о))' Д о — >/((у,— р)/о), г>! г~! где г"(у) — ф.р. плотностн /(р). Это так называемый П тнп цензурнровання; модель (20) включает н 1 тнп цензурнровання, когда наблюдаются значения хнь попавшие в заранее известный интервал (1, з) (см. (9, $6.3)). Покажем, как, используя нскусственное моделирование выборкн с плотностью /(х), можно строить доверительные оценки для параметров р н о. Мы будем исходить нз о.м.п. 1>(х), о(х), хотя метод прнменнм к любым оценкам >>, о, для которых распределение сл.
в. о '(р(Х) — »), о 'о(Х), (21) где Х нмеет плотность распределения (20), не зависит от параметров» н о, Покажем, что совместное распределение сл.в. (21) не зависит от параметров н, о, когда р(х), о(х) — о. м, п. Фиксируем значения рв оа параметров р, о, н пусть Х<'> — случайная выборка с плотностью /(х; ц».
оо) Ъ'=оо >(Х>»> — ро1) — стандарт. ный случайный вектор с плотностью /(у; О, 1)=/(у). Очевидно, Ь(Х~'>», а)= =1.(оо'У+я» 1; р, о) о"/(о '(о»У+>ь> 1-р 1)) =оо "(о/о») "/((о/оа) '(У в (р †)/оо 1)) =' =о» "/-(У; (𠆻»)/а>ь о/о») (22) Пусть>>(Х'е>) и о(Хкч) — о. м.п. Как видно нз (22), точку макси« мума р(Х<ч>), о(Х<»>) левой части выражения (22) можно связать 207 с точкой максимума функции Е(т'; »', а'), которая равна»' »(У) а'=а(У). Именно а; (>>(Хм „0))- (у), а; а(ХР»=а(у) (23) Итак, совместное распределение сл.в.
(21) совпадает с распределением сл.в. >>(т'), а(т'), что и требовалось установить. Для приближенного численного расчета совместного распределения вероятностей Н(и, о) =У(>>(т') <и, а(т') <о) с помощью метода статистических испытаний необходимо иметь, во.первых, алгоритм вычисления функций»(х), а(х): Е(х; >>(х), а(х)) =п>ахЕ(х; », а) юа и, во-вторых, устройство, моделирующее последовательность независимых испытаний: у»,т»,...,у >, (24) с плотностью г а(у)=7(у; О, 1), 1=1, ..., М, По (24) строим последовательность У независимых испытаний, пар сл.
в.: (>>(Уо>), а(Уа>)), >=1, ..., У, (25) с ф. р. Н(и, о), откуда рассчитываем з.ф.р. Нл(и, о) и полагаем Н(и, о) юНл(и, о). В результате получаем, используя (23): Р„,,(х:о-'а(х) <и)=Н,(и) ~Н(и, +оо), Раж (х: а(х) (р(х) — 1>) < о) =Ра,е(х: (р(х) — р) а а(х) а< о) ~ Рк > (х: р (х) а (х)-~ < о) =- б (о), где б(о)= П Л(х, у)>(хду; Л(х, у) =д>Н(х, у)/дхду. ку 1(ю Таким образом, а-доверительные интервалы для а н» имеют вид а (х)/(х> „,> (Н,))-' < а ~ а (х)/(х„>т (Н,))-', (26) р(х) — а(х) х> ю> (О) <» < р(х) — а(х) «„и(>«), (27) где х~(Н>) и х,(С>) обозначают а-квантили соответствующих распределений.
Отметим, что знание совместного распределения оценок », а позволяет вычислять доверительные интервалы для любой параметрической функции >р(», а). В частности, предположим, что 208 речь идет о повторной (цензурнрованной) выборке с одномерной ф.р. г(о-'(х — и)), где Е(х) — нзвестная ф.р. Покажем, как стронтся довернтельный интервал для $~(ц, а) =г(а '(г — н)), где à — любое фнкснрованное.
Ванду монотонности функцип г достаточно постронть а.довернтельную границу для ~р1(ц, о! = = о-' (à — ц), так как а .лр~(н, а)~(Ьсч Г(а)~р(ц, п)(Г(Ь), Ри,ч(х: а(х)-'(( — ц(х)) <з) = ! . ~ — Н е в(х) — в о =Рзч )х: - ~з)=- о о (х) о й(х) =Рк|(х: о-'(à — Р)о(х) ' — р(х) о(х)-' ~з). (28) Положим Рэл(х: то(х)-' — п(х) о(х)-' < з) =-Я,(з). (29) По результатам моделирования (25) стронм э.ф.р. Я,.х(з), так что (~, (5)вн (~чл (5). С помощью ф.р. Я,(з) находятся довернтельные границы для ф~(п, о) =о '(à — 9) при любом Г.
Отступая от принятых обозна. чений, а квантнль распределения Я, обозначим через х„(т): Ркм (х: тп(х)-' — р (х) о(х)-' < х~ (т)) =- ! — а. (30) Из (29) вытекает, что функцня Я,(з) убывает по т и, следовательно, функция у=х~,(т) возрастает по т. Предположим для краткости, что Я,(з) непрерывна и строго монотонна по т, так ч~о функция у=х~,(т) имеет обратную т=х~ '„(у). Из соотношений (23) и (30) получаем ! — а = Р„л(х: о(х)-'(г — р (х)) ь. х~,„(п-'(г — р))) =- = Ра,а(х: х~ ',.
(о (х)-' (à — р (х))) ч,. о 1 (1 — Р)). Таням образом, а-довернтельная нижняя граннца для о-'(г — 9) равна к~ „(п(х)-'(à — п(х))), а для г (о-'(1 — Р)) она равна .г (х~ 'в(о(х)-'(1 — п(х)))). 209 Для краткостн рассмотрнм только верхнюю а-доверительную гра- ницу. Имеем, используя (23): -3 -в йу Ю й5 4 4Г б 17,88 48,48 68,64 105, 12 41,52 54,12 84,12 128,04 28,92 51,84 68,64 105,84 42,12 55,56 93,12 173,40 33,00 51,96 68,88 127,92 45,60 67.80 98,64 Рис. 12.Тонки (у!!ьЕ '((! — 0.5)!23)), г(у! 1 — ехр( — ехру) н прнлегаюшая к ннм прямая; у,о — логарифм чнс.
ла оборотов (в миллионах) до разрушения выборки из 23 шарнкопод. шипников На рнс. 12 нанесены точки (уа1, г"-1((1-0,8)/23)), уа1-— !пх1;1, 1-1, ..., 23, Е(у) =1 — ехр( — ехру) и проведена на глаз прямая х=ау+ 11, (3!) где 11=4,38; 0=0,43. Согласие точек (ую, Е-!(! — 0,8)/23) с линейной зависимостью можно считать удовлетворительным. Соответствующие оценки р и Т равны: р=ехр(р)= 79,8; у =а — в =2,3. Систему уравнений правдоподобия после некоторых преобразо. ваний можно записать в виде и л и/у — у х,"1,/~ хгт + у),=-0, 1 ! 1 1 1 ! л .() = ! Х хт/и ! ° ! Тесйпоше!Псз, !969, т. ! 1, с.
445 — 460; 1970, т. 12, с. 363 — 371. Литеры ие использовали ои!!саин!го наз!н гбшего подхода, а опирашюь на частные свойства распределения Вейбулла, 210 Проиллюстрируем эту методику на примере повторной выборки нз распределения Вейбулла с ф. р.: свт(х) =1 — ехр( — х/())т, х>0. ПрЕОбраЗОВаНИЕМ Уг=!ПХ1 ВЫбОрКа ХЬ ..., Хл ИЗ раСПрЕдЕЛЕиия Рв,т(х) переводится в выборку У1, ..., У, из распределения гс(а '(у — )з)), р=1п (1, а=у ', зс(у) =1 — ехр( — ехр у) (см. п. 1 $4). Томан, Бэйн, Антл'! рассчиталн таблицы для построения доверительных интервалов для различных и и нескольких вариантов цензурирования, Воспользуемся их примером для числовых данных по испытанию 2 до разрушения шарикоподшип- 7 ников.
Ниже приводятся резульу таты хп! испытаний в миллионах оборотов и 23 шарикоподшипников (взятых пми из работы Либлейна, Целена): Численное решение приводит к значениям 7=2,102; 11=81,99. Выпишем несколько значений квантплей х распределения сл.в. т/у= (о/о)-', рассчитанных Томаном и др. методом Монте-Карло» 0,02 О,О5 0,10 О,9О 0,95 0,798 0,805 0,752 0,759 0,843 0,848 1,583 1,504 22 24 1,320 1.ЗО» 1,418 1,392 Линейной интерполяцией по п находим а-доверительные гра- ницы для у лри а=-0,1: 1,50 = у/х!-а;» ~ь у < у/х~ » =- 2,62. Выпишем несколько значений квантнлей х распределения сл.в.
у!п(р/Р) = (»л — и)/о, рассчитанных Томаном н др.: 0,02 0.О5 О,10 0,90 0,95 0,98 — 0.509 — 0,483 — 0,404 — 0,384 — 0,314 — О, 299 О, 302 О,'288 0,398 О, 379 0,519 0,494 й 21. КРИТЕРИИ ОТНОШЕНИЯ ПРАВДОПОДОБИИ 1. Проверка статистических гипотез. В гл. 1, П нам неоднократно встречалась форма статистического вывода, назыввел»ая проееркой гипотез. Напомним некоторые примеры. Прн сравнении средних двух независимых нормальных выборок из ~У(»»ь о») н А'(рь о») рассматривалась гипотеза Нл. р» =р:.
В линейной статистической модели» по выборке нз У„(»1, о»/), где вектор»1 прннадлсьхит некоторому линейному надпространству У, проверялась гипотеза Ол. »1~У', где У' — некоторое заданное линейное лодпространство У. Наконед, когда имеется а-доверительный интервал для некоторой параметрической функции»р=»р(0) статистической модели (Х, 49. (Ро, 8 ев Щ), 211 Линейной интерполяцией ло и находим а-доверительные границы для (1 лри а=0,1: 68 04=-1)ехр( — х» „,»/у) < (1 <фехр( — х„,/у) =98 76. возникает возможность проверить гипотезу Но:<р=<ро, где <ро— любое фиксированное значение параметрической функции. Во всех этих примерах иггеется статистика Т(х), называемая статистикой критерия, такая, что область отвержения гипотезы принимает вид В'„=(х: Т(х) >с,) нлп йу,=(х: Т(х) <с'„, либо Т(х) >с" ).
Сама гипотеза Но могла быть представлена в форме Н.:Р=-(Р) (Р), (1) где (Р) — семейство распределений вероятностей рассматриваемой статистической модели, а (Р)о — некоторое его подмножество. Во всех встречавшихся нам задачах оказывалось, что вероятность Р(Ф',) =а, Ря(Р)о. (2) ие зависит от Р при условии справедливости гипотезы Но, т. е. для всех Рек(Р)о. Вообще говоря, для проверки одной и той же гипотезы Но можно использовать различные статистики критерия. В приложениях бывает иногда ясно, какие возможные отклонения от гипотезы Но необходимо проверить н, следователзпю, на какой статистике критерия остановить свой выбор. Но даже и в этом случае весьма интересно оценить свойства выбранного критерия по сравнению с другими. В общем случае нет необходимости непременно связывагь понятие критерия со статистикой.
Статистическим критерием для проверки гипотезы (!) назовем любую систему подмножеств (яг,) множества Ю, индексированную числами а из интервала (О, 1). Если при этом выполнено соотношение (2), то а называется размером критической области (Р„. Потребуем дополнительно, чтобы (Р„,<=йг<„, а (ао. Будем говорить, что данный критерий отвергает гилотезу Но на уровне значимости а, если результаг наблюдений х принадлежит критической области (Р„. Степень согласия данных с гипотезой удобно характеризовать значением а(х) 1п1(а: хек Я7,), так что х отвергается на уровне значимости а(х)+е и принимается на уровне а(х) — е, каково бы ни было 0<в<а(х).