М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 17
Текст из файла (страница 17)
4 и. в. Коэлоо, А. В. Поооооов о а-1 а! ! ° ! (37) б. 1(рным р: н фыал!ьное рвет<реда<<ение. Для моментов порядковых статистик стандартизованных сл.в. и<м в случае нормального распределения иет простых формул. Покажем, однако, что в этом случае выполняется условие (!9): Я!' 1', (39) п, следовательно, выборочное среднее является наилучшей порядковой линейной< несмещенной оценкой теоретического среднего р. Как доказано в $ 8, сл. в.
1 а ! э 1 %'ч и= — Яи, и в;= — ~(и,— и) П л ! ! ! ! независимы. В следующем параграфе будет показано (см. пример в п. 3 $ 12), что на самом деле О не зависит от вектора (и! — О,..., и, — О), а не только от его длины. Воспользовавшись этим, заметим, что порядковые статистики набора сл. в. и,— П,...,и.— П имеют вид и<ц — П,...,и<,! — 0 и как функции вектора (и! — П,..., и,— О) ие зависят от О.
В таком случае 0=Ма(и„,— а) =Маи„,— 11л, откуда л В 1 — 1 %'Ч 1 %"$ = миим, = — м~ип,ипп = — ~~ч;„ а Л Л что и дает (39). 7. Цензурнрованная выборка. В технике и особенно в бцомеднппискцх исследованиях тццйчной является ситуация, когда из ряда порядковых статистик Х<ц<Х!.<(...~Х<„! для цзмереиця доступна лишь часть. Мы уже встречались с примером подобного рода в $6, где рассматривалась задача одновременного испытания иа надежность л изделий до момента выхода некоторого заранее установленного числа л — г из ицх, а статические выводы делались по значениям Х<ц~ ~Х<! ~...~Х<„,!.
Другой пример возникает в случае, когда в ряду наблюдений Л'!.Ль...,Х„наибольшие, наименьшие цлц и те и пру<ни значения являются неиадежиымц и и расчет прииима<от лишь значения (40) х<о+ц<х„+и<... ч. хи, !. г,, г,) О. Если наблюдению доступен лишь ряд (40), где хотя бы одно из чисел г<, гэ нулевое, то говорят, что выборка цецзурцроваиа (11 тцп цснзу1<цровацня), Теория наилучшего несмещенного опенцзанцн через;шнейцые функции от цеизурировацных на<<л<оде- 98 ний (40) переносится автоматически на этот случай: чостаточно (Хв,+<и ..., Х<и о<) припять за новый вектор У.
Более того, именно в случае цензурпрованной выборки этот метод оказывается особенно полезным, так как для полной выборки хорошие оценки во многих случаях строятся проще друпийи методамп. Практическое значение теории линейных порядковых оценок зависит от знания средних и коварпаши1 порядковых статистик.
Явно<с аыраткеппн зля а и <',1, а тем более для <„<-< можно получить в исключительных случаях, поэтол<у важное значение приобретает расчет таблиц для МУ<о и сот(У<о, У«,) и кбэффипнентов а<ь пт наилучших оценок и-г, и-гь р= ~ анХкп о= ~' а„Х<0 (41) <=,+< < .,+< для наиболее часто используемых распределений. Большой набор таких таблиц содержится у Сархана и Гринберга 181. Пример 1 [9]. Ниже приведены значения х<о, хш=!ой<ох<п 1=1, 2, ..., 7, дней смерти н их логарифмов первых 7 пз л= 10 мышей после вакцинации культуры туберкулеза.
ли) 41 44 46 1,763 1,778 1,613 1,644 1.663 1,732 1,740 х<о 0<7 <йй йу 0,1207 0,5045 0,1089 0,0818 0,0962 0,0636 0,0244 и„ 0,0469 — 0,0006 0,6!07 — О, 1058 — О, 0502 — О, 1758 и: — О, 3252 99 4" На рпс. 11 нанесены точки (х<о, Ф-'((<-О,б)/10)), <=1, 2, ..., 7, н проведена иа глаз прямая х= о'у+ 14', 14' 1,747; о' 0,090. Согласие с нормальным законом логарифмов времен жизни можно считать удовлетворительным. Коэффициенты а«, аз< находим нз табл. 10.С.! Сархана и Гринберга: 0,7 фуу 7,5 67 (8 Рнс. 11, Логарифм дней смерти пер.
вык 7 из!О мышей после ваню<нанни культуры туберкулеза на нормальной бумаге Значения р и о находятся по формулам (41): р=1,746; а=0,091 и, как видно, близки к значениям и*, о*, полученным графически. 8. Упрощенные линейные оценки. Расчет матрицы ковариаций порядковых статистик (7!!, представляет значительные трудности. Позтому был предложен упрошенный метод, да!оший хорошие результаты по крайней мере для нормальной выборки. Положим в формулах (1О), (12) 9=1. В результате Ь= (1 1')(а а') — (1 а')з=л~~ а! — !~'а!) =-а у (а! — а)!. ! ! !:! Га' = 1' а а' — а' 1 а' ='у' а,' 1' — %' а а', х ! !.-! 1=! ч Г1'=1'я1' — а'1!'= ~ а!1' — па', с-! г оценки параметров Н и о принимают вид й Ф$ 1! р= — ~ а!!(1' — ъ а, Уа') = ~ ! — — ас!) У!, ) 2,а ! 1 ! ! !-! ' л л ! ~-е о.= — — (~ ' а т' 1' — я т' а'!! = ~ с!У! ! 1 ! ! (42) 0,375 О, 123 0,666 1,001 1,536 а! где сс=(а! — о)/Я (а! — а)'.
Формулы (42) применимы и к цеи! ! зурированным наблюдениям (40), если под т' понимать вектор соответствующих порядковых статистик (а= МТ, и — размерность вектора !(). П ример 1 (лродолхсение). По табл. 1О.В.1 Сархана и Гринберга находим значения а!=М(7<о, ! 1,...,5, аз= — ам ат= — аз! Рассчитываем 1л, о по формулам (42) с т'-(Хоь ..., Хо|): И=1,748; о=0,094. Результаты мало отличаются от наилучших несмещенных оценок: 1|=1,746; о=0,091. й НЬ МНОГОМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 1. Невырожденное нормальное распределение.
Нормальная сл. в. 1|| с плотностью распределения |р(х) е-лчя|У2п называется стандартной. Сл. в. Х| = оЦ+ 1л имеет плотность о-'|р((х — И)/о) общего нормального закона У(1л, о), Связь между О| и Х| послужит нам отправной точкой для введения многомерного нормального распределения. Определение 1.
Стандартным нормальным случайныл| вектором назовем вектор (1=((7ь (7м...,и,) из независимых стандартных нормальных компонент. Вектор 11 имеет математическое ожидание О, матрицу ковариаций /, его распределение обозначим У,(0, 1). Определение 2. Пусть а=(а|, аь...,а,) — произвольный числовой вектор, В = 1Ь||, 1,1=1,..., и] — невырожденная числовая матрица. Распределение случайного вектора Х= 0В+а, (1Х где 11 — стандартный нормальный вектор, назовем невырожденныл| п-мерным нормальным распределением. Лемма 1. Нормальный вектор Х, определенный формулой (1), имеет математическое ожидание а, матрицу ковариаций О= = В'В и плотность распределения вероятностей 1(х) = (У2п)" ~ йе1 Я1-итехр( — '/т(х — а) Я-'(х — а)').
(2) Доказательство. Следующая формула гив(х) =!йе1В! ' Го(хВ-') (3] преобразования плотности справедлива при любом распределении вектора О. Действительно, взяв А=(х:х|~аь..„х ~аь) и используя замену переменных хВ-'= 1), запишем ~ )йе1В(-' Ги(хВ ')йх,...йх„=~ ~~ц(н)йи, ... йи„= л лв-' = Р(11 еи АВ-|) = Р($)Век А), т е. ф. р. Р(11ВавА) вектора 1)В представлена как и-мерный ин- 101 тсграл по множеству А от правой части (3), которая, следова«ельно, является плотностью распределения вектора 0В. Воспользуемся формулой (3), заметна, что плотность распределения вектора 11 в (1) равна (ц(н)=)ц,(и,)...)с«(и«)=()~2п) — "ехр( — 1,'2 ни').
(4) В рсзуль«ате получаем, что плотность )ца(х) лается формулой (2) пон а=О. Переход к случаю ачьО не вызывает затруднений. С.чезстцце 1, Если матрица В ортогопз:пня: В'В=!«то вектор Х, определенный формулой (!) при а=О, имеет распределение У„(0, 1). Следствие 2. Функция ((х), заданная формулой (2) при любых а ц положительно определенной Я, является плотностью некоторого нормального вектора Х. Действительно, представив )',) в виде В'В, где  — невырожденная матрица (см. (4) $10), требуемый вектор Х можно определить по формуле (1) с данными В и а. ° Таким образом, можно дать эквивалентное определение н-мерного невырожденного нормального распределения как распределения с плотностью (2).
При этом а является вектором среднего, а положительно определенная матрица Я вЂ” матрицей ковариацпй этого распределения. Примем для него обозначение У„(а, Я) ° Отметим частный случай двумерного невырожденного нормального распределения, плотность которого записывают обычно в виде 1 1 (( х« — а,1« т(х„х«) = ехр ! — (( Хпо,о«т' à — ра 1 2(1 — р«) ! 1 о~ / — 2р ' « * *+( ' «)~~' его матрица ковариаций равна Лемм а 2. Если вектор Х имеет плотность (2) с положительно определенной 4«атрицей Я, то он представим в форме (1).
Доказательство. Т1редставив Я в виде В'В (см. (4) $10) и положив 1) = (Х вЂ” а)В-', найдем по формуле (3) /ц(н) =()х — )в ~ (н) = )де! В-' ! ~ (х-, (нВ) = = )де!В)Ц/2п)-")деЯ)-ц«ехр( — 1/2нВЯ-'В'н') = =(К2п) "ехр( — 1/2нц'), 102 так что вектор 0 имеет распределение У,(0, 1), а Х выражается через него по формуле (1). ° В следующей лемме, а также всюду, где это полезно, будем отмечать нижним индексом размерность вектора н квадратной матрнцы. Лемма 3.
Если Х,=(Хь...,Х,) имеет распределение Ж„(0„, О,) с невырожденной матрицей О„(д!», 1,1 1, ..., и] и»»=(Хь, Х;„...,Х; ),1<1»<1»«...1»<п, я» н, то вектор Ч» имеет распределение 1»!»(О», Я»), где Я» получается вычеркиванием из 9» строк и столбцов с нол»ерами, отличными от 1!,...,!». В частности, компоненть! Хь »=1,...,и, являются У(0, 0»!)-распре. деленными сл.
в. Доказательство. Не ограничивая общности, положим т'» = (Х!,..., Х»). Пусть Х„=(1,В, В=[Ь'ь...,Ь',], Ь;=(Ьп,...,Ь,!), 1=1,...,п, (5)' н (1.— Ь1„(0»ь 1„)-распределенный вектор. Прнведем систему векторов Ьь ..., Ь» к ортонормнрованной системе с!, ..., с„таким образом, что Ь!=)»(!с!+ .+д!»сь )»!!ч»0, 1 1, ..., и. (6) Матрица С= (с'»,...,с'»] является ортогональной, н потому вектор (7) г,=(1 С имеет распределение У,(0, 1,). Из (5), (6) н (7) получаем Х! = 1)„Ь' = 11„()»!»с» + ° ° . + Хне!) = 1»!»0»с' + ° ° . ...+)„и»с,'=дна,+ ...+)„г,, 1=1,2,..., . (8) Ограничивая индекс 1 в соотношениях (8) значеннямн от 1 до й, полччаем, что вектор т»=(Х!,...,Х») получен невырожденным :шпейным преобразованием из вектора (2!,...,2»), имеющего !т'»(О„, 1 )-распределение, и, следовательно, У» — нормальный вектор. Его среднее и матрица коварнацнй, очевидно, таковы, как это утверждается в лемме.
С л е д с т в и е. Пусть В = (Ьп, ! = 1,..., п, 1= 1,..., т] — и Х гпмзтрнца ранга пц !п<п, Я =В'В, (1,— У(0„1»)-распределенный вектор. Тогда вектор Х =У„В+а имеет т-мерное нормальное распределение Ф (а, 9 ) с невы- рожденной матр~цей коварнаций Я„. Действительно, достаточно допочнпть матрнцу В до невырожденной пХп-матрицы и восполь. зоьаться леммой 3. Л е и м а 4. Пусть вектор Х= (Хь..., Х„) имеет невырожденное нормальное распределение, !(=(Х»„..., Х»„,), Е=-(Х»ыь!, , Х! ),где (»ь »з,...,!») — некоторая перестановка из чисел 103 )!-1 ч <чло 0»»,~ 0 »ч» — ю» Я-! х и плотность вектора (Т, Е) распадается в произведение двух нормальных плотностей: У,»(0„„ Рт) и й!» »,(О„ , !те), что и доказывает утверждение.